「谷歌」的語言學分析兼筆記

※ 這是2006年五月中的文章,當時有點顧忌,所以一下就拿了下來。但從現在(12/13)的時間點來看,顧忌的理由已經消失,應該可以讓它重見天日了。

「谷歌」是 Google 前一陣子發表的漢名,根據 Google 的官方解釋,這是「象徵著耕耘和收穫的喜悅,也表達了一種勤懇求實的態度」,也是「豐收之歌」的意思,也有員工在官方解釋之外,將其解釋成「來自矽谷的歌聲」。從這個詞的創造過程來看,Google 的漢名也和許多外國商標的漢名一樣,採取了「取近音,求好義」的構詞法。因為簡化字中山谷的「谷」和稻榖的「穀」被簡化成同一個字,所以「谷歌」兩個字在通行簡化字的中國也有雙關的意思。不過在使用傳統正體字的台灣,這樣的雙關性就不見了。如果要依照官方「豐收之歌」的意思,在中國使用的「谷歌」應該要在台灣改成「穀歌」﹝Richyli 就是這麼做﹞,不過見諸媒體的還是「谷歌」。我認為這不是台灣媒體不求甚解,不去找出形義符合的字,真正的原因應該是在台灣這個語言社群中有一個機制,這個機制決定什麼漢字可以進來台灣,但也把「谷歌」原封不動地放進來了。

‧取近音,求好義

將外語詞彙翻譯成漢語時,習慣上最理想的翻譯是音義皆譯,例如「俱樂部(club)」、「幽浮(UFO)」。但是能符合音義皆譯的外來詞常常可遇不可求,所以在翻譯上並不多見。而在人名、商標等等專有名詞方面,因為構詞和意義都不嚴格,只要合音即可,所以譯者有極大的發揮空間,可以儘可能搭配出音近義佳的辭彙。這樣的翻譯行為廣泛見於商標的漢語翻譯,諸葛謾博士 (Dr. Ghil'ad Zuckermann) 稱這種構詞法為「音素語義相配(Phono-semantic matching)」。他常舉的例子是「威而鋼(Viagra)」,而我們在生活中也有很多相同的例子,在此不必列舉。但是依照「音素語義相配」的方法產生的新詞有時會出現「近音異字」的現象,這可以從貫時性的語料得到證實。這個月的新書《華盛頓在中國》提供了十九世紀漢語圈對「華盛頓 (George Washington 或 Washington D.C.)」的翻譯(p. 15),其中有「華盛頓」、「華興頓」、「洼申頓」、「瓦升頓」、「瓦興騰」、「瓦乘頓」、「瓦升屯」、「兀興騰」、「漥性吞」,淘汰到最後只剩「華盛頓」傳世。由於華盛頓在中國的形象甚佳,最後兩個看起來青面獠牙的譯名很明顯要被淘汰。最後「Washington」的譯名由「華盛頓」勝出,成為現在固定的譯名。在淘汰其他譯名的過程中,漢字的意義和文化聯想可能扮演了很重要的角色。這是個更複雜,也可能不能用更難從語言學角度分析的現象,所以略過不談。附帶一提,我自己愛用「洗滌鎮」一詞,例如洗滌鎮大學堂,不知道這是什麼的話請洽 Google

Google 在選擇他們的漢名時顯然也用到音素語義相配的構詞法,選了音近義佳的「谷歌/穀歌」作為他們在中國的商標﹝目前還沒出現在台灣的首頁,希望永遠別出現﹞。既然符合漢語翻譯外來詞的偏好,這應該是個可以被接受的譯名,不過這半個月來聽到不少反對的聲音,這又是為什麼呢?我認為「谷歌/穀歌」被解釋成「豐收之歌」,雖然在直接的意義上是個不錯的名字,但是在語義的聯想﹝不是 Lenovo﹞上卻和 Google 的高科技、創意形象不符。當我看到「谷歌/穀歌」時,首先想到的是和農業有關的事業,像是肥料、農機、穀物之類的公司,一點也不會想到可以在彈指間找到上萬筆資料的搜尋引擎。而普遍上網路給人的印象並不是山谷或農田──農田容易聯想到「筆耕」的出版業──而是一張錯縱複雜的網或是可以衝浪﹝surf,也是外來用語﹞的大海。而在工業社會中,農村擁有的電腦密度通常是比不上都市的,而中國農村的窮困又是眾所皆知的事實,網路鉅子取一個和農村有關的名字實在不搭調。因此「谷歌/穀歌」在語義聯想上的失敗,讓它只是個看起來不錯的名字,而不是真正適合 Google 的好名字。由此可知「音素語義相配」要相配的語義,不只是辭典上的意義,還必須與這個詞身處的文化情境相配才可以。

‧正體字、簡化字間的轉換是翻譯

從「谷歌/穀歌」這個案例中,還可以發現傳統的正體字以及二十世紀中發明的簡化字已經分化成兩個系統。雖然習慣上我們都稱正體字和簡化字之間的翻譯為「轉換」,把兩者當成漢字的不同型式,並且認為大部分的漢字都可以順利地在兩者之間轉換。不過在一些特殊的例子中,像是「谷歌」,它在簡化字的領域中有雙關的意義,因為「谷」可以分別對應到山谷和稻穀兩個意義。這個雙關可以視為一個符徵(signifier)關連到兩個符旨(signified),所以構成雙關的關鍵在共用的簡化字符徵「谷」,或許我們可以稱這個共用符徵為「結(node)」。不過在正體字的領域中,這個結並不存在,所以勢必要在「谷歌」和「穀歌」間做出一個選擇,但不管選哪一個,原本的雙關意義都會消失。這就像在翻譯外語中同音異義的雙關時,雙關語的語言樂趣一定會消失。例如將日語的「思いが重い」翻譯成其他語言時「思い」和「重い」兩個同音的雙關就會消失。(事實上,只寫出漢字而不讀出來,讓讀音成為不顯現的元素時,它的雙關意義就不見了;除非讀者有能力解讀出其中的語音資訊,簡單來說就是要認得這兩個單字。)

由以上的比較可知,簡化字和正體字之間的轉換其實是翻譯,翻譯中可能會失去的東西在轉換中也會發生。這也是翻譯時難以避免的遺憾。不過有趣的是,在「谷歌」鍵入台灣正體字領域的過程中,翻譯的機制似乎沒有發生作用,所以「谷歌」就原封不動地進來了。我覺得這不是台灣的媒體不求甚解的緣故,而是語言社群中的機制讓「谷歌」直接進來,而不是翻譯後才進來。

‧篩選進口漢字詞的機制:漢字海關

通常東亞使用漢字的語言社群會被總稱為「漢字文化圈」,但漢字文化圈並不是一個均質的整體,其中每一個語言社群使用的漢字都不盡相同,但是也有一部分的漢字是共用的。台灣是漢字文化圈的一部分,使用的是從中國繼承而來的傳統正體字,中國則是廣泛使用簡化字,但實務上傳統正體字也和簡化字並行於中國。近百年來輸出不少漢字新詞到漢語圈的日本也使用漢字,二次大戰後日本也有簡化漢字的作為,但還是有不少與其他漢字社群共用的漢字,這都構成了漢字文化圈中可以互相交流的可能性。不過,每個語言社群也各設「海關」控制外來漢字詞的輸入,這就是上面提到的那個機制,姑且暫時稱它為「漢字海關(Kanji Customs)」吧﹝其實這也是一個雙關語﹞。「谷歌」在通過台灣的漢字海關時沒遭到阻擋,就被直接放行了。而從「谷歌」和許多類似的例子中,我們可以來檢視台灣的漢字海關的運作規則,並且預測什麼樣的漢字外來詞會被直接放行,而什麼樣的要經過修改或翻譯後才能放行。

在進行分析之前,我必須先把討論的範圍限定在借詞(loanword)和專有名詞,還要引進「字庫」的概念以幫助分析。

首先,向漢字文化圈的其他語言社群借詞是非常常見的充實詞彙手段,台灣最常向日本和中國借用,這當然也是交流頻繁的結果。不過在此必須將新的借詞和舊的借詞分清楚。所謂「舊的借詞」指的是十九、二十世紀之交中國從日本借來的詞彙,例如經濟、國家、哲學等等。這些詞進入漢語的時間已經很久了,既使有些研究中依然視他們為外來語,但是他們都已經在漢語社群中當作普通詞彙流傳,應該沒有再將他們當成外來語的需要。而且戰後台灣繼承這些詞彙,並且保留其傳統正體字的寫法。反倒是在中國和日本,這些字多少經過簡化,已經不是當年創造時的模樣了。「新的借詞」指的則是最近新介紹進漢語的詞彙。有趣的是,這些新借詞有許多只在次文化圈中使用,外人不一定看得懂,但這不影響其作為分析對象的資格。以下是我在某聯合討論站收集到的語料,來源語很明顯皆為日語。該站是一個龐大的匿名討論群組,內容以日本動漫畫、遊戲,以及與這些東西有關的討論為主。下列借詞將以其書寫形式分類:

同形沿用:攻略、同人、通販、怨念、暴走、主役、強化人間、賞味期限、幼馴染、腐女子、十八禁、結末、痴漢、鬼畜

異體字改:特"攝"(特"撮")、"總"攻/受("総"攻め/受け)、應援團(応援団)、絕對領域(絶対領域)

去除非漢字成分:萌(萌え)、攻(攻め)、受(受け)、腹黑(腹黒い)

舊詞加新義(loanshift):公式、封印、百合、王道

﹝已上語料的解釋與討論請見〈詞彙註解與討論〉﹞

專有名詞的輸入必須先有在某社群外創造或存在的專有名詞,例如商標、人名,然後才輸入該接受社群。「谷歌」就是一個好例子,這是在台灣語言社群外創造的漢字商標,結果被原封不動地輸入台灣。使用到和製漢字的專有名詞則會在輸入時遇到一些麻煩,這和下面即將提到的「字庫」有關,將一併討論。

「字庫」這個概念來自電腦,意思是「可以使用的字的總和」。在中文電腦的發展史中,從早期的倚天中文、BIG5,到現在漸漸流行的 Unicode 都是字庫,而且容量越來越大。將這個概念借用到語言社群,他所指的就是一個語言社群中可以使用的漢字字庫。和電腦字庫不一樣的是這個字庫的範圍並不是固定的,而是受到許多因素影響的。影響字庫範圍的因素有:使用者的知識、通行的社群、輸出的媒介等等。使用者的知識決定一個漢字有沒有機會被使用者掌握,但是單單一個人會用並沒有用,所以通行的社群決定一個漢字能不能被眾人使用而在社群中流通。最後還要看輸出的媒介,理論上手寫是最自由的媒介,但是在網路時代電腦的字庫也是媒介的限制。例如在BIG5編碼的環境中,許多和製漢字和簡化字都無法顯現,此時這些無法顯現的字就不能納入字庫中了。再來,我們可以問,什麼樣的漢字才算被納入字庫呢?我認為一個被確實納入字庫的漢字,必須在該語言社群中有穩定、互相關連的形音義(GPS, Graphical-Phonological-Semantic information),如此才能被納入字庫中。依照這個標準,簡化字與和製漢字就無法納入台灣的漢字字庫,因為他們的「形」與音、義沒有穩定的關連,必須翻譯成傳統正體字才可以。這個翻譯就是一個本土化的過程,如果一個外來的漢字無法經過這一關,它就無法被納入該社群的字庫。而字庫的大小,理論上簡化字和正體字並用的中國應該是最大的,次大的是只使用正體字的台灣,其他非使用漢語的漢字文化圈社群則更小,例如日本1946年頒佈的「當用漢字」只有1850個。

介紹完討論範圍和字庫的概念後,接下來可以開始探討「漢字海關」的運作規則。從上面的語料中我們可以發現被漢字海關直接放行的是「同形沿用」的借詞,另外還有一些是經過部分改造後才放行的借詞。「谷歌」是被直接放行的新詞,可以被歸在「同形沿用」一類。同形沿用的詞彙被直接放行的原因,我想可以用「字庫」來解釋,規則為:

(1) 如果字庫中有相同的漢字,則直接放行。

這條規則可以解釋上述從日文及簡化字進口的詞不經修改就被寫出來,也可以解釋「舊詞加新義」的產生機制。不過這樣可以放行的字可能太多了。例如簡化字中的「稻谷」,照(1)來說應該可以原封不動地進入台灣,但是你我都不會容許吧。因此我們還要加上一個附加條件,把不小心放行的「稻谷」等字攔截下來:

(2) 如果本土語言社群中已經有語意相符的字詞,則使用本土字體。

這條規則可以有效攔截「稻谷」、「后來」等簡化字詞進入台灣。打個比方來說,這就像輸入一款電器時,海關以「國內已有相似產品」為由不准放行的感覺。而借詞和專有名詞本來就不存在於本土語言社群,也不可能有語意相符的字詞,所以用不到這一條規則。

用這個規則我們還可以解釋「異體字改」這一類借詞。因為異體字的定義是本土字庫中已有對應的字體,當然這個對應的意思就是在語意上也是相同的,所以依照(2)的規則,遇到借詞有異體字的時候,異體字應該改為本土字體,例如「総」要改成「總」。不過這裡發現兩個新問題:「怎麼樣才算異體字」,以及「異體字應不應該納入字庫」。關於第二個問題,我認為異體字不應該納入字庫。因為異體字出現時,他通常會標示文本的特殊風格,或是被視為語碼轉換,因此它的「外來性」是顯而易見的,所以不應該被納入本土字庫的一部分。至於第一個問題,要如何認定異體字以及他與本土字庫的對應,我覺得這是使用者集體的認定,而不一定要有什麼形狀或字源學上的條件。例如「特撮」的「撮」也存在於本土字庫,但日文的「撮影」已經被認定為華語「攝影」的同義異體字,所以要改用「特攝」。與外來漢字與本土字庫的對應有時也會有不一致的情況,例如東京地名「渋谷」在台灣常被翻成「澀谷」或是「涉谷」。雖然 prescriptively 「渋」是「澀」的異體字,但是後者也常出現在報章。﹝關於「渋」在本土字庫的對應,傅瑞德繼續貼最近有篇討論這個主題的文章。﹞

(這裡還有一個尚未解決的問題:分析的單位是「詞」還是「詞素」還是「字」?上面的討論中我沒有嚴格區分這兩個單位,不過這是遲早要解決的問題。)

解決異體字的問題之後,再來要解決連異體字都不是的狀況。這個狀況最常出現在和製漢字上,例如「辻」、「峠」等等。以「辻」為例,這個字在本土字庫中沒有對應的字,故不算異體字,其意義「十字路口」又不是在華語中可以用一個漢字表達的意義,很難通過漢字海關的檢查,所以他出現在台灣正體字領域的文本中時,還是具有強烈的外來性,也成為標示次文化社群的標記。

不過這種還是有不得不出現的時候,例如作家辻仁成在台灣的譯作,封面上的作者名就是直接沿用日文漢字。但這只是權宜之計,因為不把名字讀出來時還沒關係,一要讀出來的時候就有問題了,這時語言使用者必須找出一個辦法來解決。藝人辻希美在中文 Wikipedia 的條目中有一段記述描述了這個策略:

辻希美的姓氏「辻」(つじ,Tsuji)是以中文字為藍本創造出的日文漢字,因此並沒有對應的中文文字與正確的中文發音,但在日文裡此字代表的是「十字路口」的意思,可以意義接近的「十」來發音。
不過這個策略的普及性不明,在不使用這個策略的人口中,「辻」依然無法發音。之前介紹「字庫」概念時提過,被確實納入字庫的漢字,必須在該語言社群中有穩定、互相關連的形音義(GPS),既然「辻」的聲韻資訊不明,自然也沒辦法納入本土字庫,必須視為外語。所以我們有了處理這些漢字的第三條規則:

(3) 無法被上述兩條規則處理的漢字,視為外語,必要時沿用;語音資訊另外想辦法。

雖然被視為外語,外來的漢字在經過一段時間,如果能得到穩定的形音義,它就被本土化了。目前有沒有這樣的例子?有的,拜吉野家之賜,「丼」這個和製漢字已經被台灣的語言社群本土化了。

作為外來漢字詞的「谷歌」,在通過漢字海關時,因為它在本土字庫中沒有對應的同義詞,其字體也和本土字庫中既存的漢字相同,所以第一條規則便直接適用,輕鬆地把「谷歌」放進台灣正體字領域的文本中。而上面介紹的借詞,則依照三條規則一一篩選,再以適當的面目放進正體字的文本。這就是「漢字海關」的運作規則。

最後再重述一次三條規則:
(1) 如果字庫中有相同的漢字,則直接放行。
(2) 如果本土語言社群中已經有語意相符的字詞,則使用本土字體。
(3) 無法被上述兩條規則處理的漢字,視為外語,必要時沿用;語音資訊另外想辦法。



參考書目

Sinosphere. (2006, October 21). In Wikipedia, The Free Encyclopedia. Retrieved October 24, 2006, from http://en.wikipedia.org/w/index.php?title=Sinosphere&oldid=82797443
Zuckermann, G. (2003). Language contact and lexical enrichment in Israeli Hebrew. New York: Palgrave.
当用漢字. (2006, Oct. 3). Wikipedia, The Free Encyclopedia. Retrieved October 24, 2006 from http://ja.wikipedia.org/w/index.php?title=当用漢字&oldid=8041496.
張晶. (2006, Apr.13). 谷歌的誕生. Retrieved October 24, 2006, from http://googlechinablog.com/2006/04/blog-post_13.html
電子商務世界. (2006, Apr. 12). In. CNET科技資訊網. Retrieved October 24, 2006, from http://www.zdnet.com.cn/news/net/story/0,3800050307,39445144,00.htm
潘光哲. (2006). 華盛頓在中國──製作「國父」. 台北: 三民.

閱讀警告:
Draft only, feedback welcome. 這只是個人想法的草稿,個人筆記性質大於發表性質,因為不寫下來我一定會忘記。不過還是很歡迎任何 feedback,不然就不用放上來了。但不要做學術上的引用,引用這種未熟又離經叛道的想法是會被老師罵的。

分類: 關於語言的思考
FreeLeaf 發表於 ephemeris│2006年12月13日 19:50│[列印版]
Cite this article

本著作物依照創用 CC「姓名標示-非商業性-禁止改作 2.0 台灣」授權使用。
重製、散布、展示及演出本著作時請註明本文的授權條款,以便您的讀者再次使用。
詳細轉載規定。簡單授權‧輕鬆使用 ,更多創用CC的資訊請見:CC Taiwan

本站/本文網址可自由轉貼,自由連結,自由使用

Citing with MLA format:
FreeLeaf. "「谷歌」的語言學分析兼筆記." :: ephemeris ::. 13 2006年12月. <http://mt.leafportal.org/archives/001676.html>.

Citing with APA format:
FreeLeaf. (2006, 12). 「谷歌」的語言學分析兼筆記 Retrieved from http://mt.leafportal.org/archives/001676.html

TrackBack URL for this entry:
http://mt.leafportal.org/mt-tb.cgi/1320

Check In-bound Links with Talk Digger:
In-bound Links to "「谷歌」的語言學分析兼筆記"

以下是引用本文的記錄

Comments

寫得真讚,尤其是「正體字、簡化字間的轉換是翻譯」這句話。:p
不過如果要我來說這句話,我不會用正體字和簡化字二辭。而會改用比較複雜的「台灣華語」、「中國華語」、「香港華語」和「新加坡/馬來西亞華語」。

如果您還沒看到這篇:
FYI: http://absurdorama.blogspot.com/2006/04/blog-post.html

BTW,香港城市大學有《共時語料庫》,或許是能拿來進行分析的材料。

Posted by: b6s 於 2006年05月12日 20:55

因為這篇文章的重點是文字,用語言名稱(如「台灣華語」、「中國華語」)的話還會扯到字音和字義等語言中不可或缺的部分,所以為了避免討論失焦,我還是用正體字、簡化字,不然我的正式用法也是「台灣華語」、「中國華語」等等名稱。

共時語料庫啊......他的資料來源很 formal(「有代表性中文媒體」),適合喜歡 fromal 的人搞 formal 的研究,發展 formal 的理論。不過語言學搞到這麼 formal 的時候就很不好玩了,寫出來的東西像天書一樣,超無聊。其關照到的範圍也有侷限,因為資料大多來自社會上比較「正常」的部分,也有些是「正常過頭」的東西。

例如去年的祭典上有一個人拿很奇妙的語料來發表,我就想問他:「你真的這樣說話嗎?你的 speaker 是外國人嗎?說成這樣的話還能叫 Mandarin 嗎?」不過這樣嗆人太兇狠,還是算了。

關於語料庫,中研院也有一個平衡語料庫,不過也滿 formal 的。剛剛用「萌」搜尋兩個資料庫,得到的結果都是「萌生」的意思,沒有次文化中流行的意思。這真是個可預期的失望。

Posted by: FreeLeaf 於 2006年05月13日 03:20

其實我覺得說到文字,免不了就會扯到 surface pattern 以下的東西。否則現在仍然有很多人覺得「簡化」字明明就是「正體」的簡寫之類之類的。失焦,大概免不了吧?

說到語料的內容,大概是研究導向使然。語料庫常常被研究人員拿來當 golden standard,也不時聽到「某某語料裡的標記為什麼不一致」之類的抱怨。

如果要田野一點的話,嗯,我覺得 RSS 還算是個不錯的來源。雖然這田野不怎麼平衡,但是夠多也夠新。XD

Posted by: b6s 於 2006年05月13日 18:01

倶楽部(くらぶ)似乎是從日文取來的?

Posted by: kourge 於 2006年12月15日 12:51

路人逛到這裡,貢獻自己的翻譯小海關的例子。看到谷歌這個詞時並沒有太注意官方說法的豐饒之歌之意,反而聯想的是「在谷間迴盪的歌聲」,並用此來搭配上對於網路的想像,這可以算是翻譯名詞的一種appropriation吧(從簡體中文翻成繁體中文 XD)。

Posted by: ouf 於 2006年12月15日 19:49

To: kourge

俱樂部的確來自日文。

這種經過多層轉譯產生的詞很好玩,但我還沒想出一種系統性的方法來描述這種現象。

To: ouf

所以說意義是在讀者這側發生的。「言者(Google)無心,聽者有意」不就是這樣?

Posted by: FreeLeaf 於 2006年12月16日 14:27

我喜歡"谷歌"這詞,那是在一場李開復的演講而得知的。歌聲讓我聯想到是某種美妙的事物,而Google也讓我有同樣的感覺。

Posted by: 柚子 於 2007年01月13日 11:52

但我聽幾個朋友對google的中文稱呼都是孤狗
純音譯...

不知道官方知不知道孤狗的說法
搞不好可以把谷歌跟孤狗這兩個翻譯稍微中和一下

Posted by: hikawac 於 2007年04月11日 16:44