網站首頁 國學 語言 詩詞 名言警句 對聯 雜談
當前位置:學問齋 > 寓言 > 歷史故事

漢字的歷史故事

欄目: 歷史故事 / 發佈於: / 人氣:3.03W

漢字的特徵對中國文學產生了巨大影響。漢字對文學的影響涵蓋了作品的技術性和語言學,以及社會學和人生觀各個方面。對於漢字的歷史故事你瞭解嗎?下面是本站小編為大家準備的漢字的歷史故事,希望大家喜歡!

漢字的歷史故事

漢字的歷史故事之漢字簡史

中國最早的文字可追溯到公元前1220xx年左右的“甲骨文”(不過這是個現代詞彙)。些許零星分散的陶器標記和其他人造器皿上的符號可以追溯到三千到四千年前,不過它們構不成可以記錄一種句法清晰的語言的書寫體系,而且也沒有證據表明它們與後來中國文字有什麼關聯。這樣,基於現存記錄,中國的書寫體系首先出現於將近兩千年前,比美索不達米亞和埃及(二者都出現在公元前3020xx年左右,美索不達米亞明顯略先於埃及)要晚。這自然生髮了一個問題,即中國文字是否獨立產生?以下幾點證據會表明,頗有一些刺激性傳播發生着作用:一、漢字看起來是在一夜之間羽翼豐滿,沒有經歷過長期的逐漸演化過程,而在西南亞,文字產生中的這些演化有案可稽;二、漢字被證明是緊接着鍊銅術產生的,並和馬車的出現幾乎同時,而考古學家和科學史專家已經確認鍊銅術和馬車都源出於西亞;三、中國文字體系的特性(基本上是具有語義量詞和聽覺元素的語素音節,同時也包括象形成分和表意成分等等);四、許多學者多次獨立發現最早漢字的一些字符羣在視覺上和對應的西亞字符羣很相像(在中國用於計數和曆法的二十二個天干地支,可比之於在它之前的腓尼基人和烏幹特人呈現各種變體的二十二個字母[特別是其最短形式最明顯]),並且就我們所知的三千多年前它們的發音而言,它們似乎有共同的語音對應(這不必然需要黎凡特地區和中國之間有直接聯繫,而是某種間接傳播,或者刺激物最早產生於東西方之間的某地,同時向兩個方向傳播);五、大量個體漢字在形狀上、意思上以及有時甚至發音上很像其西亞對應字;六、已經高度發展的漢字在最初的幾百年間只服務於一種高度專門化的用途(王朝卜筮的記錄),而在接下來的幾百年中又用於另一個高度專門化的用途(貴族青銅鐘鼎上的銘文),這暗示着漢字為貴族或者神職人員及其後繼者這一小團體所壟斷,他們小心翼翼地護衞着自己書寫漢字的技能。以上沒有哪個單獨證據能夠充分質疑漢字的本土原生性,但是這些證據加在一起就足以説明,不能輕易打消外來影響的可能性。

不論它何時形成,我們今天所知的漢字原來只是用來記錄卜筮中的問與答,這就是上文中提到的甲骨文。甲骨文和商朝國君有密切的關係,起始於武丁(在位時期:約前1200—約前1181)及其長於卜筮和釋卜的親近顧問。這樣,中國最早的文字是王室專屬物,專門指派給史官卜人。然而在近東(西南亞和東北非),早期的文字有從經濟管理到文學宗教等各種用途。

不能説甲骨文是出於一種文學意圖,它們所觸及的僅是君王所感興趣諸主題的一小部分,但是有時也顯示出某些文學效果,或者預見了後來中國文學寫作的一些特質。下一時期的文字(金文)同樣也是如此。金文主要是在周朝,不過重要的是,漢字在這一階段已經伴隨着青銅器流佈到王公貴族一層。而且,現存最長的金文從甲骨文的十數個字擴展到將近五百字。

隨着文本長度的增加,漢字的數量也激增。甲骨文單字總共加起來接近4500個(包括約1000個異體字),其中僅有1000到1500個字有後世的對應文字。周朝的金文有差不多4000個單字,其中略超過2400個字是可辨的。由於證據過於支離破碎,所以很難確定戰國時代(前403—前221)絲帛、竹簡、青銅和石刻銘文等中使用的漢字數量,不過肯定是超過了5000個,包括各地使用的許多異體字。秦始皇在公元前三世紀後期統一六國,“書同文”政策清除了各地的異體字和重複字,不過不久漢字的數量又再次激增。此後各時代字典收錄的漢字個數如下:9353(100),11520(約227—239),12824(400),13734(500),22726(534),26911(753),31319(1066)。最近的字典收錄了超過六萬個漢字,有兩部字典甚至收錄了超過八萬漢字,而幾位北京大學學者甚至計劃編寫一部羅列超過十萬漢字的大字典。漢字的這種天文級數量對於表音文字使用者而言是不可思議的,因為他們字母表中的字母通常在20到40個之間。

實際上,漢字的數量是開放的,仍然在不斷增長。漢字使用者可以自由創制新字(許多人這樣做了,比如在取名時,或者科學家首次發現未知元素時)。某個漢字一經創制,它就永久在漢字表中獲得一席之地。這迥異於不增加字母總數而通過重新排列字母來創造新詞的表音文字(莎士比亞一個人創造了將近1700個新詞,比如barefaced, castigate, countless, critical, dwindle, excellent, fretful, frugal, gust, hint, hurry, leapfrog, lonely, majestic, monumental, obscene, pedant, radiance, submerged和summit)。也就是説,無論英語中加入多少新詞,字母的數目(26個)是不變的。當然,漢語也可以通過組合語素來增加詞彙量,而從來就是這麼做的。比如在官話中,天、花、粉和板四個字可以組合成為“天花”“天花粉”(栝樓根製成的一種中藥)“天花板”等等。實際上這是漢語中創造新詞的標準方式,但它沒有阻止新漢字的激增,這部分是因為每個時代都有全新語素產生,不過也是由於人們希望與眾不同,而與眾不同的方式之一就是創造新詞。

很明顯,人們只能記住這些天文級數量漢字中的很小一部分。若要基本能夠識文斷字,需要記住1000個漢字,20xx—3000個漢字則足以應付大多數環境,而達到“完全識讀”水平(包括讀報以及就各種主題進行書面交流)則需要約4000個漢字。掌握6000個漢字(中文處理軟件和常用案頭字典所提供的漢字字數)是非常了不起的,而單個人是否掌握1萬或者更多漢字則值得懷疑。大多數書寫都習慣性地僅限於使用幾千個漢字,這一現象不僅發生在今天,在中國文學的最高峯唐詩中亦如是。數萬漢字中的許多字在歷史上僅僅被使用過一兩次,它們的發音或意義(或者二者都)很難確定。然而,字體創建者必須要考慮到這些漢字,因為它們會不時出現在文本中。信息處理專家必須準備提供至少25000個漢字以敷日常之用,即便這些漢字中的絕大多數在大多數文本中的出現頻率小於十萬分之一,它們仍然不時出現在姓名、歷史事件、詞彙討論等中間。

漢字的數量雖然很龐大,但它明顯不等同於任何一種漢語中的全部詞彙,也更不等同於所有漢語中的全部詞彙。實際上現代標準漢語中的詞通常是雙音節的,即便是文言文中也經常使用雙音節或者多音節的詞或者術語(包括所謂連綿字、複合字或者複音字、擬聲詞、同義詞,以及其他種類的共同詞項)。於是,雖然漢語被廣泛認為是單音節的(由單音節詞構成),但是經過對實際使用情況的細心分析後,我們會發現並非如此。漢語中的絕大多數語素是單音節的,但是包括英語在內的絕大多數其他語言中的語素也以單音節為主,另外在漢語中(甚至在文言中)有大量多音節語素,比如“蝴蝶”“蜘蛛”“孑孓”“琵琶”“枇杷”“珊瑚”“麒麟”“鳳凰”“忐忑”“逶迤”和“尷尬”。這些詞中的一部分也許在古代是包含複輔音的單音節字,而語音演化以及隨之而來的音位配列導致了漢語中所有複輔音的分裂。複輔音被再分配在兩個相鄰音節中,這叫做“一分為二”(dimidiation),此種雙音節化過程似乎在晚近的上古漢語中相當常見。並且一些學者認為,複輔音的分裂和某些末尾輔音的消失導致了漢語中聲調作為一種補償而誕生。還有一些學者則提出,這些過程也導致了雙音節詞數目的激增,使得漢語在面臨日趨同音化時,能確保口語中有足夠的詞彙差異性,特別是在一些漢方言中的聲調日趨減少的時候(在普通話中,現在只剩下四聲:陰平、陽平、上聲和去聲,但在一些傳統分支如閩南語和粵語中,聲調要多得多)。

藏緬語中的對應詞研究,以及與印歐語系、南亞語系、南島語系和其他語系之間相互的古老藉詞比較,表明了漢語中原來是有複輔音的。除了上面提到的語音變動,漢字本身的音節特性也強化了複輔音的分裂,因為世界範圍內的音節文字都展現了一種在結構上單個輔音加元音的大趨勢。類似的語音約束,加之以上提到的對極致簡潔的追求,也導致了曾經一度存在於上古漢語中的詞形成分(前綴、後綴和屈折等等)的丟失。而在中古漢語,甚至在現代漢語中,這些丟失的詞形成分在上文提到的阿爾泰化和白話過程中,又得到了復原,區別在於語法成分不再加於詞根之上作為變化,而是作為加於語素音節開頭或末尾的單獨音節(書面中則為單獨漢字)。

漢字的歷史故事之漢字的特性

正如上文所提到,文字不等於語言,語言不等於文字。某種特定文字可以用來書寫多種不同而彼此無關的語言(比如英語、土耳其語、越南語和印尼語都用羅馬字來書寫),而某種特定語言也可以用不同文字來書寫(如維吾爾語根據歷史年代排序曾用過以下文字來書寫:盧恩文字[runes]、古回鶻文字[起源於阿拉米文字,經由粟特草體演變而來,是蒙文字和滿文字的祖先]、阿拉伯文字、西里爾文字、羅馬文字,然後又再是阿拉伯文字)。因此文字的分類與語言的分類是無關的,反之亦然。漢語的分類上面已經討論過了,本節主要對漢字進行分類。

對於該給漢字貼上什麼樣的標籤,仍舊未有定論。雖然在非專業文獻中,經常把漢字稱為“象形文字”,這是非常不正確的,因為只有一小部分漢字如山、日、馬、鳥、魚、龜,在創制之初是有意仿照事物樣子的。即使是這一小部分象形字,其現在的字形,對於不熟悉漢字的人來説,也完全辨認不出來它們的象形對象。同樣只有一小部分漢字——如“上”“下”和“中”等等——是表意的,而且只有接受過專門訓練的人才能辨識出它們的表意之處。所以將漢字稱為表意文字也不妥當。許多權威專家比較接受“意符文字”(logographic)這個提法,這意味着漢字的每個音節單位都等於一個詞,因而漢語是單音節的。對漢字的更準確描述應該是語素音節型(morphosyllabic),這指的是每一個漢字單位在長度上都是單音節,傳遞一個基本意思。這裏要重申的是,漢字的基本音節特性不能用來宣稱所有漢字只包含一個音節。學者們使用語法分析、心理語言學和其他方法結論性地表明,除了漢字,漢語使用者對於其他單詞的不同音節長度也有一種明白無誤的感覺。

誠然,漢字基本上是單音節的,但還是有些例外,因為確實存在一些具有多個音節的漢字(有些可追溯到唐朝,甚至更早)。在這種所謂“合文”的漢字中,有比如“茾”(菩薩)、“”(菩提)、“”(涅槃)、“”(某乙)、“”(營田[使])、“瓩”(千瓦)、“”(問題)、“邗”(幹部)、“”(社會主義)、“圕”(圖書館)(這些漢字當然也可以用多個漢字寫出來),有些合字被廣泛使用,甚至今天還能在標準字典中找到。在二十世紀,超過1000個這樣的多音節漢字被廣泛使用,這清楚地説明了漢語使用者有一種漢語並非完全單音節的天然的認知。這些多音節漢字多為代替許多常用詞彙,所以這也預示着簡化漢字的內心願望。

另一個從十世紀後半期一直持續到十九世紀末的相關現象,是反切的使用。這是一種受佛教啟發的注音方法,用兩個漢字合起來為另一個漢字注音。反切時,通常寫做“X Y反”,這表示X(反切上字)注聲母,Y(反切下字)注韻母和聲調。有時“X Y反”(三個字)經常寫做“XY”(一個字)。在這種情況中,兩個漢字就合成了一個漢字。這再次顯示了,中華帝國晚期的學者不僅能進行語音分析——這一分析具有發展成真正拼音的潛力,而且顯示了漢字體系並非毫無變通即註定是單音節以及單語素的,漢語更是如此。

實際上,在已知的最早漢字(甲骨文)中,兩個甚至三個音節寫成一個漢字的情況並不罕見,比如“乙祖”、“三萬”、“十五發”所對應的甲骨文字。周朝的金文中雙音節漢字不乏其例,如“小子”“小臣” “武王”和“文王”對應的金文。這些證據表明,在中國文字的最早階段中,仍然有清晰的認識,即文字(和明顯的詞彙單位)是可以有一個以上的音節的。然而到了秦漢時期,漢字的單音節化趨勢將有保留和傳承價值的文本中的雙音節字和多音節字幾乎剷除殆盡。不過詞彙單位可以是多音節的這一直覺還是保留着的,所以多音節漢字仍在不斷被創造出來,如“不要”“二十”“三十”和“四十”的對應字。但是由於忠實於漢字單音節限制的壓力太過強大,這些表達的合音和別的特定發音便孕育而生(分別是“甭”“廿”“卅”“卌”)。不過許多漢字雙音節和多音節特質是不可否認的。而且上面提到過,許多漢語語素不止包括一個音節,因此在漢字的基本單位同時傳遞語音與語義的意義上,我們最好認為漢字是語素語音型或語義語音型(而非簡單稱之為語素音節性),而漢字的長度並不必然是單音節的。

不管我們將漢字完全稱為意符型、語素音節型,還是語素語音型/語義語音型,大多數漢字(約85%,即形聲字)都由一個傳達語音的部分(聲旁)和一個傳達意義的部分(形旁)構成。不過聲旁和形旁都不會準確告訴讀者這個漢字的意思或者發音,而只是給出大略近似於該字的字義和字音。比如,讀者也許會碰到一個字,它的形旁是三點水。三點水意味着這個漢字極有可能(但不必然)與水或者液體有關,這樣我們會猜這個字也許意思是“浪”“濺”“淺”,等等。但是,僅僅從三點水來判斷,我們不可能確定這個字的確切含義,只能得出這個字與水及其引申義沾親帶故。帶三點水的漢字超過20xx個,詞義紛呈,從潔到汽、河、遊、漁、泡、消、汁、液、油、酒、溝、淌、瀉、沫、濕、滯、泥、淫、淚和澳,等等。僅僅辨識出一個漢字的形旁,在實際判斷其詞義的時候不一定會派上很大用場。同樣的,讀者可能會碰到一個漢字聲旁為“方”(其四聲代表的意思有很多,如方、妨、仿、訪、舫、放、芳、枋等),而它的形旁表示它和“門”有關。只有將聲旁和形旁連起來看,有經驗的讀者才能明白這個字讀fang的第二聲,它的意思是“房子,建築物”。這一詞素在文言文中是單獨出現的,不過在現代標準漢語中與名詞後綴或者一個同義字組成雙音節詞,比如“房子”、“房間”和“樓房”。另外,要確定某個漢字的意思,我們必須暫時忘記聲旁(如“方”)自身也可以作為形旁,例如在於、施、遊和旗等漢字中。在“旁”這個漢字中,“方”既是聲旁也是形旁。

另外,許多形聲字不止有一個讀音,這很難用語音衍生過程來簡單解釋。比如上面提到的“施”字,實際上有下述多種讀音:shī(施行),yí,yì,shǐ。在這種情況下(有兩個及以上讀音的漢字即“破音字”或“多音字”數以千計,其中最多的有十一種讀音),讀者必須在上下文中用直覺來判斷某個字的確切讀法和意思。

必須要指出的是,形聲字是相對容易處理的漢字。讀者要辨識剩下15%—20%的漢字,必須完全靠記憶從字形中抽取語音和語義。

雖然形聲字有上面提到的種種複雜特性,但是它們的優勢地位極大地支持了為漢字貼上單音節或者語素語音的標籤。而且因為形聲字的聲旁是更重要的部分,漢字可以在基本上被視為一種附加了語義成分的音節或者語音文字體系。它由一張非標準的音節表所構成,若被標準化,現代標準漢語的所有音節可以在有聲調的情況下用約400個漢字,或者在忽略聲調的情況下用1300個漢字涵蓋。在通用計算機字庫中並不是這種簡單的1:1對應,漢字和音節的比率為5:1或者16:1(後者考慮了聲調)。這可以與類似的非標準化英文體系中約40個音素的15:1到40:1這一比率形成比較,英文中像sent, cent和scent這樣的語義—語音詞段也為英語貼上了語素語音文字體系的標籤。

當我們瞭解到漢字體系包含了超過4萬個兼具語音與語義的獨立單位,便會很明顯認識到漢字是一種令人費神的文字。只有花費大量時間,才能達到熟練掌握的程度。甚至像寫下“打噴嚏”這樣常用的詞,都會遇到難以預期的困難,連中國人(除了漢字能力強的人)都很少能完全正確地寫出來。中國西部約佔全國六分之一國土的維吾爾自治區——新疆的“疆”字有十九畫,也讓很多人不堪其擾。灰心至極的他們,要麼丟掉右邊聲旁的上半部,要麼用六畫的“江”這個同音字來代替,不過這樣寫是“不合法的”。同樣的,“舞”字有十四畫,也讓許多舞廳經常用只有四畫的同音字“午”來代替。另一個十二畫的常用漢字“街”,由於它的出現頻率太高,所以會讓很多信筆寫來的人丟掉中間的六畫。“疆”“舞”“街”這三個都沒有官方認可的簡化形式,但是由於漢字的平均筆畫是十二畫,我們完全可以理解一直存在着創造出這幾個簡化字的強烈的衝動。運用最廣泛的語音文字體系(如羅馬字和日本的假名)是從更復雜的形式中演變而來的,所以漢字筆畫簡化的自然趨勢可能將其導向一種語音文字。然而在政府和知識分子的強有力抵制下,這種趨勢被阻擋了。

現代漢語中出現頻率最高的語素“de”的對應漢字“的”值得我們特別關注。“的”表示所有格、形容詞結尾、關係從句、介詞短語和動名詞等。這個漢字在文本中每間隔二十個字就會出現一次(!),一共有八畫,即使其草體也讓有些人覺得麻煩,所以——在私人場合——用字母“d”來代替(d是“的”拼音首字母)。“的”字的通用簡化形式還沒有發明出來,官方接受的簡化形式更需假以時日。更具諷刺意義的是,用來書寫無處不在的語素de的漢字“的”,其第二聲至今還具有其原初意義“光亮,目標” (一千多年以前的發音為tiek ,兩千多年前的發音大概為*tiawk)。

許多人現在經常私下使用字母d來代替“de”這個頻率非常高的語素。實際上,de是個多義語素,至少是三個同音語素合而為一,而在書面中則用三個不同漢字來表示。有意思的是,用來表示這三個高頻率語素的三個漢字原先的字義都不包括語素所指代的意思,而是被借用了:一、上文已提到,標記所有格和關係從句的de,用實際上意思是“目標”的“的”字表示;二、標記形容詞補語的de,用原初字義為“得到”的“得”字表示;三、標記動詞補語的de,用“地”字表示,其原初字義為“大地”,原初發音為di。現代漢語中這三個出現頻率最高的語素(在通常的文本中平均佔全部漢字6.5%)的對應漢字居然是原初具有不同語義、語義上被漂白的漢字,這一事實凸顯了本章前幾節中提到的漢字體系和白話之間的鴻溝。於是,有些人用一劃而就的d(即寫這個字母的時候,筆可以不離開紙面),來代替分別為八畫、十畫和六畫的“的”“地”“得”。

漢字極其錯綜複雜和難以把握的特性對漢字讀寫和中國文學都產生了重大影響。漢字的一些社會意藴、語言意藴和審美意藴,在本章以下的討論以及全書各章中將得到清晰呈現。

漢字的歷史故事之中國傳統的語言研究

中國傳統的語言研究叫做“國小”,這頗為發人深省,因為其對應的是處理社會政治主題、更宏闊的所謂“大學”。前佛教時期的國小——始於公元前數個世紀——幾乎完全以漢字為中心,而對於語言本身一無所涉。(在現代標準漢語中,由於受日本的影響,大學的意思是university,國小則用來指primary school。)正是佛教,説服了不情願的中國知識界在他們珍視的漢字之外,對口語也給予應有的關注。不過直到二十世紀之前,中國傳統的語言研究都還在很大程度上聚焦於漢字,對口語只偶爾投以一瞥。

模仿日語中しょうがく和だいがく的對應漢字,國小的意思變成是primary school,大學用來指university——這一事實指向現代漢語詞彙形成過程中一個非常有意思的方面。即,數以百計有其原初意義的重要詞彙(特別是在科學、文化、社會學、經濟學和教育領域),在前現代時期從漢語借用到日語中,然後這些詞彙被日語賦予新的意義(通常在西方啟發下),最終帶着新的詞義又回借給漢語。這種“往返詞”包括了文學、文化、文明、語法、詞彙、物理學、鉛筆、演講、諷刺、學士、博士、藝術、決心、具體、安全、封建、方面、法律、模特、保證、表達、觀念、意義、自由、階級、改革、革命、環境、課程、計劃、經理、經濟、權利、自我批評、機械、機會、機體、抗議、講義、故意、公司、結構、教育、教授、共和、勞動、理解、流行、政治、社會、進步、信用、支持、思想、自然、方法、宗教、主席、便當、投機、預算、運動、遊擊,等等。(其中特別有意思的一個詞彙是China在漢語中的對應詞“支那”。China來自於秦朝的chin,後被梵語借用為Cīna,而最晚到唐代,這個詞又回譯為漢字“支那”,並遠渡重洋到了日本。所以,“支那”基本上是一個“二度往返詞”。“支那”這個詞現在在中國是禁止使用的,因為在二戰時被日本官兵所污,除了有些學者出於特殊歷史效果仍偶爾使用它。)現代漢語詞彙中更大的一個子類(用來對應英語中具-ology和-ism詞尾的詞彙)也是最初為日語所生造出來以對應西方概念,後來又為漢語所借用。與以上列舉的“往返詞”不同,這類詞彙在漢語中原來並不存在。

對漢字的首次徹底考察是許慎的《説文解字》,這部完成於公元120xx年的作品至今仍作為與漢字有關事物的“福音書”而被頻頻徵引。許慎將所有漢字分為六大類:

1.“指事”,屬表意文字;

2.“象形”;

3.“形聲”,形聲字包含一個聲旁和一個形旁,大多數漢字屬於這個類別;

4.“會意”,字義由其組成部分的合義構成(如仁,言,信)。這是一個錯謬的類別,因為實際上並沒有哪個漢字是起源於這種方式;

5.“轉註”,這是一個晦澀的類別,它試圖解釋人們所認為的具有近似形狀而相互之間輕微變形的漢字。有些成對的漢字之間具有非常微小的字形區別;

6.“假借”,這個類別涵蓋的是同義詞,同義詞在金文中相對突出。

以許慎“六書”為代表的漢字研究一般被認為是中國的詞源學。實際上,嚴格而系統化的漢語詞源科學從未在中國建立起來。而詞源學的基本內容——最早的使用以及詞形詞義的變化,告訴我們真正的詞源學處理的是詞的源流和演變。它包括詞根和詞素的語音語義分析,以及它們在不止一個詞根的詞彙中的結合。詞源學關涉的是詞的源流與演變,而非字的演變。中外學者正在合作編寫一部中文的詞源學詞典,將於二十一世紀問世。

《説文解字》的另一處瑕疵在於,即使是它的漢字研究也只以年代追溯到公元前三世紀左右的小篆為基礎。小篆與之前的金文、甲骨文有長達千年的時間距離。結果是許慎對漢字字形的解讀經常是嚴重錯誤的。由於未能意識到字從起源時到他所處的東漢,其間會發生何等巨大的語音轉變,許慎有時在分析字的發音時會謬以千里。雖然有這麼多不足,許慎還是被追認為中國的語言研究(更精確的應該是漢字研究)創始人,他的《説文解字》也成為後世這一領域著作的標杆。

許慎的最偉大貢獻之一在於他抓住瞭如何給數千漢字排序這一至今讓信息專家頭疼不已的重要問題。許慎的解決方案是創立540個形旁部首,然後將所有現存漢字分門分類在540個部首之下。到了清代的《康熙字典》,部首慢慢削減為214個(其排序法實際上早在明代的1620xx年已由梅膺祚所創立)。當我們考慮到如下事實,才能充分理解這一體系令人生畏之處:一、一個漢字可能包括兩個、三個甚至更多部首,這讓人很難確定它到底屬於哪個部首(比如只有九畫的“章”字,卻有不少於五個可能的部首);二、因為有要將它放進漢字的方塊形狀中這一削足適履的習慣,部首很可能會以變形的面貌出現;三、即便成功辨別某字的“正確”部首,一個部首之下有可能會包括數百個漢字,這便又提出了一個如何給部首之下的漢字邏輯排序的複雜問題。(通常的方法是根據減去部首之後的剩餘筆畫排序,但實際筆畫數有時候也是模稜兩可的,同時如在“木”或“心”部首的七畫下,會超過一百個漢字。)除了用許慎發明的部首法查字帶來的困難之外,部首分類法的存在還或多或少排除了漢字逐漸演變為語音文字的可能性,因為這一分類強調所有包含一個以上成分的漢字(絕大多數漢字)都能這樣進行分析,這樣它們就能被視為包含一個語義成分——不管被分配的語義是否在該詞的詞源學演變中確有其事。

如何排列(反過來就是如何查找)數萬個漢字這樣一個頭疼的問題,導致產生很多其他方法。中國傳統的類書經常根據名詞概念(如天、地、人、歲時、鳥獸或者草木)來組織。而在吸收了印度音韻學之後,漢字開始根據音律這一高度技術化的體系來分組,一共出現過數百種排序和查找漢字的其他方法(四角法、上下筆畫法和筆畫順序法等)。大多數方法發明於急迫追求效率的二十世紀,此時的中國詞典編纂者面臨着前所未有的國際經濟和文化競爭壓力。漢語使用者越來越發現拼音是最簡易快速的檢字方法。(這一點從圖書館詞典中拼音檢字表的污損,以及非專業打字員的一般電腦使用者的輸入習慣那裏得到證明。)對所有詞彙(單音節、雙音節以及多音節)來説,完全的字母音序排序正在成為比首字排序更受歡迎的方法。在詞典編纂領域和信息以及計算機科學領域都是如此。

除了《説文解字》,中國傳統的語言研究中另一部標杆性著作是東漢劉熙的《釋名》(約200)。《釋名》的主要分析技術是“聲訓”,就是用聲音相同或相近的字來解釋詞義。於是基本上,它試圖用雙關法來解釋詞彙的起源與關聯。雖然這讓《釋名》多少具有音律研究方面的價值,但是對於詞義和詞源研究而言,就很難採信。

概括一下本節以及前兩節的主要觀點:漢字既非完全語音,也非完全語義。只有通過其語音部分和語義部分的結合,漢字才成其為漢字。漢字的這一典型雙重特性使之在世界現存通行文字中獨一無二,這對於藝術和文學都具有重要意義。

Tags:漢字 歷史