“詩情畫意”的統(tǒng)計分析——談唐宋詩審美的計算機輔助研究
【內(nèi)容摘要】在文史研究對計算機檢索功能要求愈高的今天,計算機輔助研究將轉(zhuǎn)向面對學(xué)科本體和研究者需求的“智能化”角色。未來文史領(lǐng)域里計算機輔助研究的發(fā)展趨勢之一是在人工協(xié)助下模擬人腦底層思維,對唐宋詩審美進行機選分析。在這一前提下,意象是計算機“審美”分析過程里的一個重要計算參數(shù)。
【關(guān) 鍵 詞】計算機;輔助研究;唐宋詩審美
【作者簡介】盛莉,女,1977年生,文學(xué)博士。江漢大學(xué)人文學(xué)院講師,研究方向為中國古典文獻學(xué)、中國古代文學(xué)。
【基金項目】武漢市科技局2009年軟科學(xué)項目“漢語古籍文獻數(shù)字化應(yīng)用研究”(200900080)
用計算機對唐宋詩進行檢索分析是近年來學(xué)界古代文學(xué)研究的熱點,這一代表中國古典詩歌研究與當(dāng)代信息技術(shù)相結(jié)合的“革命性”技術(shù),使得東西方文化的思維方式、自然科學(xué)的符號語言同人類文學(xué)的情感語言進行了初步交融。目前,計算機詩歌輔助研究系統(tǒng)中以北大計算語言學(xué)研究所開發(fā)的“唐宋詩計算機輔助研究系統(tǒng)”較有代表性。該系統(tǒng)建立了唐宋詩自動注音、詞匯知識庫、作者信息庫,還可在人工選擇下意象檢索。同此前主要建立在字形檢索基礎(chǔ)上的古籍檢索相比,計算機在唐宋詩的輔助研究中已開始擔(dān)當(dāng)“理解”文本內(nèi)容的助手角色。基于計算機輔助研究(Computer Assisted Research,CAR)這種面向?qū)W科本體的視野轉(zhuǎn)化,筆者認為,人腦研究詩歌審美的一些底層思維流程也可部分交由計算機模擬進行。
在人腦的思維活動里,左半球主要管轄邏輯思維,負責(zé)推理、邏輯和語言;右半球主要管轄形象思維和靈感思維,注重幾何形狀的感覺,感情、想像力和空間距離。而人腦的認知帶有“感受——記憶”的特點。個體的人從出生到成年以后,對客觀世界的認識是通過不斷學(xué)習(xí)記憶和各種經(jīng)驗感受建構(gòu)得來,諸如天空的顏色,飛鳥的聲音,鮮花的香味等直觀知識信息是主體“人”通過自己感官體驗而來,并被存儲在人腦里成為認識更復(fù)雜世界現(xiàn)象中的基本元素。以基于詩歌情感、意境、風(fēng)格、主題基礎(chǔ)上的詩歌審美活動為例,圖一簡單描繪了人腦審美時的思維流程:
圖一
從圖一看出,人腦的詩歌審美活動里有兩個重要特點:一是人腦可以同時進行幾項信息處理活動,如詩歌語句信息的存儲、讀音意義的檢索與甄選、文本內(nèi)容的直覺感知等可在人腦左右半球的協(xié)作下同時進行,實現(xiàn)審美結(jié)果后所有針對該項課題臨時構(gòu)建的專家知識系統(tǒng)即清除掃零。而計算機必須預(yù)先規(guī)劃需求與步驟,進行數(shù)據(jù)建模,研制出的關(guān)系數(shù)據(jù)庫則將在以后的研究工作中重復(fù)使用。
二是人腦具有獨立的思考和感知能力。計算機的“思考”則必須在人工指導(dǎo)下通過XML語言標(biāo)記和建立全文檢索、關(guān)系數(shù)據(jù)庫等模擬人腦的底層思維過程。這一技術(shù)目前已在某些領(lǐng)域如漢語史領(lǐng)域開始進行深入研究[①]。
唐宋詩審美的計算機輔助研究是模擬人腦的底層思維過程。曾在人腦里學(xué)習(xí)記憶過的事物或現(xiàn)象的代表特征一旦映射到人的感官器官,人腦就會迅速在存儲的“知識庫”里搜索與之相對應(yīng)的信息,形成判斷。聽音辨色、聞香識味正是人腦映射功能的體現(xiàn)。在具備人工知識信息和各種關(guān)系模庫的基礎(chǔ)上,計算機可部分模擬人腦對詩歌的底層審美思維。見圖二:
圖二
圖二表明,計算機的詩歌“審美”活動不同于簡單的古籍關(guān)鍵詞電子檢索,它是將閱讀文本作為檢索對象,去比照人工建立的知識概念庫、關(guān)系模庫和“審美經(jīng)驗”模庫中的相同或相似匹配結(jié)果,達到模擬人腦底層思維的效果。對于計算機來說,被檢索的對象從簡單的關(guān)鍵詞句擴展為整首乃至卷帙眾多的詩歌作品,而作為使用者的主體人對于檢索對象里具體包含了哪些自己想得到的信息卻并不一定清楚。
舉例來說,研究者想要了解晚唐詩歌的情感思想和藝術(shù)特征。如果是人工研究,在沒有深入閱讀過晚唐詩的全部作品之前,研究者對于自己到底要重點研究晚唐詩的哪些篇目以及從何角度審視晚唐詩并無絕對把握。只有在閱讀中,研究者通過自己的體會,結(jié)合己有的各種文史知識和審美經(jīng)驗才能作出分析結(jié)論。因此,如果讓計算機模擬人腦對晚唐詩進行“審美”研究,首先要給計算機輸入各類同詩歌審美相關(guān)的美學(xué)知識庫和關(guān)系模,讓計算機“理解”詩歌文本中的各類詞句組合和表現(xiàn)形式具有什么樣的美學(xué)特征。在具備這一前提基礎(chǔ)上,研究者發(fā)出檢索指令,指定計算機“閱讀”晚唐詩全部作品,并作出機選“分析判斷”。
可見,計算機在參與唐宋詩審美的輔助研究中,真正要做的核心工作不是關(guān)鍵詞匹配的查找,而是“學(xué)習(xí)與理解”同詩歌審美研究相關(guān)的各種文史知識和名家詩歌模式。這實際上已涉入人工智能的領(lǐng)域,但如何“學(xué)習(xí)與理解”的技術(shù)問題不是文史工作者能把握的,我們關(guān)注的主要是針對某一研究領(lǐng)域,計算機模擬人腦“學(xué)習(xí)與理解”的“內(nèi)容”和“視野”,即為計算機建立哪些知識概念庫、關(guān)系模庫和“審美經(jīng)驗”模庫。
對于唐宋詩審美的計算機輔助研究來說,建立知識概念庫、關(guān)系模庫和“審美經(jīng)驗”模庫有其特定優(yōu)勢。唐宋詩中的律詩、絕句有固定的平仄格律,大多數(shù)詩歌的語句長度在七言以內(nèi),句偶之間存在對仗關(guān)系。因此以句或篇為單位可建立模型。計算機可根據(jù)模型尋找匹配項。
如律詩中的拗律是一種變體,這種變體以杜甫律詩為代表,于平仄錯落中模仿古風(fēng)詩,表現(xiàn)一種拗峭之風(fēng),多為詩人突破聲律限制、表達特定情意的嘗試。宋代黃庭堅、陳師道等人即專學(xué)杜甫拗律,自成風(fēng)格。研究者可通過計算機檢索近體詩各體的平仄搭配模型,比較唐代和宋代各時期詩人作品里拗體律詩平仄排列的變化,作為研究律詩和古風(fēng)關(guān)系的線索。
當(dāng)然,唐宋詩的審美主要是體味詩歌的情感主題、意境風(fēng)格等,從詩歌文本內(nèi)容分析是重中之重。計算機不具備感官情感體征,不能獨立思考詩歌里各類詞語組合所表現(xiàn)的復(fù)雜的藝術(shù)形象和意義內(nèi)涵,因此要為計算機建立一些知識概念庫和“審美經(jīng)驗”模庫,幫助實現(xiàn)詩歌詞匯的上下文語境簡單分析。詩歌“意象”便是其中一個重要的計算參數(shù)。
詩歌意象是種特殊的表意性藝術(shù)形象或文學(xué)形象,由語言符號和語言符號所表達的意義構(gòu)成。意象中的語言符號不是一般的概念性語言符號,而是借一種客觀事物的描繪表達象征義的情感,有更深層的喻義。從意象包含的詩歌情感和象征義來看,它對了解詩歌的情感主題、意境風(fēng)格十分重要。以唐詩為例,唐詩中意象繁多,部分統(tǒng)計如下:
唐詩中部分常見意象分析 | |
唐詩意象 | 所表現(xiàn)的主題情感或象征的文學(xué)藝術(shù)形象 |
“鐘” | 清幽空遠的禪意 |
“烏” | 1、離愁悲思2、仕宦感嘆3、生命悲苦(悲劇意識) |
“鶴” | 1、高潔2、長壽 |
“杜鵑” | 1、故園情懷2、離情別緒3、冤恨喟嘆 |
“鸚鵡” | 1、閨怨宮怨2、文采風(fēng)流3、英才不遇4、鄉(xiāng)思客愁 |
“燕子” | 1、閑適2、喜慶3、忠貞4、離別5、朋友6、志士7、小人 |
“雁” | 離愁別緒 |
“蟬” | 1、珍愛生命2、羈旅愁情3、高潔人格 |
“螢” | 1、光明2、家敗園破3、感時傷懷4、勤學(xué)苦讀5、賢臣 |
“蟋蟀” | 1、人生失意2、相思離愁3、懷鄉(xiāng) |
“猿” | 1、愁苦2、超脫3、禪理4、自由 |
“馬” | 富有政治理想品格的詩人化身 |
“黃昏” | 1、思鄉(xiāng)戀親2、離愁別緒3、傷時憂國4、遲暮嘆老 |
“月” | 1、理想追求2、離別相思3、哲理思考 |
“雨” | 1、愁情2、喜悅3、人生坎坷 |
“木葉” | 悲愁纏綿 |
“梧桐” | 堅貞愛情 |
“竹” | 1、清雅脫俗2、堅韌高潔3、政治理想 |
“草” | 1、春天2、離情 |
“云” | 1、離思2、神仙3、隱逸4、禪意 |
“星” | 1、愛情2、憂國之情3、眷戀故園4、自身命運的嗟嘆 |
“柳” | 1、愛情2、離情3、春天 |
“桃花” | 1、春天2、美人3、悲情4、桃源 |
“荷花” | 1、高潔2、美人3、愛情 |
“菊花” | 1、幽人高士2、感時傷懷3、堅貞高潔4、斗爭精神 |
“梅花” | 1、忠貞2、淡泊3、美人 |
“杏花” | 1、幽逸高隱2、美人3、吉祥喜慶 |
“橋” | 1、水鄉(xiāng)繁榮2、思歸離別3、歷史感傷4、通往理想境界的藝術(shù)符號 |
“水” | 1、愛情2、時光3、萬物依附的母體4、自然的音符 |
“南山” | 1、隱2、賢 |
“白發(fā)” | 1、功業(yè)理想2、友朋之思3、生命流逝 |
上表說明詩歌意象是在特定語境下除了字詞本意外表達更深層的隱喻義或某類象征情感的語言符號,對于理解所在詩歌文本的思想主旨和藝術(shù)表現(xiàn)形式十分重要。如何讓計算機對含有意象的詩歌進行綜合“分析”是目前CAR發(fā)展領(lǐng)域里眾多學(xué)者關(guān)注的一個問題。
北大計算語言學(xué)研究所開發(fā)的“唐宋詩計算機輔助研究系統(tǒng)”可在人工選擇下進行初步范圍的意象檢索,其研究思路對后來者可謂啟益多多。如針對“悲傷”意象人工選擇“悲、苦、愁、凄涼、自憐”等,系統(tǒng)再根據(jù)詞匯的共現(xiàn)、聯(lián)想網(wǎng)絡(luò)搜索到與之相關(guān)的詞匯(“蹉跎、蕭然、浮生、西風(fēng)、殘燈、柳色”等)共304條,在此基礎(chǔ)上運用神經(jīng)網(wǎng)絡(luò)算法對每首詩的“悲傷度”打分,由此建立“悲傷”主題的意象索引。運用這一方法檢索到的詩篇有很多表現(xiàn)悲傷情緒,但不含有悲傷詞匯。
系統(tǒng)的使用原理是預(yù)先建立一個從唐宋詩語料庫中提取詞匯的唐宋詩詞匯知識庫,進行意象檢索時由人工選擇輸入一個表達“悲傷”意象的檢索詞,該檢索詞由計算機經(jīng)過同現(xiàn)聯(lián)想計算后在唐宋詩詞匯知識庫中尋找相似詞和相似擴展詞,最后在唐宋詩語料庫中得到含有匹配詞項的詩篇。這種語義檢索比早先的字形檢索顯然更接近文本的“理解”層面。
需要說明的是,這種檢索方式是以檢索人工輸入的單個意象為目的,如要判斷比較單首詩的主題情感、意象風(fēng)格同其他詩之間的區(qū)別以及詩歌意象的復(fù)雜內(nèi)涵,則該系統(tǒng)還有待進一步完善。
“唐宋詩計算機輔助研究系統(tǒng)”的研究經(jīng)驗表明,在擁有大量的知識概念庫和關(guān)系模庫后,計算機簡單模擬人腦綜合分析詩歌文本的情感語境也可成為事實。如計算機分析唐詩中的意象組合,送別詩中的“柳”、“橋”、“水”、“草”意象,邊塞詩中的“征衣”、“隴頭”、“玉門關(guān)”意象,愛情詩中的“柳”、“燕子”、“水”、“月”、“梧桐”、“鳳凰”意象,都組成了詩歌的某一類型語境。單意象如“竹”或表達某種情感(如詠竹詩),或多與泉水、小徑、風(fēng)、寺廟、人等組合,描畫出幽靜恬淡的意境。
大量詩歌中的意象組合是有法則可循的,通過分析名家代表詩作中意象的組合,提取其詩歌風(fēng)格所屬下意象間的組合關(guān)系甚至是規(guī)律,計算機統(tǒng)計的這類詩歌越多,提取相關(guān)意象組合的記憶知識就越多,進而組成關(guān)于詩歌意象的知識概念庫。同理,計算機儲存的各類代表詩作越多,擁有的各類詩歌語言組合知識和風(fēng)格審美經(jīng)驗就越多,由此建成各種關(guān)系模庫和“審美經(jīng)驗”模庫。計算機的詩歌審美便是在這些知識概念庫和模庫中尋找與閱讀詩歌相同或近似的匹配項。尤其是近體詩的相似句計算更易辨別,因為每句字?jǐn)?shù)不超過七字,所以一般單句只要含有四字以上的相同詩歌詞匯[②],句與句間即構(gòu)成語言相似關(guān)系。
目前,計算機的上下文語境分析主要通過單句內(nèi)上下文詞匯的向量空間模型來近似表征詞匯的上下文語境,進而計算出詞匯間的語義相似關(guān)系,這實際上屬于詞匯聚類研究的范圍。計算機的唐宋詩詞匯自動切分提取和語義相似度計算技術(shù)已比較成熟,因此可預(yù)先通過詞匯的同現(xiàn)聯(lián)想計算建立一個唐宋詩意象詞匯庫,該庫中的詞匯都是經(jīng)計算機在唐宋詩語料里語義描述切分提取后再人工甄選組成。詩歌意象詞匯的上下文語境分析參照“唐宋詩計算機輔助研究系統(tǒng)”成果可用下列公式計算:
給定唐宋詩語料庫Ω和唐宋詩意象詞匯庫δ,特定意象詞匯x在Ω上的隱喻義和象征情感Sx定義為如下五元組:
Sx = {Lx,Rx,Cx,δ,Ω}
其中:x、y∈δ,y 為x 的同現(xiàn)特征詞,Lx為x的左同現(xiàn)詞匯特征向量,Rx為x的右同現(xiàn)詞匯特征向量,Cx為對仗向量。特征向量的元素為特征詞與特征值組成的二元組(y,Vxy)。
Vxy=logf(xy)
logfx×logfy
其中:f(xy)為y在對應(yīng)的x的相對位置上出現(xiàn)的頻度(同一句的左邊、右邊或?qū)φ涛恢蒙?。fx、fy分別是x、y在唐宋詩語料庫Ω中出現(xiàn)的頻度。
上述公式可計算出詩歌文本所含的某一意象詞匯在其上下文語境里的隱喻義特征和象征情感。
當(dāng)單首詩中出現(xiàn)一個或多個意象時,計算機對整詩的“理解”便建立在對多個意象隱喻義特征疊加分析的基礎(chǔ)上。相似意象組合成詩歌的同類語境,不同詩歌的相似語境則可能表現(xiàn)同類情感風(fēng)格。最后根據(jù)詩歌普通詞匯的語法語義分析、相似句計算綜合得出對詩歌主題情感、意境風(fēng)格的評價。當(dāng)然,最終的“評價”答案可能比較模糊,還需要人工甄別。
讓計算機模擬人腦底層思維對指定詩進行審美“分析”能幫助研究者拓展研究視野,即通過計算機的記憶存儲和海量運算優(yōu)勢尋找對象詩歌群里內(nèi)容形式的相似點聚合與特征描述,幫助研究者分析以詩歌意象、風(fēng)格、主題等為表征的文學(xué)表現(xiàn)力指數(shù)。
如讓計算機“閱讀”所指定唐宋詩篇目而不是人工選擇輸入一個表達“悲傷”意象的檢索詞,最終檢索結(jié)果不僅可以“讀”出所有含“悲傷”意象的詩歌,還可“讀”出含有其他類型意象和文學(xué)風(fēng)貌特征的詩歌并予以統(tǒng)計比較。
同時,計算機還可分析統(tǒng)計所“閱讀”的詩歌意象的多樣性,如讀到各類詩歌的“悲傷”意象,據(jù)詩歌情感類型劃分有悲喜交加、悲中愈苦、悲后平靜等;據(jù)主題內(nèi)容劃分有相思的悲傷、思鄉(xiāng)的悲傷、思親的悲傷、身世的悲傷等;據(jù)風(fēng)格劃分,有綿麗的悲傷、曠放的悲傷、沉郁的悲傷等;據(jù)意象詞匯劃分,有以典故為寄托的悲傷,以動植物為寄托的悲傷,以自然物候為寄托的悲傷等。所有表達悲傷情感的詩篇呈現(xiàn)出更豐富的情感內(nèi)涵和藝術(shù)形式。最終的機選結(jié)論又可引發(fā)學(xué)者對中國古典詩歌意象研究的思考。
這說明,計算機檢索的“思考結(jié)果”不僅要根據(jù)使用者的需求,還要能觸發(fā)使用者的思考靈機,做到彌補人腦閱讀詩歌時思考不足的遺漏。
意象分析只是計算機輔助研究唐宋詩審美的一個切入點而已。毋庸置疑,計算機并不能象人腦那樣在詩歌閱讀中獲得各種高級感官的、情感的體驗和心靈愉悅,它無法完全替代人腦。但在文史研究對計算機檢索功能要求愈高的今天,計算機輔助研究的角色將日趨“智能化”。隨著學(xué)界計算語言學(xué)和人工智能技術(shù)的成熟,計算機會有越來越多的切入點和計算模式去模擬人腦思維,協(xié)助人腦從事更復(fù)雜更精密的研究工作。計算機在人類文明發(fā)展史中的角色已證明,這并非遙不可及的夢想。
參考文獻:
[1]胡俊峰,俞士汶.《唐宋詩之計算機輔助深層研究》[J],《北京大學(xué)學(xué)報》(自然科學(xué)版),2001年第5期。
[2]胡俊峰,俞士汶.《唐宋詩中詞匯語義相似度的統(tǒng)計分析及應(yīng)用》[J],《中文信息學(xué)報》,2002年第4期。
[3]尉遲治平.《漢語信息處理和計算機輔助漢語史研究》[J],《語言研究》,2004年第3期。
[4]王美艷,趙偉.《基于唐詩語料庫“詞”的提取及深入研究》[J],《長春工業(yè)大學(xué)學(xué)報》(自然科學(xué)版),2005年第3期。
[5]孫昱璐.《從“烏”“鶴”意象看唐詩中的悲劇意識》[J],《云夢學(xué)刊》,2007年第12期。
[6]劉亮.《論唐詩中的“猿”意象》,《中國韻文學(xué)刊》[J],2008年第2期。
[7]尉遲治平.《漢語史研究和計算機技術(shù)》,《語言研究》[J],2008年第4期。
[8]王功絹.《論唐詩中杜鵑意象及其情感內(nèi)涵》[J],《湖北師范學(xué)院學(xué)報》(哲學(xué)社會科學(xué)版),2009年第4期。
[9]李雪峰.《試論古典詩詞里的黃昏意象》[J],《重慶工學(xué)院學(xué)報》(社會科學(xué)),2009年第3期。
[10]金貝翎.《唐詩“螢”意象初探》[J],《黃山學(xué)院學(xué)報》,2008年第1期。
[11]趙衛(wèi)華.《中國古典詩詞中蟋蟀意象的悲秋文化內(nèi)涵》[J],《河北學(xué)刊》,2008年第5期。
[12]程杰.《論中國文學(xué)中的杏花意象》[J],《江海學(xué)刊》,2009年第1期。
[13]劉歡萍.《古典詩詞中的鸚鵡意象及其文化內(nèi)蘊探究》[J],《安徽農(nóng)業(yè)大學(xué)學(xué)報》(社會科學(xué)版),2009年第1期。
[14]張杰,林木輝,包正委.《基于領(lǐng)域本體的語句相似度研究》[J],《福建師范大學(xué)學(xué)報》(自然科學(xué)版),2009年第1期。
[15]鄭永曉.《技術(shù)與心智的互補—建立在計算機檢索基礎(chǔ)之上的古典文學(xué)研究》[J],《文學(xué)遺產(chǎn)》,2009年第1期。
[16]羅鳳珠.《引信息的“術(shù)”入文學(xué)的“心”——談情感計算和語義研究在文史領(lǐng)域的應(yīng)用》[J],《文學(xué)遺產(chǎn)》,2009年第1期。
注釋:
[①]參尉遲治平《漢語史研究和計算機技術(shù)》,《語言研究》2008年第4期。
[②] 此處的詩歌詞匯指唐宋詩中使用頻度高或有特指意義的典型詞,不包括語法助詞。
Computer Assisted Research on aesthetic of Tang Poetry and Song Poetry
SHENG Li
(College of Chinese Language and Literature, JiangHan University, Wuhan 430056, China)
Abstract: With the requirement of computer search function for literature and history becomes higher today, Computer Assisted Reasearch will shift to face subject ontology and researchers demand for “intelligent” roles. In the future, one developmental trend of Computer Assisted Reasearch in the field of literature and history is to simulate human brain appreciating Tang poetry and Song poetry with a artificial assistance, educing the aesthetic analysis. In this premise, imago is important for computer’s aesthetic analysis .
Key words: computer; assisted reasearch; appreciating Tang poetry and Song poetry