古籍?dāng)?shù)字化與學(xué)術(shù)異化
【內(nèi)容摘要】歷史經(jīng)驗(yàn)表明,技術(shù)革新必將導(dǎo)致學(xué)術(shù)變異。古籍?dāng)?shù)字化對(duì)現(xiàn)代學(xué)術(shù)進(jìn)程產(chǎn)生積極作用,但同時(shí)也帶來(lái)負(fù)面效應(yīng),或可導(dǎo)致學(xué)術(shù)異化。以下三方面值得特別注意:一是技術(shù)遮蔽偽化研究論斷,二是數(shù)字鴻溝拉大區(qū)域?qū)W術(shù)落差,三是技術(shù)偽裝學(xué)問(wèn)使偽學(xué)術(shù)加劇。本文認(rèn)為:積極開(kāi)發(fā)語(yǔ)義檢索系統(tǒng)、加大研發(fā)主體公益性與商業(yè)性協(xié)作力度、正確使用數(shù)字化成果,將是去除信息時(shí)代學(xué)術(shù)異化的有效途徑。
【關(guān)鍵詞】古籍?dāng)?shù)字化;學(xué)術(shù)異化;技術(shù)遮蔽;數(shù)字鴻溝;技術(shù)偽裝學(xué)問(wèn)
【作者簡(jiǎn)介】吳夏平,男,1976年生,江西都昌人,貴州師范大學(xué)文學(xué)院教授,北京大學(xué)中文系博士后。
近三十年來(lái),中國(guó)古籍?dāng)?shù)字化基本上是通過(guò)兩個(gè)方面來(lái)進(jìn)行的,一是利用計(jì)算機(jī)對(duì)古籍進(jìn)行揭示,建立古籍的書(shū)目型數(shù)據(jù)庫(kù),方便讀者檢索使用;二是利用計(jì)算機(jī)對(duì)古籍的內(nèi)容進(jìn)行數(shù)字化,使讀者不僅能通過(guò)計(jì)算機(jī)來(lái)閱讀古籍,并且能夠通過(guò)磁盤(pán)、光盤(pán)和網(wǎng)絡(luò)進(jìn)行傳播。[1]對(duì)古籍?dāng)?shù)字化的研究,隨著時(shí)間的推移愈來(lái)愈熾烈,僅就論文的數(shù)量來(lái)看已近千篇。[2]研究論題主要集中在兩方面,一是古籍?dāng)?shù)字化建設(shè),即技術(shù)層面;二是對(duì)數(shù)字化古籍利用,屬于學(xué)術(shù)層面。對(duì)于技術(shù)與學(xué)術(shù)的關(guān)系,則探討得不多。本文擬從技術(shù)遮蔽、數(shù)字鴻溝、技術(shù)偽裝學(xué)問(wèn)等方面揭示信息時(shí)代技術(shù)與學(xué)術(shù)之關(guān)系,指出或?qū)?dǎo)致學(xué)術(shù)異化的諸端表征,并指陳去除異化的相關(guān)對(duì)策。
一、技術(shù)與學(xué)術(shù)之關(guān)系的歷史經(jīng)驗(yàn)
總體來(lái)看,技術(shù)革新影響學(xué)術(shù)變異有三個(gè)重要階段,一是紙張的發(fā)明,二是印刷術(shù)的運(yùn)用,三是現(xiàn)代信息技術(shù)的普及。技術(shù)與學(xué)術(shù)之關(guān)系,古人早有自覺(jué)的研究并形成較深的認(rèn)識(shí)。如北宋時(shí)期,蘇軾思考雕版印刷對(duì)文人的影響,指出:“自孔子圣人,其學(xué)必始于觀書(shū),……自秦漢以來(lái),作者益眾,紙與字畫(huà)日趨于簡(jiǎn)便,而書(shū)益多,世莫不有,然學(xué)者益以茍簡(jiǎn),何哉?余猶及見(jiàn)老儒先生,自言其少時(shí)欲求《史記》、《漢書(shū)》而不可得,幸而得之,皆手自書(shū),日夜誦讀,惟恐不及。近歲市人轉(zhuǎn)相摹刻,諸子百家之書(shū),日傳萬(wàn)紙,學(xué)者之于書(shū),多而且易致如此,其文詞學(xué)術(shù),當(dāng)倍蓰于昔人,而后生科舉之士,皆束書(shū)不觀,游談無(wú)根,此又何也?”[3]書(shū)籍多且易得,反而使記憶力衰退。對(duì)此問(wèn)題,葉夢(mèng)得亦頗有體悟,其《石林燕語(yǔ)》云:“唐以前,凡書(shū)籍皆寫(xiě)本,未有模印之法,人以藏書(shū)為貴,人不多有,而藏者精于讎對(duì),故往往皆有善本;學(xué)者以傳錄之艱,故其誦讀也精詳。五代馮道始奏請(qǐng)官鏤《六經(jīng)》版印行,國(guó)朝淳化(990-994)中,復(fù)以《史記》、《前》《后漢》付有司摹印,自是書(shū)籍刊鏤者益多,士大夫不復(fù)以藏書(shū)為意,學(xué)者易于得書(shū),其誦讀亦因滅裂。然板本初不是正,不無(wú)訛誤,世既一以板本為正,而藏本日亡,其訛謬者遂不可正,甚可惜也?!盵4]葉氏指出刻本廣泛傳播后的兩個(gè)弊端,一是讀書(shū)人誦讀滅裂,和蘇軾的擔(dān)憂(yōu)相同;二是刻本流行后,其據(jù)以刊刻的藏本反而不為重視,導(dǎo)致訛謬之處無(wú)法刊正。這與今日數(shù)字化時(shí)代的弊病何其相似。
當(dāng)代學(xué)者對(duì)于技術(shù)革新與學(xué)術(shù)變異之關(guān)系亦不乏思考,涌現(xiàn)出一批諸如《紙簡(jiǎn)替代與漢魏晉初文學(xué)新變》[5]、《紙張的廣泛應(yīng)用與漢魏經(jīng)學(xué)的興衰》[6]、《紙的發(fā)明與后漢的學(xué)風(fēng)》[7]、《宋代刻書(shū)產(chǎn)業(yè)與文學(xué)》[8]、《印刷傳媒與宋詩(shī)特色》[9]等優(yōu)秀成果。其共同特點(diǎn)是從技術(shù)創(chuàng)新角度考察文學(xué)(經(jīng)學(xué))的變異,對(duì)于探討現(xiàn)代信息技術(shù)與學(xué)術(shù)之關(guān)系具有相當(dāng)?shù)慕梃b作用。有些學(xué)者已經(jīng)充分認(rèn)識(shí)到信息技術(shù)對(duì)當(dāng)代學(xué)術(shù)的影響,主要表現(xiàn)在學(xué)術(shù)話(huà)語(yǔ)權(quán)的分解以及網(wǎng)絡(luò)文化對(duì)紙質(zhì)文化的沖擊等方面:“在紙質(zhì)文化時(shí)代,文化話(huà)語(yǔ)權(quán)還主要掌握在少數(shù)所謂文化精英手中。有的時(shí)候,他們就像救世主似的,發(fā)蒙解惑,以炫博雅;另外一些時(shí)候,又把自己想象成帝王師,吐屬不凡,指點(diǎn)江山。而今隨著網(wǎng)絡(luò)的普及,這種文化特權(quán)被迅速瓦解,大眾也可以通過(guò)網(wǎng)絡(luò)分享部分話(huà)語(yǔ)權(quán)力?!薄耙粋€(gè)基本事實(shí)是,以信息技術(shù)為核心的文化轉(zhuǎn)型已經(jīng)勢(shì)不可擋。如何抓住這樣一個(gè)歷史契機(jī),迅速適應(yīng)日益變化的形式,這是擺在每一位文學(xué)工作者面前的重要任務(wù)。當(dāng)前,中國(guó)古籍電子化的時(shí)代即將到來(lái),為我們的研究提供了前所未有的便利條件。雖然這項(xiàng)工作還僅僅處于起步階段,卻已顯示出無(wú)比廣闊的學(xué)術(shù)空間?!盵10]顯然,這些論斷有助于認(rèn)識(shí)古籍?dāng)?shù)字化與學(xué)術(shù)之間的關(guān)系,為論析數(shù)字化與學(xué)術(shù)異化的問(wèn)題提供了有益的思路。
當(dāng)前對(duì)于學(xué)術(shù)異化的認(rèn)識(shí)多著眼于評(píng)價(jià)體系,批判對(duì)象直指“職稱(chēng)體”、“項(xiàng)目體”、“學(xué)報(bào)體”等異化現(xiàn)象,以及由此產(chǎn)生的學(xué)術(shù)腐敗等倫理缺陷。而較少?gòu)募夹g(shù)層面予以反思。學(xué)術(shù)的異化,固然與世俗功利密切相關(guān),但另一個(gè)重要因素——技術(shù)——也不容忽視。以下從技術(shù)遮蔽、數(shù)字鴻溝、技術(shù)偽裝等方面論述古籍?dāng)?shù)字化與學(xué)術(shù)異化之間的關(guān)聯(lián)性,并由此指陳去異化之對(duì)策。
二、技術(shù)遮蔽
學(xué)界對(duì)數(shù)字化古籍利用的最大弊病,就是過(guò)于依賴(lài)數(shù)字化成果。一切學(xué)術(shù)問(wèn)題都試圖通過(guò)檢索來(lái)完成,由此導(dǎo)致偽學(xué)術(shù)產(chǎn)生。究其成因,在學(xué)術(shù)偽命題之外,數(shù)字化技術(shù)遮蔽也是重要因素。
知識(shí)被遮蔽的第一種情況,是知識(shí)因未被選擇而遮蔽,技術(shù)在對(duì)一部分知識(shí)進(jìn)行篩選和固化時(shí),使另一部分知識(shí)淡化、邊緣化,或者說(shuō)被遮蔽。在一部分知識(shí)被選擇、集成之時(shí),另一部分知識(shí)即被舍棄,乃至被遺忘。[11]古籍?dāng)?shù)字化要從海量的古籍中選擇處理對(duì)象,在這個(gè)過(guò)程中,一部分古籍被數(shù)字化,另一部分則因未被選擇而被舍棄。其結(jié)果就是那些未被收入數(shù)據(jù)庫(kù)因而被遺忘的文獻(xiàn),永遠(yuǎn)是無(wú)法被檢索,影響數(shù)據(jù)收集的完整,進(jìn)而影響研究的結(jié)論。本文以“e考據(jù)”為例,論證技術(shù)遮蔽對(duì)文獻(xiàn)考據(jù)可信度的影響。
最早提出“e考據(jù)”概念的是臺(tái)灣新竹清華大學(xué)黃一農(nóng)教授。他認(rèn)為“隨著出版業(yè)的蓬勃以及圖書(shū)館的現(xiàn)代化,再加上國(guó)際網(wǎng)路和電子資料庫(kù)的普及,新一代的史學(xué)工作者常擁有博聞強(qiáng)記的前輩學(xué)者們夢(mèng)寐以求的環(huán)境。我們有機(jī)會(huì)在很短時(shí)間內(nèi)就掌握前人未曾寓目的材料,并填補(bǔ)探索歷史細(xì)節(jié)時(shí)的許多隙縫,或透過(guò)邏輯推理的布局,迅速論斷先前待考的疑惑或者矛盾。事實(shí)上,一個(gè)有機(jī)會(huì)孕育‘e-考據(jù)學(xué)派’的時(shí)代或已出現(xiàn)。”[12]基于“e考據(jù)”理念,氏著《兩頭蛇》一書(shū)充分利用網(wǎng)絡(luò)文獻(xiàn)和數(shù)字化古籍來(lái)考察明末清初的第一代天主教徒,所利用資料多達(dá)1099種。即便如此,還是難免出現(xiàn)將瞿汝夔的母親支氏誤認(rèn)為譚氏的錯(cuò)誤。其成因正如學(xué)者所指出的,并非檢索本身出了問(wèn)題,而是他檢索的數(shù)千種文獻(xiàn)中沒(méi)有關(guān)鍵性的瞿氏家譜。[13]這個(gè)案例或可作技術(shù)遮蔽影響學(xué)術(shù)論斷的著例。
技術(shù)遮蔽的第二種情況,是關(guān)鍵詞檢索導(dǎo)致的檢索結(jié)果不全面,檢準(zhǔn)率較低。檢索被廣泛利用,因它“滿(mǎn)足的是在一個(gè)海量信息集合中快速定位信息的需求,解決了Web信息資源在廣度上迅速增長(zhǎng)而人們需要定位局部信息需求間的矛盾?!盵14]關(guān)鍵詞檢索一定程度上解決了在海量信息中定位局部信息的問(wèn)題,但是關(guān)鍵詞檢索主要還是詞形匹配而非詞義匹配,因此產(chǎn)生三方面的不足:一是限于對(duì)檢索問(wèn)題的了解程度,用戶(hù)不能準(zhǔn)確地描述自己的信息需求;二是不能恰當(dāng)?shù)匕盐諜z索的深度,需要反復(fù)嘗試不同的檢索詞以控制檢索的規(guī)模;三是用自然語(yǔ)言檢索受控語(yǔ)言標(biāo)引的文獻(xiàn),造成漏檢和錯(cuò)檢。這些不足,在實(shí)際運(yùn)用過(guò)程中多能切實(shí)體會(huì)。前面兩種現(xiàn)象,主要關(guān)涉檢索者本身的學(xué)養(yǎng)。錯(cuò)檢和漏檢則更為普遍。以電子版《四庫(kù)全書(shū)》為例:比如要檢索“蘇軾”的資料,只能檢索到含有“蘇軾”二字的資料,不能檢索到不含“蘇軾”二字,卻含有“東坡”“子瞻”“大蘇”“蘇徐州”“蘇黃”等與蘇軾有關(guān)的資料。同樣,檢索有關(guān)“杜甫”的資料,也只能檢索到含有“杜甫”二字的資料,不能檢索到含有“杜子美”“杜少陵”“杜工部”“杜二”“詩(shī)圣”等與杜甫相關(guān)的資料。此外,還出現(xiàn)錯(cuò)檢。比如檢索“太白”一詞,檢索結(jié)果并非都與李白有關(guān),還會(huì)搜索到太白山和太白星等信息。[15]
上述“e考據(jù)”可信度降低、關(guān)鍵詞檢索出現(xiàn)錯(cuò)檢和漏檢等現(xiàn)象,均與數(shù)字化技術(shù)遮蔽有關(guān)。此為技術(shù)影響學(xué)術(shù)的第一個(gè)層面。
三、數(shù)字鴻溝
數(shù)字鴻溝,或稱(chēng)數(shù)位落差,是指社會(huì)上不同性別、種族、經(jīng)濟(jì)、居住環(huán)境、階級(jí)背景的人,接近使用數(shù)位產(chǎn)品(如電腦或網(wǎng)絡(luò))的機(jī)會(huì)與能力上的差異。簡(jiǎn)約來(lái)說(shuō),觀察數(shù)位落差可以從接近使用電腦及網(wǎng)絡(luò)的機(jī)會(huì)、以及對(duì)于電腦及網(wǎng)絡(luò)的使用能力這兩大方面來(lái)看。一方面,資訊科技使大眾的生活質(zhì)素得到改善,并把繁瑣的日常工作簡(jiǎn)化。另一方面,對(duì)于未能享用同等資訊科技的人,卻要繼續(xù)沿用舊有的方式去工作,不能透過(guò)資訊科技去獲取資訊或把資訊增值。這當(dāng)中的差異,有可能會(huì)使社會(huì)的兩極化更趨激烈,從而令社會(huì)財(cái)富更為不平均。古籍?dāng)?shù)字化的主要介質(zhì)是計(jì)算機(jī)和網(wǎng)絡(luò),數(shù)字化古籍亦屬于數(shù)字產(chǎn)品。對(duì)古籍?dāng)?shù)字化成果利用的落差,也是網(wǎng)絡(luò)時(shí)代數(shù)字鴻溝的主要內(nèi)容。
就數(shù)字化古籍而言,數(shù)字鴻溝主要表現(xiàn)在兩個(gè)方面,一是發(fā)達(dá)地區(qū)與欠發(fā)達(dá)地區(qū)之間的不平衡,一是國(guó)外與中國(guó)本土之間的不平衡。從使用數(shù)字產(chǎn)品的載體來(lái)看,東部和沿海發(fā)達(dá)地區(qū)在電腦及網(wǎng)絡(luò)使用上,都要高于西部欠發(fā)達(dá)地區(qū)。在西部山區(qū),許多學(xué)校至今在教學(xué)過(guò)程中還較少使用電腦。在利用各種數(shù)字產(chǎn)品方面,東部同樣要高于西部。由此催生一大批數(shù)字窮人,他們與數(shù)字富人相對(duì)比,被稱(chēng)之為新一代文盲、電腦盲、科盲。他們被迫或主動(dòng)放棄信息權(quán)力,將成為十分不幸的信息窮人。其發(fā)展趨勢(shì)愈演愈烈,結(jié)果是富者愈富而窮者愈窮。地處西部的多數(shù)高校和科研機(jī)構(gòu),無(wú)力購(gòu)買(mǎi)數(shù)字化古籍等產(chǎn)品,在科研和教學(xué)方面遠(yuǎn)遠(yuǎn)落后于發(fā)達(dá)地區(qū)。數(shù)字鴻溝導(dǎo)致的區(qū)域?qū)W術(shù)落差,可視為信息時(shí)代學(xué)術(shù)異化之一端。此僅就國(guó)內(nèi)而言。
從國(guó)際方面看,同樣出現(xiàn)數(shù)字鴻溝現(xiàn)象。以北京愛(ài)如生數(shù)字化公司產(chǎn)品銷(xiāo)售為例。作為目前國(guó)內(nèi)最大的數(shù)字化公司,其產(chǎn)品涵蓋多方面,主要特征是古籍依類(lèi)集成。以下是該公司部分產(chǎn)品網(wǎng)絡(luò)報(bào)價(jià)情況:中國(guó)基本古籍?dāng)?shù)據(jù)庫(kù),網(wǎng)絡(luò)報(bào)價(jià)(單機(jī)版)100萬(wàn)元;近代報(bào)刊庫(kù)(收書(shū)數(shù)量3000種),網(wǎng)絡(luò)報(bào)價(jià)(單機(jī)版)42萬(wàn)元;網(wǎng)絡(luò)報(bào)價(jià)(單機(jī)版)為60萬(wàn)元的數(shù)據(jù)庫(kù)有9種,分別是中國(guó)方志庫(kù)(初集)(收書(shū)2000種)、中國(guó)類(lèi)書(shū)庫(kù)(收書(shū)300種)、中國(guó)經(jīng)典庫(kù)(儒典)(收書(shū)2000種)、中國(guó)經(jīng)典庫(kù)(道藏)(收書(shū)2000種)、中國(guó)俗文庫(kù)(初集)(收書(shū)2000種)、敦煌文獻(xiàn)庫(kù)(初集)(收書(shū)數(shù)量不詳)、中國(guó)譜牒庫(kù)(初集)(收書(shū)2000種)、中國(guó)叢書(shū)庫(kù)(初集)(收書(shū)4000種)、歷代別集庫(kù)(明前編)(收書(shū)1800種)。[16]此處不憚其煩地轉(zhuǎn)述數(shù)字化產(chǎn)品的網(wǎng)絡(luò)報(bào)價(jià),無(wú)非是想說(shuō)明:一、這些數(shù)據(jù)庫(kù)對(duì)從事科研的學(xué)者來(lái)說(shuō)非常重要,因其資料較為齊全,影響學(xué)術(shù)成果的前瞻性和權(quán)威性;二、由于價(jià)格因素,這些數(shù)字產(chǎn)品不僅個(gè)人無(wú)力購(gòu)買(mǎi),甚至一般普通高校和科研機(jī)構(gòu)也無(wú)能為力;三、大型數(shù)據(jù)庫(kù)的購(gòu)買(mǎi)者要么是國(guó)家級(jí)的科研機(jī)構(gòu),比如中國(guó)國(guó)家圖書(shū)館和中國(guó)國(guó)家博物館,要么是國(guó)外的一些科研機(jī)構(gòu),如美國(guó)國(guó)會(huì)圖書(shū)館和德國(guó)柏林大學(xué)圖書(shū)館等。其結(jié)果就是,一方面,發(fā)達(dá)地區(qū)和政治中心區(qū)域越來(lái)越占據(jù)優(yōu)勢(shì),拉大與落后地區(qū)的數(shù)字產(chǎn)品利用差距,另一方面,很可能若干年后國(guó)外科研機(jī)構(gòu)在古籍?dāng)?shù)字化產(chǎn)品的占有量方面超出中國(guó),因而在對(duì)中國(guó)古代文化和文明的研究成果上反超中國(guó)。這看似危言聳聽(tīng)的推測(cè),正是數(shù)字化帶來(lái)的學(xué)術(shù)異化的另一種表征。其原因,一如美國(guó)學(xué)者杰弗里·A.賴(lài)德伯格-科克斯不無(wú)憂(yōu)慮地指出的:“具有諷刺意味的是,這種具有潛力、從根本上改變學(xué)者完成他們工作的工具,由主要追求商業(yè)利益,而不是出于研究和教學(xué)需要的環(huán)境驅(qū)動(dòng),正在茁壯地生根發(fā)展?!盵17]這種現(xiàn)象,確實(shí)需要警惕和反思。
四、技術(shù)偽裝學(xué)問(wèn)
所謂技術(shù)偽裝學(xué)問(wèn),指的是在信息時(shí)代利用數(shù)字產(chǎn)品為學(xué)術(shù)服務(wù)的負(fù)面效應(yīng)。正面效應(yīng)當(dāng)然是正確利用現(xiàn)代信息技術(shù)為學(xué)術(shù)服務(wù)。但是在實(shí)際使用過(guò)程中總會(huì)產(chǎn)生與之相反的效果。以古典文學(xué)研究為例:比如古籍校點(diǎn),不去調(diào)查版本情況,直接下載《四庫(kù)全書(shū)》或《四部叢刊》等電子文獻(xiàn),簡(jiǎn)單處理后即刊發(fā)印行。作家研究資料匯編,僅憑關(guān)鍵詞檢索以致造成斷章取義。詩(shī)文集的箋注,直接復(fù)制《漢語(yǔ)大詞典》的字詞解釋?zhuān)鴮?duì)詩(shī)歌本身所關(guān)涉的人事時(shí)地及詩(shī)歌意蘊(yùn)鮮有揭示。在考證文章中,本來(lái)兩三個(gè)代表性的例子足以說(shuō)明問(wèn)題,卻偏要列出幾十個(gè)例子以顯博學(xué)。這些都是技術(shù)偽裝學(xué)問(wèn)的表現(xiàn)。究其成因,與以下兩方面原因密不可分。
其一,長(zhǎng)期使用電腦和網(wǎng)絡(luò)從事研究工作,習(xí)慣與數(shù)字化產(chǎn)品打交道,使得研究者過(guò)于依賴(lài)信息工具,離開(kāi)這些工具就顯得非常弱智,甚至無(wú)法工作。這是因?yàn)椤斑^(guò)于依賴(lài)檢索系統(tǒng)會(huì)逐漸滋長(zhǎng)我們的惰性??茖W(xué)本身就是一把雙刃劍,人體感官在享受數(shù)字化優(yōu)裕的同時(shí)也逐漸退化,數(shù)字檢索在方便之余也逐漸吞噬我們的思維?!盵18]與傳統(tǒng)治學(xué)相比較,數(shù)字化時(shí)代學(xué)者的思維方式和研究方法都發(fā)生很大的變化。傳統(tǒng)時(shí)代,學(xué)術(shù)問(wèn)題大都從閱讀中得來(lái),解決問(wèn)題還要回到閱讀中去。但數(shù)字化時(shí)代則往往主題先行,即先有題目再去論證。這種本末倒置的做法導(dǎo)致的不良后果是偽命題及偽學(xué)術(shù)的層出不窮。其實(shí),電子化時(shí)代更需要學(xué)者的識(shí)見(jiàn)和智慧,賣(mài)弄學(xué)問(wèn)已經(jīng)不足以振聾發(fā)聵。
其二,研究者被海量信息淹沒(méi),進(jìn)退無(wú)據(jù),無(wú)所適從。海量信息的積極方面是為涸澤而漁式的研究提供基本條件,但另一方面信息爆炸又阻礙了學(xué)術(shù)前進(jìn),原因是“沒(méi)有控制的和沒(méi)有組織的信息不再是一種資源。它倒反而成為信息工作者的敵人”。[19]特別是無(wú)價(jià)值的垃圾信息的泛濫,導(dǎo)致人們陷入信息過(guò)度、信息麻痹的困境。同時(shí),很多有價(jià)值的信息也可能被忽略。人們特別容易“喪失自己的自主性,喪失反思和批判的能力,成為信息爆炸的奴隸,被信息洪流所異化?!盵20]當(dāng)研究者在信息的汪洋大海中難以適從,當(dāng)學(xué)術(shù)被技術(shù)主宰,技術(shù)偽裝學(xué)問(wèn)就在所難免,大量論文的思維定勢(shì)和材料堆砌、著作的個(gè)性缺失和思想貧乏以及相關(guān)種種現(xiàn)象充斥學(xué)界也就不足為奇了。
五、去異化之對(duì)策
以上分析了古籍?dāng)?shù)字化或可導(dǎo)致的學(xué)術(shù)異化諸種情形。如何避免或去除異化,本文以為可從以下三方面思考。
其一,充分利用知識(shí)組織系統(tǒng)。所謂知識(shí)組織系統(tǒng),是一種機(jī)器可理解的系統(tǒng),即可以被計(jì)算機(jī)系統(tǒng)所識(shí)別、讀取和理解的系統(tǒng)。在古籍?dāng)?shù)字化過(guò)程中利用知識(shí)組織系統(tǒng),核心工作是要做到關(guān)鍵詞檢索轉(zhuǎn)換為概念檢索。如上所述,關(guān)鍵詞查找的最大特點(diǎn)是詞形匹配而非詞義匹配。概念檢索的最大特點(diǎn)是在檢索過(guò)程中,與檢索詞同義的各種概念也同時(shí)被檢索,因此檢索結(jié)果更完整更全面。與關(guān)鍵詞檢索相較,概念檢索解決了幾個(gè)難題。一是檢索詞的選擇。比如要在《四庫(kù)全書(shū)》中檢索與文學(xué)傳播相關(guān)的資料,但古人并不常用“傳播”這個(gè)概念,因而就無(wú)法查找《四庫(kù)全書(shū)》中蘊(yùn)藏的大量的傳播資料。概念檢索則可以解決這個(gè)問(wèn)題。因?yàn)椤皞鞑ァ辈辉僮鳛橐粋€(gè)詞語(yǔ),而是作為一個(gè)同義詞的集合構(gòu)成的一個(gè)概念被檢索,因而與“傳播”相關(guān)的所有信息都能檢索出來(lái)。二是提高檢索準(zhǔn)確率。關(guān)鍵詞查找在用戶(hù)的檢索詞和文獻(xiàn)的關(guān)鍵詞間進(jìn)行詞形匹配,即以詞的拼寫(xiě)一致為依據(jù)。自然語(yǔ)言中一義多詞(同義詞)使檢全率難以保證,一詞多義(多義詞)導(dǎo)致檢索出無(wú)關(guān)的文獻(xiàn),使檢準(zhǔn)率降低。概念檢索則可以避免這種情況發(fā)生,最大程度提高檢準(zhǔn)率。三是檢索結(jié)果按語(yǔ)義排序。關(guān)鍵詞檢索結(jié)果主要是按照文獻(xiàn)的自然順序來(lái)排序,很難進(jìn)行語(yǔ)義排序。概念檢索則可以從檢索詞的語(yǔ)義相關(guān)度上對(duì)大量的結(jié)果進(jìn)行分級(jí)、排序和組織,從而便于檢索者的使用。這方面的研發(fā)已有所進(jìn)展,比如北京大學(xué)李鐸教授的《全宋詩(shī)》“本體庫(kù)”[21]、臺(tái)灣元智大學(xué)羅鳳珠先生的唐詩(shī)宋詞語(yǔ)義檢索系統(tǒng)[22],都是較有價(jià)值的例子。
其二,努力縮小數(shù)字產(chǎn)品利用差距。如何縮小數(shù)字鴻溝,可以從古籍?dāng)?shù)字化研發(fā)主體進(jìn)行思考。數(shù)字化研發(fā)主體是多元性的,主要包括圖書(shū)館、學(xué)術(shù)科研機(jī)構(gòu)、個(gè)人、出版社、數(shù)字公司、聯(lián)合體。[23]前三者的共同特征是公益性質(zhì),其數(shù)字化成果大都免費(fèi)(或部分收費(fèi))。出版社和數(shù)字公司則是純商業(yè)性質(zhì),主要目的是盈利。聯(lián)合體是指圖書(shū)館、科研學(xué)術(shù)機(jī)構(gòu)、個(gè)人、出版社、數(shù)字公司等之間的跨行業(yè)的協(xié)作體。聯(lián)合體將公益性與商業(yè)性相結(jié)合,整合了先進(jìn)的數(shù)字化技術(shù)和人才,集成了相關(guān)古籍?dāng)?shù)字化主體的優(yōu)勢(shì),產(chǎn)品主要是古籍全文數(shù)據(jù)庫(kù),比如《中國(guó)基本古籍?dāng)?shù)據(jù)庫(kù)》、《四庫(kù)全書(shū)》電子版等,規(guī)模較大,質(zhì)量也屬上乘,因此,應(yīng)該是古籍?dāng)?shù)字化開(kāi)發(fā)主體的一種發(fā)展方向。
其三,正確利用古籍?dāng)?shù)字化成果。需從以下諸方面著手。第一,觀念上確立工具本位意識(shí)。在學(xué)術(shù)研究過(guò)程中,電腦和人工智能永遠(yuǎn)只能是一種輔助工具,而不能替代學(xué)術(shù)本身。計(jì)算機(jī)雖然在一定程度上能夠模擬人的思考,甚至在某些方面要比人強(qiáng)得多,但是它不具備人類(lèi)最本質(zhì)的創(chuàng)造性思維。舉例來(lái)說(shuō),比如??惫ぷ鳎诒鎰e不同版本文字異同方面,可能計(jì)算機(jī)要比人完成得更好。但一般的???,在比較文字異同之外,判斷是非更為重要。這種判斷是非的能力決不是設(shè)計(jì)某種電腦語(yǔ)言程序所具備的,因?yàn)檫@需要深厚的學(xué)術(shù)涵養(yǎng)和學(xué)術(shù)積累。第二,變被動(dòng)應(yīng)用為主動(dòng)應(yīng)用。長(zhǎng)期以來(lái),由于使用者較少參與古籍?dāng)?shù)字化過(guò)程,對(duì)數(shù)字化各種相關(guān)技術(shù)不了解,即便有所參與但亦知之不深,因而在使用過(guò)程中處于被動(dòng)地位,只能“傻瓜式”地按照設(shè)計(jì)者的規(guī)定來(lái)使用。提高利用主體的信息素養(yǎng),讓更多人文和社科領(lǐng)域的專(zhuān)家學(xué)者參與到古籍?dāng)?shù)字化過(guò)程當(dāng)中,建構(gòu)數(shù)字人文科學(xué),變被動(dòng)為主動(dòng),是正確利用數(shù)字化成果的一條光明路徑。第三,為我所用,創(chuàng)建具有個(gè)性化的獨(dú)具特色的數(shù)據(jù)庫(kù)。筆者曾多次論及這個(gè)問(wèn)題,以古代類(lèi)書(shū)的編纂等為例來(lái)說(shuō)明個(gè)性化數(shù)據(jù)庫(kù)創(chuàng)建的方法及其重要性。[24]此外,還可以把數(shù)據(jù)庫(kù)與計(jì)量分析方法結(jié)合起來(lái),共同服務(wù)于學(xué)術(shù)研究。[25]總而言之,只有積極正確利用數(shù)字化成果,才能更好地迎接信息時(shí)代的新挑戰(zhàn),推動(dòng)學(xué)術(shù)健康發(fā)展。
注釋?zhuān)?/strong>
[1]陳力《中國(guó)古籍?dāng)?shù)字化的現(xiàn)狀與展望》,《古籍整理出版情況簡(jiǎn)報(bào)》2004年第4期。
[2]耿元麗《三十年來(lái)中國(guó)古籍?dāng)?shù)字化研究綜述(1979-2009)》,見(jiàn)http://www.ffhyjd.com/wk/000652.htm。
[3]蘇軾《李氏山房藏書(shū)記》,《蘇軾文集》卷十一,中華書(shū)局1986年版,第359頁(yè)。
[4]葉夢(mèng)得《石林燕語(yǔ)》卷八,中華書(shū)局1984年版,第116頁(yè)。
[5]査屏球《紙簡(jiǎn)替代與漢魏晉初文學(xué)新變》,《中國(guó)社會(huì)科學(xué)》2005年第5期。
[6]劉躍進(jìn)《紙張的廣泛應(yīng)用與漢魏經(jīng)學(xué)的興衰》,《學(xué)術(shù)論壇》2008年第9期。
[7](日)清水茂《紙的發(fā)明與后漢的學(xué)風(fēng)》,見(jiàn)《清水茂漢學(xué)論集》,中華書(shū)局2003年版,第22頁(yè)。
[8]朱迎平《宋代刻書(shū)產(chǎn)業(yè)與文學(xué)》,上海古籍出版社2008年版。
[9](臺(tái))張高評(píng)《印刷傳媒與宋詩(shī)特色》,臺(tái)北里仁書(shū)局2008年版。
[10]劉躍進(jìn)《紙張的廣泛應(yīng)用與漢魏經(jīng)學(xué)的興衰》,《學(xué)術(shù)論壇》2008年第9期。
[11]呂乃基《技術(shù)遮蔽了什么?》,《哲學(xué)研究》2010年第7期。
[12]黃一農(nóng)《兩頭蛇:明末清初的第一代天主教徒》(自序),上海古籍出版社2006年版。
[13]熊熊《e時(shí)代的兩頭蛇》,臺(tái)灣《“中央研究院”近代史研究所集刊》第59期(2008年3月)。
[14]王軍《數(shù)字圖書(shū)館的知識(shí)組織系統(tǒng)——從理論到實(shí)踐》,北京大學(xué)出版社2009年版,第5頁(yè)。
[15]王兆鵬《三大功能:對(duì)未來(lái)數(shù)字化古籍的期待》,《中國(guó)社會(huì)科學(xué)院院報(bào)》2007年9月18日版。
[16]參考愛(ài)如生公司官方網(wǎng)站:http://www.er07.com。
[17](美)杰弗里·A.賴(lài)德伯格-科克斯《挑戰(zhàn)數(shù)字圖書(shū)館和數(shù)字人文科學(xué)》,朱常紅譯,廣西師范大學(xué)出版社2010年版,第76頁(yè)。
[18]吳夏平《數(shù)據(jù)庫(kù)與古代文學(xué)研究》,《光明日?qǐng)?bào)》(理論版),2004年9月29日版。
[19]奈斯比特《大趨勢(shì)——改變我們生活的十個(gè)新趨向》,孫道章等譯,新華出版社1984年版,第32頁(yè)。
[20]孫偉平《論信息時(shí)代人的新異化》,《哲學(xué)研究》2010年第7期。
[21]李鐸《從檢索到分析》,《文學(xué)遺產(chǎn)》2009年第1期。
[22]羅鳳珠《引信息的“術(shù)”入文學(xué)的“心”》,《文學(xué)遺產(chǎn)》2009年第1期。
[23]王立清《關(guān)于多元古籍?dāng)?shù)字化主體的探討》,《圖書(shū)館學(xué)研究》2011年第7期。
[24]吳夏平《古籍?dāng)?shù)字化與文獻(xiàn)利用》,《中國(guó)社會(huì)科學(xué)院院報(bào)》2007年9月18日版。
[25]尚永亮《數(shù)據(jù)庫(kù)、計(jì)量分析與古代文學(xué)研究的現(xiàn)代化進(jìn)程》,《文學(xué)評(píng)論》2007年第6期。
(作者單位:貴州師范大學(xué)文學(xué)院貴陽(yáng)550001;北京大學(xué)中文系北京100871)