論古籍數字化與現代學術進程
(貴州師范大學文學院? 貴州? 貴陽? 550001)
提要:從技術與學術之關系的歷史經驗來看,古籍數字化是繼紙張和印刷之后影響學術走向的第三個重要關捩。其影響學術活動主要表現為五個方面,一是學術研究愈來愈成為技術活,二是檢索替代閱讀,使記憶力衰退,三是發表方便,四是傳播速度加快,五是抄襲剽竊成本降低。綜合來看,時下流行的“e考據”集中了各種要素,實為其典型代表。總體來看,技術引領學術是數字化時代學術研究的最大弊病。去弊之法有四:其一,充分發揮e時代和e文本的特點,揚長避短,創建為我所用的數據庫;其二,技術與學術互補,去“心”“智”之隔;其三,消除人為屏蔽,實現區域資源共享;其四,堅持漢文化中心本位,防止“數位落差”。
關鍵詞:古籍數字化;現代學術進程;歷史經驗;e考據;數位落差
一
與科學技術相比,人們或許更愿意將學術與政治環境或社會思潮等“心理”活動聯系在一起,而忽視了與“物理”之科技的對接。比如梁啟超先生概論清代學術,借用生住異滅等佛教術語來論述時代思潮對學術整合分化的影響,其著眼點即在于精神活動。【1】但事實上,科技對學術進程的影響巨大,正如李約瑟博士所說:“在整個人類文明史中,沒有比紙和印刷的發明更重要的了。”【2】筆者以為影響中國學術進程的科技活動,有三個重要的關捩,一是紙的發明,二是印刷的流行,三是網絡信息技術(古籍數字化為其中之一)。前二者對學術產生巨大作用,業已被歷史證明,現代信息技術左右學術趨向也初露端倪。
不過,人們在認識科技與學術之關系時,往往從積極方面入手。比如紙張的發明和應用,促進書籍的出版和文學的繁榮。發生在漢末魏晉時期的紙簡替代在當時最大限度地促使文化傳播,在速度、廣度和深度等方面都極大地促成文化下移和知識普及。【3】雕版印刷的積極作用也被充分認識。兩宋時期的刻書最大限度地促進教育文化傳播,并且作為一種產業加速商業經濟的發展,改變都市文化的布局,對文學的發展也產生巨大影響。【4】
科技對學術的負面作用卻鮮少提及。不講或少講并不等于不存在。事實上,早在北宋蘇軾等人已經開始思考印刷流行對文人的影響。蘇軾曾謂:“自孔子圣人,其學必始于觀書,……自秦漢以來,作者益眾,紙與字畫日趨于簡便,而書益多,世莫不有,然學者益以茍簡,何哉?余猶及見老儒先生,自言其少時欲求《史記》、《漢書》而不可得,幸而得之,皆手自書,日夜誦讀,惟恐不及。近歲市人轉相摹刻,諸子百家之書,日傳萬紙,學者之于書,多而且易致如此,其文詞學術,當倍蓰于昔人,而后生科舉之士,皆束書不觀,游談無根,此又何也?”【5】359書籍多且易得,反而使記憶力衰退。對此問題,葉夢得亦頗有體悟,其《石林燕語》云:“唐以前,凡書籍皆寫本,未有模印之法,人以藏書為貴,人不多有,而藏者精于讎對,故往往皆有善本;學者以傳錄之艱,故其誦讀也精詳。五代馮道始奏請官鏤《六經》版印行,國朝淳化(990-994)中,復以《史記》、《前》《后漢》付有司摹印,自是書籍刊鏤者益多,士大夫不復以藏書為意,學者易于得書,其誦讀亦因滅裂。然板本初不是正,不無訛誤,世既一以板本為正,而藏本日亡,其訛謬者遂不可正,甚可惜也。”【6】116葉氏指出刻本書籍廣泛傳播后的兩個弊端,一是讀書人誦讀滅裂,和蘇軾的擔憂相同;二是刻本流行后,其據以刊刻的藏本反而不為重視,導致訛謬之處無法刊正。這與今日數字化時代的弊病何其相似。
古籍數字化與紙和印刷的發明一樣,雖然對學術產生這樣或那樣的負面作用,但它的進程是歷史的必然,無可逆轉。從歷史的經驗來蠡測數字化進程,必然存在兩個特點。一是數字化古籍最終取代紙本書籍,二是這個過程是漫長的。從歷史來看,紙書取代簡冊,印刷取代抄寫,都經歷了相當長的過程。原因之一是經濟成本的降低需要技術改進的支持,有一個較長的過程。比如紙張一開始很稀有,只有特權階層才可以享用,隨著技術改進和成本降低才逐漸普及,為普通大眾能承受。印刷也是同樣,一開始成本相當高,只有少數人能享用,隨著技術的改進和商業化,印刷成本逐漸降低,普通大眾才可享用。原因之二是觀念的變化。漢末魏初重簡輕紙,對粗糙的紙張并不認同,紙的應用往往與下層俗文化連在一起。但最終紙張的輕便迅捷等好處慢慢為人接受,逐漸取代簡冊。最初的刻本書籍同樣是被視為俗的,不為文士所重。由于刻本在數量和質量上的優勢越來越明顯,漸次取替寫本。紙簡替代的完成約在魏晉時代,刊本取替寫本也要等到明清刻書產業的全面興隆之后。可見,這兩個階段都經歷了較長一段時期。可以設想,電子文本全面取代紙本同樣是一個漫長的過程,比如電子出版物得到官方認可,電子文獻征引具有“合法性”,各種電子書籍和電子商品全面普及等等,均需假以漫長的時日。而現在,我們正處于紙本與電子文本(數字化文本)共存的時代。
和歷史相比較,共存時代的古籍數字化對學術的影響主要有以下幾個特點。其一,知識共同體,學術研究愈來愈成為技術活。文獻資料多且易得,只是熟練與否的區別。但在古代,遠不是這樣。比如清代徐松等人利用修《四庫全書》的機會,得以觀覽宮中秘籍如《永樂大典》之類,撰寫了不少質量甚高的著作,像《唐兩京城坊考》、《登科記考》等皆是。假若沒有入宮的機會,要完成這樣的著作是很難想象的。再比如《四庫全書》原為宮廷珍寶,一般人根本不可能有機會翻讀。陳垣少時讀《四庫全書總目提要》,曾自嘆今生可能無望讀到《四庫全書》。1915年,文淵閣《四庫全書》搬運至北京京師圖書館。陳垣每天租一架驢車到圖書館閱讀《四庫全書》,有時遇上風霜雨雪,來回要三四個小時。這是何等的艱難,但就這樣,陳垣一讀就是十年。徐松和陳垣的學問高深精博,很大一部分是因為他們要比同時代的其他學者占有更多文獻優勢。但在古籍數字化的今天,這種優勢不復存在。對大多數研究人員來說,能利用的文獻材料幾乎不存在量上的差異。其二,后寫本時代,檢索替代閱讀,使所有學者記憶力衰退。其三,發表的方便,人人皆是寫手。其四,傳播速度加快。其五,抄襲剽竊成本降低。這些特點是古籍數字化影響學術研究的不同層面的表現。綜合起來看,時下流行的“e考據”集中了各種要素,實為其典型代表。以下僅以“e考據”為例,分析e時代學術研究的利弊。
二
什么是e考據?一般認為,最早提出這個概念的是臺灣新竹清華大學黃一農教授。黃先生曾在《兩頭蛇:明末清初的第一代天主教徒》的自序中強調:“隨著出版業的蓬勃以及圖書館的現代化,再加上國際網路和電子資料庫的普及,新一代的史學工作者常擁有博聞強記的前輩學者們夢寐以求的環境。我們有機會在很短時間內就掌握前人未曾寓目的材料,并填補探索歷史細節時的許多隙縫,或透過邏輯推理的布局,迅速論斷先前待考的疑惑或者矛盾。事實上,一個有機會孕育‘e-考據學派’的時代或已出現。”【7】氏著在大陸出版簡體字本后,得到一批文史研究者的稱譽。又加上作者勤于講述,先后到多家大學講學推廣,于是“e-考據”和“e-考據學派”的說法在學界迅速風行。
究其實質,“e考據”無非還是要盡可能最大限度地占有和利用材料,與七十多年前傅斯年主張的“上窮碧落下黃泉,動手動腳找材料”別無二致。一農教授認為在當今這個網絡發達、數字化古籍庫蓬勃發展的時代,科學合理地利用現代科技手段,涸澤而漁式地占有材料并解決學術問題是可以實現的。誠然,e考據在某些方面要比傳統考據更有效率,比如要比傳統考據單純用人腦和手工的閱讀、記憶、分類和排比,在廣度、速度和準確性方面都有很大的提高。同時,e考據能在合理時間內進行先前較難施行的分析,并因此有機會開創新的研究格局。但它永遠只能是輔助性的。這是因為從理論上來說,利用網絡和數字化古籍不可能真正做到材料上的涸澤而漁。在利用時,至少經過了雙重過濾。第一重,發展至今日的,各種科研機構和商業公司制作的數字化古籍庫,雖然已經是海量了,但并沒有也無法將所有的古籍全部數字化。不要說那些極其珍貴的古籍一般很難見到,就是散落在民間的比如族譜之類的文獻也是很難得到的。而現在能運用的大多是較為常見的文獻。換句話來說,很多文獻資料沒有上網,沒有數字化,必須回到圖書館。第二重,研究人員的檢索,是第二次過濾,即在某一固定的數字化古籍庫中也無法做到涸澤而漁。因為很多時候只能是點對點的檢索,而無法完成多元或關聯檢索。王兆鵬先生曾提出對數字化古籍的三個期待,其中就說到在《四庫全書》電子版中檢索“蘇軾”的資料,只能檢索到包含有“蘇軾”二字的資料,卻不能檢索到不含“蘇軾”二字、卻含有“東坡”、“子瞻”、“大蘇”、“蘇徐州”、“蘇黃”等與蘇軾有關的資料,因為《四庫全書》電子版不能自動識別“東坡”、“子瞻”、“大蘇”、“蘇徐州”等就是蘇軾。由此提出“今后數字化古籍,如果能由單一檢索變為多元檢索、由定向檢索變為關聯檢索、由靜態檢索變為動態檢索,那就更好了。”【8】
那么,王先生的期望有沒有實現呢?就目前來看,其中部分已得到解決。比如北京大學的李鐸教授已突破原先用于檢索格律詩的數字模型(字符串),以及用于檢索重出詩的數學計算模型(膜),建立了用于分析宋代詩人與文化之關系的《全宋詩》的“本體庫”。【9】臺灣元智大學的羅鳳珠先生也對唐宋詩詞的檢索功能進行了改造,使全文檢索功能從傳統的“字形辨識”之全文檢索進展為以“語義辨識”之語義概念全文檢索。【10】此外似乎還局限于文獻形態的轉換上,只能提供點對點的字符檢索。總體來看,要在短時間內全面實現智能檢索恐怕還很難。
在《兩頭蛇》一書中,作者雖然利用網絡文獻和數字化古籍相當宏富,多達1099種。但即便如此,也難免出現將瞿汝夔的母親支氏誤認為譚氏的錯誤。其成因正如學者所指出的,并非檢索本身出了問題,而是他檢索的數千種文獻中沒有關鍵性的瞿氏家譜。【11】由此可見,檢索本身沒有問題,但將視野局限于網絡提供的數字化文獻范圍,則這種“e考據”是非常危險的。因此,必須重新審視e考據。它與傳統考據學的關系在于,現代檢索手段給學術研究提供了非常不一樣的天地,通過電子資料庫和正確的檢索方法,e時代的文史工作者可以做到很多傳統時代做不到的事。誠然,e考據是搜集材料的一個現代手段,但是這個現代手段是以傳統文史的積累為基礎,以對現代技術的掌握為前提的,而只有兩種能力兼備,才能夠在e時代進行e考據,并取得相當的成果。【12】
三
技術引領學術是古籍數字化時代學術研究的最大弊端,但表現在個體和社會群體上又不盡相同。個體方面主要是研究者的惰性和迷失。先說惰性。長期使用網絡和各種古籍庫的研究方式,使研究者逐漸養成勤于檢索的工作習慣,以致形成依賴,離開網絡就無法工作。比如利用中文期刊網、超星數字圖書館、《中國基本古籍庫》、《國學寶典》、《四庫全書》、《四部叢刊》,以及各種其它類型的古籍庫,很有一種“坐擁書城”的感覺。因此之故,很少去查閱原典,更不用說閱讀紙質原典了。惰性的弊害不只是在閱讀方面,更在于由此導致的思維懶惰和視野狹窄。【13】再說迷失。海量信息讓人無所適從。若能執簡馭繁,恰當地處理信息,則利大于弊;若不能排除無用信息的干擾,如同“一部十七史,從何說起”,則弊大于利。技術引領學術的弊病表現在社會層面則為“隔”。“隔”,因隔閡隔膜形成差距,“不隔”,即融通無礙。數字化進程中的“隔”,主要源于行業、機構、區域、國際等方面差異。不僅阻礙古籍數字化進程,而且可能使漢文化失去中心本位。結合上述種種弊病,筆者以為當從以下幾方面著手除病去弊。
其一,充分發揮e時代和e文本的特點,揚長避短。強調突破局限,與傳統研究方法相結合,二者互補。其主要途徑是充分發揮電子文本易于搜檢統計的功能,創建適合的數據庫,利用計量分析方法解決學術問題。數據是證據的延伸和擴大,建構文史專業數據庫是學術研究現代化的必然要求,而運用計量分析方法則既構成傳統歷史文化研究法的一大輔助和補充,也成為使學術研究更具科學性、客觀性和準確性的重要途徑。計量分析的好處,還在于人類社會中“可以計量的領域有助于我們解釋那些不可計量的領域。” 【14】尚永亮先生曾結合個人研究心得,提出利用數據庫進行研究的一些基本原則,很有參考價值。比如力求基本數據的準確;運用相關數據,對研究對象進行多角度、多層面的分析,使數據盡可能地發揮其利用價值;將研究對象納入系統框架內,從相互關聯和比較中把握其特點和本質屬性。【15】創建數據庫之外,還可以利用e時代海量信息的特點,補充前人之未備;亦可利用e時代搜檢精細的特點,從關系學的角度側重于人的關系研究。
其二,技術與學術互補,去“心”“智”之隔。技術與學術本可互相促進,但長期以來各行其是。數字化工作者不搞學術,從事學術者技術水平不高,兩相脫節。應讓更多的科技工作者進入文史研究領域,也讓更多的文史工作者進入數字化行業,兩相溝通,有利于數字化的良性發展。同時,政府和教育部門應從學科建設的高度著眼,認可并在較廣的范圍內設置電子文獻科研機構,用以培養相關學科人才。
其三,區域資源互補,消除人為屏蔽。在一個小范圍內加強合作,實現資源共享是較容易的。比如同校、同區、同城、同省都易于合作,實現資源有效利用。但是區域一旦擴大,則合作不易。比如全國各地都藏有地方特色文獻,從保護和利用出發,大都已數字化,創建了各具特色的數據庫。但這部分精神遺產,實際上只有很少一部分人在享用。不過,加強區域合作,真正做到資源共享,只有政府行為才可能實現,以個人力量是無法做到的。
其四,堅持漢文化中心本位,防止“數位落差”。數位落差,亦作數碼鴻溝、數碼隔膜或數碼差距,是指社會上不同性別、種族、經濟、居住環境、階級背景的人,接近使用數位產品(如電腦或是網絡)的機會與能力上的差異。數字化古籍的數位落差不僅表現在國內的不同區域之間,也表現在國際上。國內沿海發達地區與西部欠發達地區之間的差距雖有增無減,但總體上不影響數字化進程。最應該關注的是國際之間的數位落差。一些從事古籍數字化的商業公司,研制開發出大量的集成性大型軟件,其價格高得驚人,動輒數十萬甚至幾百萬,在國內不僅個人無力購買,即便是科研機構也得思量再三。因此,這些數字產品的銷售對象就從國內轉向國外,特別是一些經濟發達的國家。長此以往,本是以漢文化為中心的古籍數字化產品,外國人倒比中國人擁有得更多更精。其結果,域外漢學家最后成了真正的中國專家了。
四
歷史經驗告訴我們,任何一種新生事物出現,必然是利弊相伴。發掘其利之時,亦要充分估計其弊。只有這樣,才能更好地發揮它的長處而為我所用。古籍數字化同樣是這樣的。它的各種有利于現代學術的方面,應當合理利用。但認識到其有弊于學術的一面,卻能使我們更好地加以改進,推動它的進程。
可以預言,盡管其過程是漫長的,但電子文本最終必然全面取代紙本書籍。當電子文本、電子期刊、電子文獻征引等獲得合法地位之日,也正是無紙化學術研究到來之時。數字化古籍作為其中重要組成部分,必然發揮它的無可替代的作用。但同時,我們要充分估計e時代出現的各種問題。比如從技術層面看,所謂e考據,無非就是傳統考據學在信息技術時代的延伸,無法脫離傳統學術的指導。而更重要的是e時代產生的個人和社會問題,使我們不得不思考應對之法。如何驅除惰性,如何擺脫海量信息的困擾,如何“心”“智”互補,如何消除區域差異,如何防止數位落差,等等,都需要積極思考共同面對。而以上,則是個人的一些鄙見,以祈方家指正。
參考文獻:
【1】梁啟超.清代學術概論【M】.上海:上海古籍出版社,2005.
【2】 (英)李約瑟,錢存訓著,劉祖慰譯.中國科學技術史:第五卷第一分冊紙和印刷(序)【M】.北京:科技出版社,1990.
【3】查屏球.紙簡替代與漢魏晉初文學新變【J】.中國社會科學,2005(5).
【4】朱迎平.宋代刻書產業與文學【M】.上海:上海古籍出版社,2008.
【5】蘇軾.蘇軾文集【M】.北京:中華書局,1986.
【6】葉夢得.石林燕語【M.北京:中華書局,1984.
【7】黃一農.兩頭蛇:明末清初的第一代天主教徒【M】.上海:上海古籍出版社,2006.
【8】王兆鵬.三大功能:對未來數字化古籍的期待【M】.中國社會科學院院報,2007-09-28.
【9】李鐸.從檢索到分析【J】.文學遺產,2009(1).
【10】羅鳳珠.引信息的“術”入文學的“心”【J】.文學遺產,2009(1).
【11】熊熊.e時代的兩頭蛇【J】,臺灣“中央研究院”近代史研究所集刊,第59期(2008年3月).
【12】張國剛.“兩頭蛇”的行藏【J】.博覽群書,2006(7).
【13】吳夏平.數據庫與古代文學研究【J】.光明日報(理論版),2004-09-29.
【14】(英)羅德里克?弗拉德著,肖朗等譯.歷史計量法導論(導言)【M】.北京:商務印書館,1992.
【15】尚永亮.數據庫、計量分析與古代文學研究的現代化進程【J】.文學評論,2007(6).
-
Does Who Dominate the Academic?
-
——On the Relationship Between Digitization of Ancient Books and Progress of Modern Academic
WU Xia-ping
(School of Chinese Language and literature, Guizhou Normal University, Guiyang550001, China)
Abstract: From the historical experience of the relationship between technique and academic to see, digitization of ancient books is the third key element which affect the academic tend towards after the paper and printing. There are five aspects which are affected: the first is academic study is worse and worse becoming technical things; the second is that searches replace reading, so that make all scholars’ memory weaken; the third is that it is convenient to publish paper; the forth is that spread speed quicken; the fifth is that the plagiarizer cost falls. Synthetically, the nowadays fashioned ‘e textual research’ which converged diversified elements is the typical delegate. As a whole, technique leading academic is the worst shortcoming of academic study in digitization era. There are four ways to get rid of the shortcoming: first, fully developing the strongpoint of ‘e time’ and ‘e text’ to establish useful database; second, make technique and academic reinforce mutually; third, share region resource, eliminate man-made shield; forth, preserver in Sino-culture standard, avoid ‘digital fall’.
Key words: digitization of ancient books; progress of modern academic; historical experiment; e textual research; digital fall