內(nèi)容摘要:概念研究是古籍?dāng)?shù)字化研究的核心問題,探討古籍?dāng)?shù)字化概念形成的歷史過程,有助于古籍?dāng)?shù)字化概念的進一步明晰。古籍?dāng)?shù)字化概念的形成經(jīng)歷了早期實踐、術(shù)語混用和概念形成3個階段。
關(guān)鍵詞:古籍;數(shù)字化;概念研究
作者簡介:毛建軍,男,1971年生,南京大學(xué)中文系2005級博士研究生
概念研究是古籍?dāng)?shù)字化研究和開發(fā)的核心問題。沒有一個明晰的概念,古籍?dāng)?shù)字化研究必將陷入混亂的局面,古籍?dāng)?shù)字化的開發(fā)也必將走入歧途。“古籍?dāng)?shù)字化的理論問題比技術(shù)問題更為重要,因為一旦理論發(fā)生了偏差,技術(shù)越高明,則解決方案越是難以成功”[1]。正是因為缺乏古籍?dāng)?shù)字化理論的指導(dǎo),才造成了目前古籍?dāng)?shù)字化在開發(fā)理念上的千差萬別、質(zhì)量上的參差不齊和標(biāo)準(zhǔn)上的各自為政的局面。
一、古籍整理與計算機結(jié)合的早期實踐
自計算機問世以來,古籍整理就有了新的利器,這一利器就是古籍?dāng)?shù)字化。古籍?dāng)?shù)字化與計算機信息技術(shù)的發(fā)展密切相關(guān)。1971年臺灣的馬志欽教授提議利用計算機做中文資料處理研究。不久幾乎臺灣所有的大學(xué)和電子研究機構(gòu)都全力投入了這項極具潛力的領(lǐng)域[2]。1984年臺灣中研院史語所開始實施開發(fā)“史籍自動化系統(tǒng)”。該計劃由毛漢光教授倡議,謝清俊、管束東主持開發(fā)[2]。在臺灣,除了單位投資建設(shè)中文信息資料庫外,部分個人也積極投入到這項極具挑戰(zhàn)性的工作中。1987年,臺灣師大中文系教授陳郁夫也開始嘗試開發(fā)《紅樓夢》《水滸傳》的全文檢索系統(tǒng)[3]。
大陸地區(qū)計算機事業(yè)起步較晚,在古籍整理與計算機結(jié)合的實踐上較晚于臺灣。1983年,全國語言學(xué)學(xué)科規(guī)劃會議上提出要加強古籍整理和計算機的合作,促進古籍整理研究手段的現(xiàn)代化和方法的現(xiàn)代化。隨后,國內(nèi)開始了古籍整理與計算機結(jié)合的實踐。1983年秋,江蘇省“紅樓夢電腦處理”課題啟動,參加單位有鎮(zhèn)江市科委、鎮(zhèn)江市統(tǒng)計局電子計算站和江蘇省計算中心,彭昆侖擔(dān)任課題負責(zé)人[4]。1984年錢鐘書先生提出,古典文獻整理和研究應(yīng)盡早與計算機結(jié)合。在錢鐘書的倡導(dǎo)下,中國社會科學(xué)院文學(xué)研究所欒貴明、田奕等組成了研究小組,經(jīng)過艱難的探索,“全漢字系統(tǒng)”“諸子集成數(shù)據(jù)庫”“全唐詩檢索系統(tǒng)”等古典文獻數(shù)據(jù)庫相繼完成[5]。1984年9月—10月,深圳大學(xué)一批中青年學(xué)者提出讓古籍插上電腦之翼的研究計劃,開始著手開發(fā)《紅樓夢》多功能檢索數(shù)據(jù)庫[6]。1987年10月,陜西師大在編撰《十三經(jīng)辭典》和《十三經(jīng)詞語索引》的基礎(chǔ)上開始探索辭書電腦處理系統(tǒng)[7]。
在古籍整理與計算機結(jié)合的早期實踐中,臺灣和大陸是主體,但其他地區(qū)包括國外也有古籍整理與計算機結(jié)合的實踐,這些經(jīng)驗對后期的古籍?dāng)?shù)字化工作產(chǎn)生了影響。如1978年美國人P.J.Ivanhoe運用計算機編制了《朱熹大學(xué)章句索引》《朱熹中庸章句索引》《王陽明大學(xué)問索引》《王陽明傳習(xí)錄索引》《戴震孟子字義疏證索引》等[8]。1995年初,美國圖書館研究學(xué)會(RLG)與北京大學(xué)圖書館合作開發(fā)聯(lián)機中文善本目錄,為我們提供了寶貴的經(jīng)驗[9]。
古籍整理與計算機結(jié)合的實踐也引起了學(xué)術(shù)界的思考。1988年曹書杰在《古籍整理研究學(xué)刊》發(fā)表的“古籍整理與電子計算機應(yīng)用研究的思考”一文論述了古籍整理中的古籍今譯、古籍注釋、訓(xùn)詁、古籍校勘、古籍輯佚以及古籍的匯編計算機輔助等基本問題,并提出了“機整”的概念,即電子計算機參與古籍整理研究領(lǐng)域的工作[10]。
二、20世紀90年代——多種術(shù)語混用時期
20世紀90年代,隨著計算機用于古籍整理實踐的豐富和大量數(shù)據(jù)庫資源的開發(fā),學(xué)術(shù)界開始出現(xiàn)古籍電腦化、古籍自動化、古籍電子化以及古籍?dāng)?shù)字化等術(shù)語。這些術(shù)語或在論文標(biāo)題中出現(xiàn),或在行文中出現(xiàn),但都沒有具體內(nèi)涵的界定。這種現(xiàn)象反映了學(xué)術(shù)界對古籍?dāng)?shù)字化概念的模糊性,因此出現(xiàn)了如此之多的這類術(shù)語。
1990年臺灣《國文天地》為推動古籍整理中電腦的運用,特意推出專欄“科技新貴與古籍佳人的結(jié)合——中國古籍電腦化”,盡管專欄中沒有一篇文章給出“古籍電腦化”確切的定義,卻第一次提出了“古籍電腦化”的術(shù)語。1994年田奕在“古籍整理與研究的電腦化”(《中國文化》1994年第1期)一文中也使用了“古籍電腦化”。1995年臺灣元智工學(xué)院教師羅鳳珠開發(fā)出了“唐詩多媒體網(wǎng)絡(luò)系統(tǒng)”。同時,羅鳳珠還提出了古籍自動化和文史資料自動化的術(shù)語[11]。同時,在臺灣還出現(xiàn)了“古籍全文數(shù)據(jù)庫”(謝清俊、林晰“中央研究院古籍全文數(shù)據(jù)庫的發(fā)展概要”《計算中心通訊》1995年第7卷)、“古籍文獻之資訊化”(黃沛榮“古籍文獻資訊化之現(xiàn)況與檢討”《國家圖書館館刊》1997年第6期)、“珍藏文獻數(shù)字化”(薛理桂“珍藏文獻數(shù)字化之發(fā)展現(xiàn)況與展望”《國立中央圖書館臺灣分館館刊》1997年第9期)等術(shù)語。
“古籍?dāng)?shù)字化”術(shù)語最早出現(xiàn)在大陸。1996年上海圖書館啟動重點科研項目——古籍善本全文光盤,計劃將館藏古籍善本全部數(shù)字化。上海圖書館研制的中國古籍善本查閱系統(tǒng),將館藏善本古籍的全文數(shù)據(jù)以圖像形式錄入光盤,并對標(biāo)引、檢索、查閱等功能進行了開發(fā),為古籍善本的數(shù)字化作了嘗試[12]。在開發(fā)建設(shè)“古籍善本全文光盤”的過程中,上海圖書館的工作人員劉煒、陳秉仁提出了“古籍?dāng)?shù)字化”(劉煒“上海圖書館古籍?dāng)?shù)字化的初步嘗試”《圖書館雜志》1997年第4期)、“古籍善本數(shù)字化”(陳秉仁“古籍善本數(shù)字化的嘗試:中國古籍善本查閱系統(tǒng)述略”《現(xiàn)代圖書情報技術(shù)》1998年第1期)的術(shù)語。盡管劉煒、陳秉仁還沒有對“古籍?dāng)?shù)字化”的概念作界定,但他們在文中詳細介紹了上海圖書館開發(fā)建設(shè)“古籍善本全文光盤”的過程,并對“古籍影像光盤制作及檢索系統(tǒng)”的結(jié)構(gòu)、功能、配置作了全面描述。20世紀90年代,國內(nèi)各大圖書館和科研院所都積極參與古籍?dāng)?shù)字化工作。1998年底由上海世紀出版集團上海人民出版社、香港迪志文化出版有限公司推出的《文淵閣四庫全書》電子版無論從技術(shù)上還是從市場上來講,堪稱這個階段古籍?dāng)?shù)字化的杰作。
面對國內(nèi)如此豐碩的數(shù)字化成果,《中國典籍與文化》組織了“數(shù)字古籍”專欄,專題討論古籍的數(shù)字化問題。其中,陳洪瀾在“中國古籍電子化發(fā)展趨勢及其問題”(《中國典籍與文化》1998年第4期)一文中使用了“古籍電子化”的術(shù)語。事實上,這個階段“古籍電子化”“古籍?dāng)?shù)字化”“古籍的數(shù)字化”是交替使用的。出現(xiàn)這種情況的原因是由于20世紀90年代“數(shù)字化”“電子化”混用造成的。王冠中認為:數(shù)字化是一個制作過程,電子化是一個應(yīng)用過程。所以古籍?dāng)?shù)字化就是古籍文獻制作成數(shù)字成品的過程;而古籍的電子化則是古籍文獻數(shù)字化后,被使用的過程。因此,綜合而言“數(shù)字化”這個概念的表述相應(yīng)要準(zhǔn)確一些[13]。而事實證明,進入21世紀以后,學(xué)術(shù)界廣泛接受了“古籍?dāng)?shù)字化”這一術(shù)語。
三、21世紀初——古籍?dāng)?shù)字化概念的形成
明確的古籍?dāng)?shù)字化(電子化)概念的出現(xiàn)是在21世紀初。2000年李運富在“談古籍電子版的保真原則和整理原則”一文中首次界定了“古籍電子化”的概念。“所謂古籍電子化,是指利用現(xiàn)代信息技術(shù),將歷來以抄寫本、刻鑄本、雕版、活字版、套版及鉛字印刷等方式所呈現(xiàn)的古代文獻,轉(zhuǎn)化為電子媒體的形式”[14]。李運富從技術(shù)轉(zhuǎn)化的角度提出了古籍?dāng)?shù)字化的概念,但明顯缺少古籍?dāng)?shù)字化目的的界定。彭江岸“論古籍的數(shù)字化”一文對此作了補充:“古籍?dāng)?shù)字化就是利用數(shù)字技術(shù)將古籍的有關(guān)信息轉(zhuǎn)換成數(shù)字信息,存貯在計算機上,從而達到使用和保護古籍的目的”[15]。然而需要指出的是,古籍?dāng)?shù)字化事實上是一項系統(tǒng)的工作過程,以上兩個概念缺少這方面的描述。2001年喬紅霞“關(guān)于古籍全文數(shù)據(jù)庫建設(shè)工作的思考”一文又作了進一步的歸納:“我國的古籍?dāng)?shù)據(jù)庫建設(shè)即古籍?dāng)?shù)字化工作伴隨著我國數(shù)字圖書館發(fā)展的步伐,經(jīng)歷了認識、探索、研制3個階段。在這3個階段的探索中人們把古籍的數(shù)字化歸納為這樣一個概念,即利用多媒體技術(shù)、數(shù)據(jù)庫技術(shù)、數(shù)據(jù)壓縮技術(shù)、光盤存儲技術(shù)、網(wǎng)絡(luò)傳輸技術(shù)等手段把館藏印刷型文獻、縮微型文獻、音像型文獻等傳統(tǒng)介質(zhì)文獻轉(zhuǎn)化為數(shù)字化、電子化的光盤或網(wǎng)絡(luò)信息的工作”[16]。但這個概念又略顯復(fù)雜,因此,張雪梅又做了簡化:“古籍?dāng)?shù)字化就是采用計算機技術(shù),對古籍文獻進行加工、處理,制成古籍文獻書目數(shù)據(jù)庫和古籍全文數(shù)據(jù)庫,用以揭示古籍文獻中所蘊含的極其豐富的信息資源,從而達到使用和保護古籍的目的”[17]。
四、結(jié)語
綜上所述,我們可給古籍?dāng)?shù)字化界定如下:古籍?dāng)?shù)字化就是從利用和保護古籍的目的出發(fā),采用計算機技術(shù),將常見的語言文字或圖形符號轉(zhuǎn)化為能被計算機識別的數(shù)字符號,從而制成古籍文獻書目數(shù)據(jù)庫和古籍全文數(shù)據(jù)庫,用以揭示古籍文獻信息資源的一項系統(tǒng)工作。需要指出的是,古籍?dāng)?shù)字化還處在理論和實踐的探索之中,對古籍?dāng)?shù)字化概念存在不同的認識應(yīng)是古籍?dāng)?shù)字化發(fā)展中所必須經(jīng)歷的過程。基于這個概念,我們就可以將古籍?dāng)?shù)字化的基本性質(zhì)定位為:古籍?dāng)?shù)字化是對古籍或古籍內(nèi)容的再現(xiàn)和加工,屬于古籍整理的范疇,是古籍整理的一部分。古籍?dāng)?shù)字化是21世紀古籍整理的主流,代表著未來古籍整理的發(fā)展方向。古籍?dāng)?shù)字化屬于古籍整理和學(xué)術(shù)研究(或稱校讎學(xué))的范疇。古籍?dāng)?shù)字化的最終結(jié)果是將古籍資源制成古籍文獻書目數(shù)據(jù)庫和古籍全文數(shù)據(jù)庫,從而達到利用和保護古籍的目的。
參考文獻:
[1]史睿.論中國古籍?dāng)?shù)字化與人文學(xué)術(shù)研究[J].國家圖書館學(xué)刊,1999(2):28-35.
[2]葉曉珍.電腦搖身,古籍一變——訪中研院談古籍全文檢索系統(tǒng)[J].國文天地,1990(9):16-19.
[3]陳郁夫.“龍泉”初淬——“嶺月”中英全文處理檢索系統(tǒng)開發(fā)記[J].國文天地,1990(9):22-23.
[4]彭昆侖.闖入神奇的知識王國——“電腦紅學(xué)”研究的甘苦談[J].國文天地,1990(9):34-37.
[5]田奕.古籍整理與研究的電腦化[J].中國文化,1994(1):85-89.
[6]張衛(wèi)東.讓古籍插上電腦之翼高飛——從“帶領(lǐng)《紅樓夢》進入電腦”說起[J].國文天地,1990(9):30-33.
[7]楊允敬.用電腦說文解字——大型辭典電腦化的嘗試[J].國文天地,1990(9):28-29.
[8]陳東輝.20世紀古籍索引編制概述[J].文獻,1998(2):69-78.
[9]張琪玉.古籍索引的一個范例——介紹《古今圖書集成》電子版的索引數(shù)據(jù)庫[J].圖書館雜志,2000(5):48-49.
[10]曹書杰.古籍整理與電子計算機應(yīng)用研究的思考[J].古籍整理研究學(xué)刊,1988(1):44-49.
[11]羅鳳珠.?dāng)y手同行古籍自動化的路:不廢江河萬古流——D.I.Y.唐詩多媒體網(wǎng)絡(luò)系統(tǒng)架構(gòu)設(shè)計[J].國文天地,1995(6):105-111.
[12]陳秉仁.古籍善本數(shù)字化的嘗試:中國古籍善本查閱系統(tǒng)述略[J].現(xiàn)代圖書情報技術(shù),1998(1):22-25,45.
[13]王冠中.中文古籍?dāng)?shù)字化成果與展望[D].長春:東北師范大學(xué),2005:3-4.
[14]李運富.談古籍電子版的保真原則和整理原則[J].古籍整理研究學(xué)刊,2000(1):1-7.
[15]彭江岸.論古籍的數(shù)字化[J].河南圖書館學(xué)刊,2000(2):63-65.
[16]喬紅霞.關(guān)于古籍全文數(shù)據(jù)庫建設(shè)工作的思考[J].河南圖書館學(xué)刊,2001(4):58-60.
[17]張雪梅.古籍?dāng)?shù)字化與文獻信息資源共享[J].天津工業(yè)大學(xué)學(xué)報(社科版),2002(3):85-86.
原刊《科技情報開發(fā)與經(jīng)濟》2006年第22期 |