午夜精品免费视频,亚洲区欧美区,久久成人精品视频,成人免费网站观看

 

數(shù)字化條件下古籍整理的基本問(wèn)題(論綱)

史睿
(國(guó)家圖書館善本特藏部敦煌吐魯番資料中心)

  近年來(lái)各地的數(shù)字化圖書館建設(shè)日益興盛,古籍的數(shù)字化也有一日千里之勢(shì),但是必須指出,在相關(guān)基礎(chǔ)理論問(wèn)題尚未解決之前,任何古籍?dāng)?shù)字化,乃至一切文獻(xiàn)數(shù)字化的努力都可能陷入南轅北轍的尷尬局面。這些基本理論問(wèn)題是,古籍?dāng)?shù)字化的基本性質(zhì)是什么?在古籍?dāng)?shù)字化的過(guò)程中誰(shuí)是主導(dǎo),內(nèi)容專家還是技術(shù)專家?古籍?dāng)?shù)字化應(yīng)該以什么為依歸,衡量數(shù)字古籍優(yōu)劣的標(biāo)準(zhǔn)是什么?保障古籍?dāng)?shù)字化走向正確路徑的基本要素有哪些?古籍?dāng)?shù)字化與其它一切文獻(xiàn)數(shù)字化的關(guān)系如何?

  首先要明確的是,古籍?dāng)?shù)字化屬于古籍整理和學(xué)術(shù)研究(或稱校讎學(xué))的范疇,而不僅僅是圖書載體的轉(zhuǎn)換或商業(yè)炒作的噱頭。故必須以相關(guān)領(lǐng)域的學(xué)者(即內(nèi)容專家,而非技術(shù)專家)為主導(dǎo),才可能向正確的方向發(fā)展。純粹的技術(shù)專家不可能將古籍?dāng)?shù)字化,甚至數(shù)字化圖書館領(lǐng)向一條康莊大道。技術(shù)是形式,內(nèi)容是核心,內(nèi)容決定采取何種形式,形式只能服務(wù)于內(nèi)容,而不是相反。只有熟悉對(duì)象(古籍)內(nèi)涵的主體,即內(nèi)容專家,才有能力決定實(shí)現(xiàn)古籍?dāng)?shù)字化的基本路向和基本框架,技術(shù)專家的作用是在既定的框架內(nèi)如何最便捷、最優(yōu)化地實(shí)現(xiàn)目標(biāo)。故在古籍?dāng)?shù)字化領(lǐng)域中,內(nèi)容專家和技術(shù)專家的關(guān)系應(yīng)該如同建筑工程師與建筑工人,這樣才能形成人力資源的最佳配置,有效地發(fā)揮各自的功能。IT技術(shù)永遠(yuǎn)是工具,沒(méi)有內(nèi)容專家的構(gòu)建和引領(lǐng),再好的IT技術(shù)也難以帶來(lái)真正的利益。

  其次,既然古籍?dāng)?shù)字化屬于古籍整理和學(xué)術(shù)研究的范疇,那么就必須遵循古籍整理的基本原則,懂得學(xué)術(shù)研究的基本思維過(guò)程。古籍整理古稱校讎學(xué),涉及目錄、版本、標(biāo)點(diǎn)、?钡纫幌盗械膶W(xué)問(wèn),承擔(dān)著“辨章學(xué)術(shù)、考鏡源流”的學(xué)術(shù)任務(wù)。整理一部古籍,要選擇善本為底本,又要廣校眾本,之后精心標(biāo)點(diǎn),與所引之書和引用此書之書一一?,還須廣徵群籍,拾遺補(bǔ)闕,最后提要勾玄,界定其學(xué)術(shù)地位與價(jià)值。實(shí)際上經(jīng)過(guò)整理的古籍乃是一部融入學(xué)術(shù)研究成果的作品,還附有各種索引數(shù)據(jù)庫(kù),以便檢索,而并非原有任何版本古籍的復(fù)制。數(shù)字古籍應(yīng)該遵循古籍整理的一般過(guò)程和一般規(guī)則,而現(xiàn)有任何版本的數(shù)字古籍都沒(méi)有達(dá)到古籍整理的最低標(biāo)準(zhǔn)。其次,關(guān)于人文學(xué)術(shù)研究的一般過(guò)程與計(jì)算機(jī)信息處理過(guò)程的關(guān)系,筆者曾發(fā)表《試論中國(guó)古籍?dāng)?shù)字化與人文學(xué)術(shù)研究》(《北京圖書館館刊》,1998年2期,28-35頁(yè)),可供參考。學(xué)術(shù)研究處理文獻(xiàn)的方式往往是突破其原有結(jié)構(gòu),將原文獻(xiàn)劃分為若干基本單位,提取其中指向內(nèi)部含義的關(guān)鍵詞,依照它們的屬性進(jìn)行排序、篩選、統(tǒng)計(jì)和分類,比較相關(guān)文獻(xiàn)中的關(guān)鍵詞,尋求他們之間的相關(guān)性。這一過(guò)程在手工查閱紙本文獻(xiàn)的時(shí)代,需要學(xué)者具有深湛的功力;近代以來(lái)多以編纂各類古籍索引方式,將經(jīng)驗(yàn)轉(zhuǎn)化為知識(shí)。這正是電子媒體需要繼承的重要方法,為此我們必須將隱藏于學(xué)者大腦中的經(jīng)驗(yàn)和智慧加以總結(jié),建立模型和序列,將無(wú)法比較的學(xué)術(shù)關(guān)鍵字賦以數(shù)值,例如編制具有規(guī)范控制年號(hào)與公元紀(jì)年對(duì)照表、歷代官階序例表、家族世系表、姻親關(guān)系表、地名沿革表、人名字號(hào)表等,然后再以這些模型和序例為準(zhǔn)標(biāo)引古籍文本,使之完成經(jīng)驗(yàn)到知識(shí)的轉(zhuǎn)化,建立人文學(xué)術(shù)研究的科學(xué)內(nèi)核,有效積累和傳播人類知識(shí),讓每次學(xué)術(shù)研究行為都從前人的終點(diǎn)開始。如果數(shù)字古籍其關(guān)鍵詞的標(biāo)引和規(guī)范控制水平比不上傳統(tǒng)索引,其存在的價(jià)值勢(shì)必受到強(qiáng)烈置疑。

  第三,也是非常重要的一點(diǎn),古籍?dāng)?shù)字化,乃至一切文獻(xiàn)數(shù)字化,必須采取以應(yīng)用為指針的原則,一切工作都以這項(xiàng)原則為起點(diǎn),同時(shí)又以它為評(píng)價(jià)工作成效的指標(biāo),要實(shí)現(xiàn)以應(yīng)用為指針的原則,就必須懂得應(yīng)用者的基本訴求。為此,我們首先需要確定數(shù)字古籍應(yīng)用者的范圍,古籍是為學(xué)術(shù)研究服務(wù)的,而非供大眾消遣的余興節(jié)目,數(shù)字古籍也不例外。古籍?dāng)?shù)字化必須全面借鑒以往的學(xué)術(shù)成果,明了紙本形態(tài)古籍在學(xué)術(shù)研究應(yīng)用中的長(zhǎng)處與局限。學(xué)者對(duì)于應(yīng)用的要求是古籍?dāng)?shù)字化的起點(diǎn),任何從事這項(xiàng)工作的機(jī)構(gòu)或個(gè)人如果不了解這些要求,都必將導(dǎo)致全部工作的失敗。以往,當(dāng)計(jì)算機(jī)工程師開始設(shè)計(jì)會(huì)計(jì)軟件時(shí),對(duì)于會(huì)計(jì)的原理和應(yīng)用要求也是完全陌生的,但現(xiàn)在會(huì)計(jì)軟件工程師已經(jīng)成為一個(gè)專門的行業(yè),會(huì)計(jì)軟件也與應(yīng)用日益吻合。既然會(huì)計(jì)軟件能與應(yīng)用合拍,那么文獻(xiàn)數(shù)字化也應(yīng)將應(yīng)用的要求放在第一位來(lái)考慮。實(shí)際上就其本質(zhì)而言,學(xué)術(shù)研究的應(yīng)用要求與其它領(lǐng)域并無(wú)二致,一言以蔽之,曰:“知識(shí)發(fā)現(xiàn)”。所謂知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,簡(jiǎn)稱KDD),與我們常說(shuō)的數(shù)據(jù)資源再生相近,又稱數(shù)據(jù)挖掘技術(shù),是指從大量數(shù)據(jù)中提取出可信的、新穎的、有效的并易于理解的知識(shí)的高級(jí)處理過(guò)程[1]。它已廣泛應(yīng)用于市場(chǎng)行銷、產(chǎn)品制造、通信網(wǎng)絡(luò)管理、金融投資、自然科學(xué)研究等許多領(lǐng)域[2]。我們相信,數(shù)據(jù)挖掘技術(shù)運(yùn)用于人文研究領(lǐng)域,必將創(chuàng)造出更卓越的業(yè)績(jī)。紙本索引的目標(biāo)就是數(shù)據(jù)資源再生,但問(wèn)題在于紙本檢索工具不能隨讀者的要求提供多種排檢方式,故其再生資源的可用性有限;此外,研究者對(duì)文獻(xiàn)本身的認(rèn)識(shí)是隨著研究工作的深入而逐步清晰起來(lái)的,其工作初期往往難以明確提出與自己的研究題目完全切合的全部關(guān)鍵詞,而是要在較大范圍內(nèi)進(jìn)行模糊查詢或漸進(jìn)式查詢,這更是紙本檢索工具所不能解決的。數(shù)字古籍目標(biāo)應(yīng)以紙本索引為向?qū),以?yīng)用為目標(biāo),將“知識(shí)發(fā)現(xiàn)”進(jìn)行到底。應(yīng)用是我們衡量古籍?dāng)?shù)字化工作的指標(biāo)。

  第四,為了實(shí)現(xiàn)知識(shí)發(fā)現(xiàn),古籍?dāng)?shù)字化,乃至一切文獻(xiàn)數(shù)字化必須建立在深入標(biāo)引和嚴(yán)格規(guī)范控制的基礎(chǔ)上。無(wú)標(biāo)引、無(wú)規(guī)范控制的文本,其價(jià)值為零。因?yàn)橹挥薪?jīng)過(guò)深入標(biāo)引和嚴(yán)格規(guī)范控制的數(shù)據(jù)庫(kù)才能產(chǎn)生再生資源,而再生資源經(jīng)過(guò)有效的排序和篩選,才能實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)。當(dāng)然,這必須以既往的學(xué)術(shù)研究為基礎(chǔ),以現(xiàn)代IT技術(shù)為工具。關(guān)于標(biāo)引和規(guī)范控制,原本是現(xiàn)代圖書館學(xué)的題中應(yīng)有之義,但近來(lái)IT技術(shù)的神話沖淡了相關(guān)的學(xué)術(shù)研究,現(xiàn)在我們才發(fā)現(xiàn),深入標(biāo)引和嚴(yán)格的規(guī)范控制是實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)的必要手段。所以,我們必須破除IT技術(shù)的迷信,重新估價(jià)IT技術(shù)的功能與價(jià)值,并努力補(bǔ)上傳統(tǒng)學(xué)術(shù)中標(biāo)引和規(guī)范控制這一課。和其他文獻(xiàn)相比,古籍的標(biāo)引和規(guī)范控制更為復(fù)雜,可以認(rèn)為,古籍的數(shù)字化是一切文獻(xiàn)數(shù)字化的特例,如果我們對(duì)于解決這個(gè)復(fù)雜特例有了完整的方案,那么其他文獻(xiàn)數(shù)字化解決方案就迎刃而解了。

  胡適之先生認(rèn)為傳統(tǒng)的經(jīng)史研究存在范圍太狹窄,注重功力而忽略理解,缺乏參考比較的材料等積弊,故以清代三百年間第一流人才的心思精力,都用在經(jīng)學(xué)的范圍內(nèi),卻只取得了一點(diǎn)點(diǎn)的成果,關(guān)鍵是缺少對(duì)古籍的系統(tǒng)整理,又不注重學(xué)術(shù)成果的積累,兩千四百多卷的《清經(jīng)解》,大多是一堆流水爛帳,沒(méi)有條理,沒(méi)有系統(tǒng),人人從“粵若稽古”、“關(guān)關(guān)雎鳩”說(shuō)起,怪不得學(xué)者看了要望洋興嘆了[3]。針對(duì)清儒治學(xué)方法的缺陷,胡適之先生著重提出,必須系統(tǒng)地整理古籍,包括索引式、結(jié)帳式和專史式的整理。此后,學(xué)界編纂了多種引得、通檢、索引、匯編等工具書,部分完成了索引式整理的目標(biāo),拜前輩學(xué)者之賜,我們查閱古籍不知享受了多少便利。但是我們也發(fā)現(xiàn),中國(guó)古籍汗牛充棟,經(jīng)過(guò)系統(tǒng)整理的畢竟只是少數(shù),方便的檢索工具也還嫌太少,離胡適之先生的標(biāo)準(zhǔn)還有相當(dāng)?shù)木嚯x。即使是已有索引的古籍,我們用來(lái)解決具體問(wèn)題時(shí)仍會(huì)感覺(jué)到種種不便。至于結(jié)帳式的整理,則尚未受到學(xué)術(shù)界的普遍重視,而在未有結(jié)帳式整理之前,所作的專史研究,其完整性、可靠性都值得懷疑。為了促進(jìn)人類知識(shí)的有效積累和有效傳播,使我們的后代不必研究任何問(wèn)題都從“粵若稽古”、“關(guān)關(guān)雎鳩”說(shuō)起,我們才有必要從事文獻(xiàn)數(shù)字化的工作;此外,積極建設(shè)網(wǎng)上中文資源庫(kù),打破某些國(guó)家或某種語(yǔ)言對(duì)網(wǎng)絡(luò)資源的壟斷,這將有利于中外學(xué)術(shù)文化的交流,樹立中國(guó)人的學(xué)術(shù)自信心和自尊心。總之,我們一切都應(yīng)從長(zhǎng)遠(yuǎn)目標(biāo)出發(fā),而不應(yīng)被暫時(shí)的商業(yè)利益所蒙蔽。

注釋:

[1]見高文《KDD:數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)》,載《計(jì)算機(jī)世界》1998年37期,8月28日,技術(shù)專題版,D1頁(yè)。又朱廷劭《數(shù)據(jù)挖掘——極具發(fā)展前景的新領(lǐng)域》,載《計(jì)算機(jī)世界》1999年1期,1月4日,產(chǎn)品與技術(shù)版,C14頁(yè)。

[2]見朱廷劭、王軍《數(shù)據(jù)挖掘應(yīng)用》,載《計(jì)算機(jī)世界》1998年37期,9月28日,技術(shù)專題版,D5,8頁(yè)。

[3]胡適《〈國(guó)學(xué)季刊〉發(fā)刊宣言》,原載《國(guó)學(xué)季刊》一卷一號(hào),1923年1月,此據(jù)歐陽(yáng)哲生編《胡適文集》三,5—17頁(yè),北京大學(xué)出版社,1998年12月。

原刊《文津流觴》第八期,2002年7月

 
主站蜘蛛池模板: 东源县| 高青县| 青阳县| 柘荣县| 鲁甸县| 山西省| 藁城市| 玛纳斯县| 云阳县| 前郭尔| 车致| 当阳市| 奉新县| 留坝县| 宁津县| 修水县| 翁源县| 辽中县| 建平县| 南乐县| 蓬安县| 安顺市| 临海市| 寻乌县| 咸丰县| 乌海市| 东丰县| 安徽省| 铁力市| 苗栗市| 沅陵县| 普兰县| 乐至县| 乌鲁木齐市| 铜梁县| 阿拉善右旗| 普格县| 泽普县| 革吉县| 成武县| 安康市|