大型古籍?dāng)?shù)據(jù)庫《國學(xué)寶典》網(wǎng)絡(luò)版開通
日前,大型中華古籍全文數(shù)據(jù)庫《國學(xué)寶典》成功地推出了網(wǎng)絡(luò)版。這項(xiàng)由首都師范大學(xué)電子文獻(xiàn)研究所開發(fā)的中文古籍?dāng)?shù)據(jù)庫工程目前共收入古籍3800多部,總字?jǐn)?shù)逾8億字,收入書籍種類和字?jǐn)?shù)都超過了《四庫全書》。
近年來,電子技術(shù)在古籍研究中的應(yīng)用,已成為人們關(guān)心的話題,電子技術(shù)對傳統(tǒng)學(xué)術(shù)研究陣地開始有所觸動?!秶鴮W(xué)寶典》的主要開發(fā)者尹小林先生介紹說,此前,單機(jī)版 《國學(xué)寶典》、《四部叢刊》電子版、《四庫全書》電子版等古籍檢索軟件已經(jīng)普遍為學(xué)術(shù)界所應(yīng)用,并受到學(xué)者的青睞和好評。博聞強(qiáng)記,皓首窮經(jīng)曾是古人做學(xué)問的基本路徑。而現(xiàn)在,電子檢索軟件大大縮短了咬文嚼字的時(shí)間,使研究者從繁瑣的資料翻檢中解脫出來,有更多的時(shí)間思考,創(chuàng)作。
同時(shí),隨著中國經(jīng)濟(jì)近年來的高速發(fā)展,中國文化也正在世界范圍迅速傳播并產(chǎn)生越來越大的影響。讓浩如煙海的中國古籍文獻(xiàn)乘上現(xiàn)代技術(shù)的快車,通過互聯(lián)網(wǎng)走向世界,也是這套系統(tǒng)研制者們的期望。據(jù)悉,北京國學(xué)時(shí)代文化傳播有限公司投資一千多萬元,依托首都師范大學(xué)組織國內(nèi)一批文史專家,經(jīng)過長達(dá)6年的資料搜集、電子化???,并借助清華大學(xué)的網(wǎng)絡(luò)技術(shù),在今年1月取得古籍網(wǎng)絡(luò)數(shù)據(jù)庫檢索的重大突破,完成了《國學(xué)寶典》網(wǎng)上檢索系統(tǒng),即《國學(xué)寶典》網(wǎng)絡(luò)版(www.gxbd.com)。
該系統(tǒng)采用國際通用的unicode漢字編碼,字庫容量大,擴(kuò)展性強(qiáng),可在全球所有網(wǎng)絡(luò)瀏覽器上正確顯示漢字。據(jù)悉,這套檢索系統(tǒng)還開通了手機(jī)WAP網(wǎng)站,可以在普通手機(jī)上實(shí)現(xiàn)其全部檢索功能。
湯一介、樂黛云、龐樸、曹先擢、傅璇琮、劉夢溪、張燕瑾等專家學(xué)者出席了《國學(xué)寶典》網(wǎng)絡(luò)版的新聞發(fā)布會。
北京大學(xué)教授樂黛云、湯一介先生都是該數(shù)據(jù)庫單機(jī)版的用戶。在新聞發(fā)布會上,樂黛云教授提出了新推出的網(wǎng)絡(luò)版與自己正在使用的單機(jī)版有什么不同的問題。尹小林表示,網(wǎng)絡(luò)數(shù)據(jù)庫的特點(diǎn)一是規(guī)模大。收入古籍總字?jǐn)?shù)超過了《四庫全書》,并且收入了一批《四庫全書》未收的通俗小說、戲曲。數(shù)據(jù)庫目前以每年二至三億字的速度繼續(xù)擴(kuò)充。網(wǎng)絡(luò)版不但極大地方便了用戶的使用,而且可以做到數(shù)據(jù)的及時(shí)更新。二是《國學(xué)寶典》網(wǎng)絡(luò)版使用了清華大學(xué)研發(fā)的極先進(jìn)的搜索引擎技術(shù),檢索速度奇快,從8億字近10萬卷的古籍?dāng)?shù)據(jù)庫中任意范圍查找任何一個(gè)字(詞),可以在一秒鐘左右得到結(jié)果,并可滿足數(shù)千人同時(shí)在線檢索。即使以后繼續(xù)增加數(shù)據(jù),其檢索速度也不會下降。
國家語言文字工作委員會副主任、中國辭書學(xué)會會長曹先擢說,在工作中他每天都在使用《國學(xué)寶典》,數(shù)據(jù)庫在資料搜集上有很強(qiáng)的實(shí)用價(jià)值。
首都師大的一位教授在發(fā)言中提出,電子化古籍一定要注重版本問題,目前專家學(xué)者在使用網(wǎng)絡(luò)古籍檢索時(shí)必須要重新核對紙版本的原文;再就是古籍中的繁簡轉(zhuǎn)換問題,也有待計(jì)算機(jī)技術(shù)的進(jìn)一步解決。