楊琳
作者簡介:楊琳,南開大學(xué)文學(xué)院教授,博士生導(dǎo)師,從事古代漢語、古典文獻(xiàn)、古代民俗等方面的教學(xué)與研究。
數(shù)字化的浪潮正在強(qiáng)烈地沖擊著傳統(tǒng)圖書出版業(yè)的堡壘。英國經(jīng)濟(jì)學(xué)家查爾斯·漢迪(Charles Handy)在《大象與跳蚤》(The Elephant and the Flea: Looking Backwards to the Future,Hutchinson,Random House, London 2001)一書中指出:網(wǎng)絡(luò)幅度及速度的改變將顛覆現(xiàn)在的出版產(chǎn)業(yè)模式,帶來信息行業(yè)的“去物質(zhì)化”(dematerialization)和“去中介化”(disintermediation)。所謂“去物質(zhì)化”就是不需要紙張,也就是數(shù)字化。“去中介化”則是作者直接出版圖書,不需要出版社作中介。微軟公司的創(chuàng)始人比爾·蓋茨(Bill Gates)甚至預(yù)言到2050年,紙質(zhì)圖書將可能消亡。他們二位的話絕不是危言聳聽,下面的事例很能說明這一問題。
事例1:俄羅斯數(shù)學(xué)家格里高利·佩雷爾曼(Grigori Perelman)因?qū)嫾尤R猜想(Poincare Conjecture)證明做出了奠基性的貢獻(xiàn)而獲得了2006年度國際數(shù)學(xué)界的最高獎(jiǎng)菲爾茲獎(jiǎng)(Fields),然而格里高利的獲獎(jiǎng)?wù)撐牟]有發(fā)表在正規(guī)雜志上,作者只是將論文手稿粘貼到一家專門刊登數(shù)學(xué)和物理論文的網(wǎng)站上,并用電郵通知了幾位數(shù)學(xué)家。格里高利的獲獎(jiǎng)意味著“網(wǎng)絡(luò)發(fā)表”已得到學(xué)術(shù)界的認(rèn)可,它預(yù)示著報(bào)刊的制作形式將逐步向網(wǎng)絡(luò)化過渡。2008年10月28日,美國很有影響的日報(bào)《基督教科學(xué)箴言報(bào)》(Christian Science Monitor)在其官方網(wǎng)站上宣布,從2009年4月起停止出版紙質(zhì)日報(bào),改為網(wǎng)絡(luò)版的電子日報(bào),從而成為美國首家以網(wǎng)絡(luò)版替代紙質(zhì)版日報(bào)的全國發(fā)行報(bào)紙。幾乎與此同時(shí),美國著名的IT雜志《PC Magazine》2008年11月19日宣布,將于2009年2月停止發(fā)行印刷版,而完全以數(shù)字化方式發(fā)行。而作為美國新聞界最高榮譽(yù)獎(jiǎng)的普利策新聞獎(jiǎng)(Pulitzer Prize),也從2006年起允許網(wǎng)絡(luò)內(nèi)容參加各獎(jiǎng)項(xiàng)的評選,表明評獎(jiǎng)委員會已經(jīng)承認(rèn)了網(wǎng)絡(luò)媒體的重要影響及合法地位。
事例2:每年一度的德國法蘭克福書展(Frankfurt Book Fair)是世界上規(guī)模最大的國際性圖書博覽會,它是世界圖書發(fā)展趨勢的風(fēng)向標(biāo)。2008年10月15日至19日舉行的第60屆法蘭克福書展上,以“數(shù)字化出版”為主題的參展商多達(dá)361家,參展的產(chǎn)品中數(shù)字化產(chǎn)品超過30%,而為出版界專業(yè)人士舉辦的400多場活動中,50%以上的活動與迎接圖書數(shù)字化有關(guān)。展會期間發(fā)布的調(diào)研報(bào)告顯示,在未來60年里,數(shù)字化圖書將成為最重要的出版形式。據(jù)保守估計(jì),到2018年,全球電子圖書的市場份額將超過傳統(tǒng)圖書。
事例3:中國出版科學(xué)研究所受國家新聞出版總署的委托,自1999年起每兩年搞一次全國性的國民閱讀調(diào)查活動,至今已經(jīng)搞了五次,下面是五次調(diào)查獲得的數(shù)據(jù):
縱觀這五次調(diào)查的結(jié)果,可以清楚地看到我國國民紙質(zhì)圖書閱讀率(指每年至少讀一本書的讀者在識字者中的比例)呈持續(xù)走低態(tài)勢,2007年比2005年下降了14個(gè)百分點(diǎn),下降幅度是很大的。與紙質(zhì)圖書閱讀率下降形成鮮明對比的是,互聯(lián)網(wǎng)閱讀率持續(xù)迅速上升,2007年的網(wǎng)絡(luò)閱讀率已經(jīng)超過了紙質(zhì)圖書閱讀率。據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)2009年1月13日發(fā)布的《第23次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,截至2008年底,我國網(wǎng)民數(shù)量達(dá)到了2.98億,比2007年增長了41.9%,居世界第一位;互聯(lián)網(wǎng)普及率為22.6%,首次超過21.9%的全球平均水平。盡管如此,由于中國的人口基數(shù)大,互聯(lián)網(wǎng)普及率在全球各個(gè)國家和地區(qū)中只排在第87位,而發(fā)達(dá)國家的平均普及率更是高達(dá)51% ,我們?nèi)杂泻艽蟮牟罹唷2浑y預(yù)見,在未來的若干年里,我國互聯(lián)網(wǎng)的用戶將會持續(xù)高速增長。隨著互聯(lián)網(wǎng)的不斷普及,網(wǎng)絡(luò)閱讀率必將不斷提高,而紙質(zhì)書刊的閱讀率必將不斷下滑。這使紙質(zhì)圖書面臨的生存危機(jī)越來越嚴(yán)重。
2000-2008年中國網(wǎng)民規(guī)模與增長率統(tǒng)計(jì)圖(據(jù)CNNIC報(bào)告)
這些事實(shí)有力地表明,我們已進(jìn)入了一個(gè)數(shù)字化閱讀的新時(shí)代。
那么,紙質(zhì)圖書的閱讀率為什么越來越低呢?這是因?yàn)榕c電子圖書相比,紙質(zhì)圖書缺點(diǎn)很多,如生產(chǎn)時(shí)間長,生產(chǎn)成本高,價(jià)格昂貴,攜帶不方便,存放起來占用空間大,不能檢索復(fù)制,等等。所以圖書的數(shù)字化制作是不可阻擋的發(fā)展趨勢。數(shù)字技術(shù)的興起使我們的圖書制作方式及閱讀習(xí)慣正在發(fā)生著歷史性的變革。想當(dāng)初,紙書的出現(xiàn)把笨重的簡冊趕下了歷史舞臺。今天,電子圖書的問世則意味著紙質(zhì)圖書的掘墓人已經(jīng)誕生,它將使紙質(zhì)圖書日趨萎縮,并在不遠(yuǎn)的將來取代紙質(zhì)圖書的主流地位。對此發(fā)展大勢,圖書出版機(jī)構(gòu)、圖書管理機(jī)構(gòu)及各級圖書館應(yīng)該有清醒的認(rèn)識。
目前,電子圖書還沒有統(tǒng)一的質(zhì)量標(biāo)準(zhǔn),制作機(jī)構(gòu)各行其是。電子圖書的質(zhì)量標(biāo)準(zhǔn)當(dāng)然不能搞一刀切,也不可能是一成不變的。不同的圖書類型,不同的讀者對象,應(yīng)該有不同的質(zhì)量標(biāo)準(zhǔn)。這里我想從學(xué)術(shù)需要的角度來談一下理想的電子古籍應(yīng)符合哪些標(biāo)準(zhǔn)。
我們認(rèn)為學(xué)術(shù)需要的理想電子古籍應(yīng)符合五項(xiàng)標(biāo)準(zhǔn)。
其一,文本要可靠
這是對電子古籍最起碼的要求。判定文本可靠的標(biāo)準(zhǔn)有兩條。
一是文字跟紙質(zhì)古籍一樣,沒有差錯(cuò),即沒有脫字、增字、別字、錯(cuò)字等現(xiàn)象。要真正做到這一點(diǎn)很不容易,目前恐怕還沒有哪個(gè)電子古籍?dāng)?shù)據(jù)庫敢說沒有差錯(cuò),我們在使用中時(shí)有發(fā)現(xiàn)。如“中國基本古籍庫”:王念孫《讀書雜志·漢書弟十四·見哀》:“《呂氏春秋·報(bào)更篇》:‘人主胡可以不務(wù)哀土?’”“哀土”為“哀士”之誤;明洪楩輯《清平山堂話本·簡貼和尚》:“大國長安一座縣,喚做鹹陽縣,離長安四十五裏。”“鹹”“裏”都是制作軟件將簡體轉(zhuǎn)換為繁體時(shí)造成的錯(cuò)誤;宋戴侗《六書故》卷前附有《六書通釋》一卷,“中國基本古籍庫”整卷脫漏;南開大學(xué)組合數(shù)學(xué)研究中心、天津永川軟件技術(shù)有限公司、中國社會科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)中心聯(lián)合研制的“二十五史全文閱讀檢索系統(tǒng)”:《晉書·甘卓傳》的“察孝謙”,“謙”為“廉”之誤。《史記·陸賈列傳》的“以好田畤地善”,“田畤”為“畤田”誤倒。下面是龍語瀚堂典籍?dāng)?shù)據(jù)庫中的一頁:
這里的“”是個(gè)錯(cuò)字,《龍龕手鑒》原文作“
”。又龍語瀚堂收元熊忠《古今韻會舉要》卷二十八《去聲·隻》“炙”字下:“炙,膾炙也,之夜切,字從夕,兩點(diǎn)。炙,之亦切,近火也,字從夕,一點(diǎn)。”“字從夕,兩點(diǎn)”之“夕”當(dāng)作
,“炙,之亦切”之“炙”當(dāng)作
。可見電子古籍的差錯(cuò)率是比較高的。
造成這種狀況的主要原因在于:一方面,古籍的用字情況比較復(fù)雜,而漢字識別技術(shù)還很不成熟,產(chǎn)生不少識別錯(cuò)誤;另一方面,制作公司大都缺乏熟悉古代漢語的校對人員,而普通校對人員難以勝任古籍校對工作,這就造成了較高的差錯(cuò)率。
二是盡可能地保存底本文字的原樣。這就是說,底本寫什么樣的字,電子古籍應(yīng)顯示什么樣的字。按照這一標(biāo)準(zhǔn),脫離底本的繁體字系統(tǒng)并不符合要求。例如底本中“于”“於”二字并用,繁體字系統(tǒng)中有可能統(tǒng)一用“於”;底本中既有“并”字,又有“並”字,繁體字系統(tǒng)中有可能統(tǒng)一用“並”;目前不少繁體字電子古籍就是這樣處理的。這種做法使古籍走了樣,丟失了一些有價(jià)值的古籍文本信息,不利于學(xué)術(shù)研究。有些情況下甚至?xí)斐衫斫馍系幕靵y。例如《禮記·月令》:“﹝孟秋之月﹞修宮室,壞墻垣,補(bǔ)城郭。”這里的“壞”讀péi,是“用泥土封塞空隙”的意思,如果轉(zhuǎn)換為“壞”,文意就大相徑庭了。清陳康祺《郎潛紀(jì)聞初筆》卷八載:“林文忠性卞急,撫蘇日嘗手書匾額于聽事之堂,曰‘制一怒字’。昔宋賢呂本中教屬吏當(dāng)先以暴怒為戒,公以之自律,其克己功夫尤切實(shí)已。”意思是說林則徐為了克制急躁易怒的毛病,在官衙大廳內(nèi)懸掛上“制一怒字”的匾額來警誡自己。如果轉(zhuǎn)換成“製一怒字”,意思就成制造憤怒了。一本初中歷史課本中的林則徐畫像中就是這樣寫的。所以脫離底本的繁體字系統(tǒng)不是理想的電子古籍。至于把古籍轉(zhuǎn)換為簡體字系統(tǒng)的,那就距理想的古籍就更遠(yuǎn)了。
那么我們?yōu)槭裁凑f“盡可能地保存”底本文字的原樣而不要求全部保存呢?這是因?yàn)楣偶杏写罅康氖謱戵w和俗體,手寫體和俗體變化多端,一個(gè)字有可能有十多種寫法,如果全都原封不動地再現(xiàn)于電子古籍,在目前的技術(shù)條件下存在很多困難。即使能夠做到,也將大大增加電子古籍的制作成本,從而制約電子古籍的生產(chǎn)和銷售。所以我們在標(biāo)準(zhǔn)中提“盡可能地保存”,言下之意是文字原樣保存得越多越好,關(guān)鍵在于制作者能夠找準(zhǔn)經(jīng)濟(jì)效益和理想標(biāo)準(zhǔn)的平衡點(diǎn)。
其二,僻字能正常顯示
漢字的字種數(shù)約有十萬種左右,其中常用字不過三四千字,絕大多數(shù)字屬于僻字。目前幾乎所有的電子古籍都未能解決僻字的錄入顯示問題。遇到無法錄入顯示的僻字,或者用方框、黑塊等符號表示空缺,或者用數(shù)字代替,鏈接到字形圖片,或者說明偏旁的上下左右內(nèi)外等,給閱讀利用造成障礙。下圖是國學(xué)網(wǎng)“國學(xué)寶典”《爾雅·釋魚》中的一條:
僻字用編號代替,開頭部分還是亂碼。最新的全功版也是如此。
下圖是書同文制作的電子版《四庫全書》中《龍龕手鑒》卷一的一頁,□表示不能錄入顯示的字,一頁上就有35個(gè)字無法顯示。
這方面做得最好的是龍語瀚堂典籍?dāng)?shù)據(jù)庫,大部分僻字都能正常顯示。如上面《爾雅·釋魚》的那一條,龍語瀚堂典籍?dāng)?shù)據(jù)庫中顯示為:
盡管如此,不能顯示的字也仍然不少。如下圖中的黑塊就是無法顯示的字:
看來解決僻字的錄入顯示問題仍然是數(shù)碼技術(shù)急需攻克的難題。
其三,每一種書都有版本信息
同一古籍常有多種不同的版本,不同版本字句上時(shí)有差異,如果沒有版本信息,文本的可靠性無從核實(shí),這就降低了電子文本的使用價(jià)值。“國學(xué)寶典”沒有版本信息,學(xué)術(shù)研究上只能作為初步檢索,真正采用還得找可靠的版本去落實(shí)。“中國基本古籍庫”倒是注明了版本,但有張冠李戴的問題。如所收元白珽《湛淵靜語》,注明是依據(jù)《知不足齋叢書》本,其實(shí)不然。如卷二:“邵康節(jié)生日不赴,蓋有見也。伊川生日亦不事飲宴。前修似此者多。”檢《知不足齋叢書》本,“生日不赴”作“生席不赴”,“前修”作“前脩”,并不相符。再檢文淵閣《四庫全書》本,完全一致,說明所據(jù)底本為文淵閣《四庫全書》本,不知何以標(biāo)成了《知不足齋叢書》本。
另一方面,制作古籍軟件應(yīng)采用好的版本作為底本。如果采用了不好的版本,即使沒有差錯(cuò)(指與紙質(zhì)古籍一致),也不能算是理想的電子古籍。如“中國基本古籍庫”收錄的北宋樂史《太平寰宇記》采用《四庫全書》本,此書最好的版本是宋刻本,有中華書局2000年影印出版的《宋本太平寰宇記》,可惜“中國基本古籍庫”沒有采用,也作為沒有對照版本。
其四,檢索程序功能完善
電子古籍最大的優(yōu)勢在于能夠進(jìn)行檢索,所以有一個(gè)功能完善的檢索程序是理想電子古籍最重要的標(biāo)準(zhǔn)。那么,怎樣才算功能完善呢?
(1)檢索速度要快。一般應(yīng)在幾秒鐘之內(nèi)列出關(guān)鍵詞所在頁面的所有條目,并按一定順序排列。
(2)能夠滿足多種條件的檢索需求。比如按朝代(當(dāng)然更精確的是年代)檢索、按作者檢索、按文體檢索、排除式檢索、“A+任意字符+B”字組檢索,等等,這些功能在學(xué)術(shù)研究上非常有用,可惜目前古籍軟件的檢索程序提供的功能比較少,難以做到精確檢索。提供了某種功能的,還存在不少問題。比如電子版《四庫全書》有“與”、“或”、“非”三種組合選項(xiàng),但軟件把“與”、“或”、“非”的出現(xiàn)條件限定在“一卷”的范圍,而不是“一個(gè)頁面”的范圍,這使“與”、“或”、“非”的檢索基本上沒有什么用處。“中國基本古籍庫”提供按朝代檢索的功能,但一次只能選一個(gè)朝代,不能同時(shí)多選,使用不很方便。至于具體文獻(xiàn)的朝代歸屬,問題更多。如把明代牛衷編的《增修埤雅廣要》放在宋代,大約是由于此書是宋代陸佃《埤雅》的增補(bǔ)本的緣故,但《增修埤雅廣要》與《埤雅》分明是兩部書。其他如把清代畢沅的《釋名疏證》、清代王先謙的《釋名疏證補(bǔ)》放在漢代,把清代仇兆鰲的《杜詩詳注》、清代馮浩的《樊南文集詳注》放在唐代,都是不合適的。注本一般應(yīng)歸于注者的時(shí)代,正如北魏酈道元的《水經(jīng)注》雖然是注釋漢代《水經(jīng)》的,但我們不能把它當(dāng)漢代典籍一樣。如果是單純編輯的文本,應(yīng)放在文本產(chǎn)生的時(shí)代。如清代編的《全唐詩》、《全唐文》,文本都是唐代的,自然應(yīng)歸于唐代。別以為文獻(xiàn)的朝代歸屬無關(guān)緊要,放錯(cuò)了時(shí)代,會對學(xué)術(shù)研究產(chǎn)生不利影響。
(3)關(guān)聯(lián)檢索要準(zhǔn)確。由于古籍中存在異體字問題,對大陸來說還存在繁簡字問題,所以檢索關(guān)鍵詞時(shí)一般應(yīng)有相應(yīng)的關(guān)聯(lián),這樣才能把想檢索的內(nèi)容一次都檢索出來。異體關(guān)聯(lián)如當(dāng)我們以“涼風(fēng)”為關(guān)鍵詞時(shí),程序同時(shí)也能檢索出“涼風(fēng)”的條目。繁簡關(guān)聯(lián)如當(dāng)我們以“關(guān)于”為關(guān)鍵詞時(shí),同時(shí)能檢出“關(guān)于”和“關(guān)於”的條目。目前的古籍軟件大都不具備異體關(guān)聯(lián)功能,有此功能的軟件則非常低能。如《四庫全書》設(shè)計(jì)了異體關(guān)聯(lián)功能,但設(shè)計(jì)者把“異體”的范圍放得很寬,包括“形似字”和“通假字”在內(nèi),其結(jié)果常常關(guān)聯(lián)出一大堆無效信息,反而給檢索造成障礙。比如當(dāng)你檢索含有“籑”字的資料時(shí),大量含有“撰”“饌”的資料也一并檢索出來,檢索“尺子”時(shí),“尺予”、“尺于”、“斥予”、“斥于”、“斥子”等條目混雜其中,而這些無關(guān)的條目還無法排除。另一方面,一些應(yīng)該同時(shí)檢出的異體字,程序卻視為不同的字而不能檢出,出現(xiàn)漏檢的情況。如“狼跋”俗體也寫作“狼”,當(dāng)以“狼跋”為檢索詞時(shí),“狼
”的資料檢不出來。這種關(guān)聯(lián)還不如沒有這種功能方便。異體關(guān)聯(lián)應(yīng)嚴(yán)格限定在“任何情況下都能互換的字”的范圍之內(nèi),否則只會降低準(zhǔn)確率。一些繁體字系統(tǒng)的古籍軟件只能輸入繁體關(guān)鍵詞,不能用簡體關(guān)鍵詞,這對大陸的使用者造成麻煩。有些軟件雖然有繁簡關(guān)聯(lián)功能,但往往漏洞百出。如在“中國基本古籍庫”所收明朱國禎《涌幢小品》卷二十四中明明有“百壽”一詞,但輸入“百壽”一詞進(jìn)行檢索時(shí),結(jié)果為零,改用繁體字檢索則能檢索得到。又如檢索“夫子巖”時(shí)檢不到寫作“夫子巖”的資料,反之亦然。檢索書名時(shí),輸入“集韻”檢索不到,輸入“集韻”才能檢到。這說明該關(guān)聯(lián)的沒有關(guān)聯(lián)上。還有一種更糟的情況是,無論用繁體還是簡體,都檢索不到。如“中國基本古籍庫”中收有清馮桂芬《(同治)蘇州府志》,其中有“惟蘇州者極巧,為天下第一”的話(見卷二十),但如果以“為天下第一”為關(guān)鍵詞,則檢索不到。“馬留”一詞在庫中所收的不少書中都有,如宋李昌齡輯《樂善錄》卷五、宋謝維新編《事類備要》卷四十一等,但檢索結(jié)果卻是沒有。以“見哀于石君”為檢索詞時(shí),只檢索到明彭大翼《山堂肆考》中的1條。實(shí)際上,庫中所收的《漢書》、王念孫《讀書雜志》及王先謙《漢書補(bǔ)注》中都有這句話,卻檢不出來。許多學(xué)者靠古籍?dāng)?shù)據(jù)庫的檢索來判斷某個(gè)詞語在某一時(shí)代或某部書中的有無,上面的例子表明目前的古籍軟件不完全靠得住。
(4)檢索出的資料應(yīng)有詳細(xì)的出處顯示,并能便捷地復(fù)制。一條完整的出處應(yīng)包括作者、作者朝代、書名、卷數(shù)、篇名五項(xiàng)信息,這樣的出處才符合學(xué)術(shù)需要,然而目前還沒有達(dá)到這一標(biāo)準(zhǔn)的電子文獻(xiàn)。《四庫全書》有出處復(fù)制的功能,可惜出處只有書名和卷數(shù),過于簡單,不能滿足需要。“中國基本古籍庫”5.0以前的版本沒有出處復(fù)制功能,最新的6.0版能在檢索到的條目頁面下顯示出處,并在復(fù)制文本時(shí)提供出處復(fù)制,但也只有書名和卷數(shù),使用者還得通過翻檢補(bǔ)充朝代、作者、篇名等信息,比較費(fèi)事。
(5)檢索結(jié)果要有統(tǒng)計(jì)數(shù)據(jù),并能快捷地打開查看和復(fù)制。目前的一些軟件點(diǎn)開原文后顯示的是關(guān)鍵詞所在的整篇文章的開頭,而不是關(guān)鍵詞所在的段落,關(guān)鍵詞也不能高亮顯示,要找到關(guān)鍵詞所在的段落很費(fèi)事。有些數(shù)據(jù)庫對復(fù)制原文防范過嚴(yán),如“中國基本古籍庫”不能直接復(fù)制,須另外打開“下載編輯”窗口才能復(fù)制,而且每次最多只能復(fù)制200字,很不方便。軟件制作者保護(hù)知識產(chǎn)權(quán)的用意是可以理解的,但只能復(fù)制一小部分的限制損害的是正當(dāng)使用者的權(quán)益,建議修改為能直接復(fù)制全部當(dāng)前頁。
其五,能很好地兼容常用字處理軟件
大多數(shù)大型古籍?dāng)?shù)據(jù)庫需要安裝專用的瀏覽軟件,這給使用者造成不便。書同文的每一種數(shù)據(jù)庫甚至都要安裝單獨(dú)的客戶端程序,很不合理。理想的狀態(tài)應(yīng)該是用常用瀏覽器(如IE)就可瀏覽,事實(shí)上龍語瀚堂典籍?dāng)?shù)據(jù)庫也已經(jīng)做到了這一點(diǎn),建議其他數(shù)據(jù)庫的研制者借鑒龍語瀚堂的成功經(jīng)驗(yàn)。當(dāng)然,如果能研制出一個(gè)更切合古籍瀏覽的通用軟件也未嘗不可,但目前各自為政的做法不但造成資源的浪費(fèi),而且給使用者造成很多麻煩,實(shí)不可取。
檢索出來的資料人們一般是要復(fù)制到WORD等字處理軟件中使用的,然而有些數(shù)據(jù)庫的資料復(fù)制粘貼后會發(fā)生錯(cuò)亂。例如不少古籍帶有注文,注文一般是隨文用小字表示。當(dāng)你把《四庫全書》中復(fù)制的帶注文的資料粘貼WORD中時(shí),所有的注文全都跑到正文的末尾之后,而不在原句之下,使你分不清楚哪是正文哪是注文。即便知道是注文,也不清楚是哪句正文的注文。不得已,還得跟數(shù)據(jù)庫中的原頁面仔細(xì)核對。大陸的使用者一般要把復(fù)制的繁體字資料轉(zhuǎn)換為簡體字,但這種轉(zhuǎn)換會發(fā)生錯(cuò)誤。如用WORD的繁簡轉(zhuǎn)換工具把《四庫全書》中復(fù)制的“譙國華佗字元化”整體轉(zhuǎn)為簡體時(shí),“元”被轉(zhuǎn)換成了“符”,令人莫名其妙。龍語瀚堂典籍?dāng)?shù)據(jù)庫中的有些僻字復(fù)制粘貼到WORD后會走樣,如上例《爾雅》中的字復(fù)制到WORD后變成了鰴。這都是兼容性存在問題。
總而言之,古籍的數(shù)字化是保存?zhèn)鞑ゲ⒊浞掷霉糯浼母锩允侄危哂兄匾默F(xiàn)實(shí)價(jià)值和深遠(yuǎn)的歷史意義,各有關(guān)方面應(yīng)該攜起手來,與時(shí)俱進(jìn),共同迎接數(shù)字化時(shí)代的挑戰(zhàn)。
發(fā)布日期:2009-08-18