午夜精品免费视频,亚洲区欧美区,久久成人精品视频,成人免费网站观看

談電子版古籍“善本”

李先耕
(黑龍江大學(xué)古籍所)

  隨著中文信息化進(jìn)程的發(fā)展,“電子版”或“數(shù)字化”中文古籍也越來越普及流行。從載體介質(zhì)上來分,有軟盤版(這是早期產(chǎn)品,現(xiàn)在已極罕見)、光盤版(包括DVD光盤與CD光盤)、硬盤版、U盤版以及網(wǎng)絡(luò)版等等。從內(nèi)容表現(xiàn)形式上來分,有圖像版與文字版之分。不論圖像版還是文字版,都屬于古籍整理工作,其成果自然有好壞優(yōu)劣之分,也就是是否為善本電子版古籍。

  【首先要說明的是,原有的善本書的概念有兩個(gè)方面的含義,一是文物方面,如宋元刻本(《中國古籍善本書目》收至清乾隆刻本),一是校勘精審的古籍。本文所指當(dāng)然是后一種。】

  圖像版電子古籍可以說與古籍善本縮微膠片以及影印版古籍有相似之處。影印古籍是源于古籍的影寫本與覆刻本(或稱影刻本、仿刻本),如清末黎庶昌編刻的《古逸叢書》就是十分逼真的覆刻本。而當(dāng)石印技術(shù)、珂羅版技術(shù)傳入中國后,也就利用這些技術(shù)來重印或縮印古籍。如同文書局石印的以武英殿銅活字本爲(wèi)底本的《古今圖書集成》,董康珂羅版印制的《劉夢得文集》,商務(wù)印書館的《續(xù)古逸叢書》。而現(xiàn)在則可以先用照相制版或電腦掃描制版再采用膠印或其他印刷方法完成。如中華書局的《古逸叢書三編》。而北京圖書館出版社的《中華再造善本》更是達(dá)到了把珍稀的孤本、善本化身千百,妥善保護(hù)的境地,使得各省市的讀者有幸看到以前終生難見的古籍善本。可以說,目前的古籍影印工作已較成熟,中華書局總編室的《古籍影印釋例》就是基本規(guī)范。其中對(duì)“合格的古籍影印本”有如下要求:“(1)所采用的底本具有一定的學(xué)術(shù)價(jià)值;(2)參校他本作出校勘記;(3)有足以反映當(dāng)代研究成果的序文(或稱前言、出版說明);(4)正文有斷句或新式標(biāo)點(diǎn);(5)編制有新的目錄或索引;(6)附錄有相關(guān)研究資料。”以此來看,今天的圖像版電子古籍仍有不小的差距。目前廣為流傳的電子版古籍,如武漢大學(xué)出版社的光盤圖像版《文淵閣四庫全書》、超星的網(wǎng)絡(luò)版《四庫存目叢書》,高等學(xué)校中英文數(shù)字化國際合作計(jì)劃(CADAL)的網(wǎng)絡(luò)版《續(xù)修四庫全書》等等都是具有代表性的大型叢書型電子版古籍,即對(duì)現(xiàn)有的紙本影印本古籍加以數(shù)字化制作。但事實(shí)上無論是電子書標(biāo)準(zhǔn)、底本選擇還是數(shù)字化制作本身都存在一定問題。就以前述三家為例,其文件格式不同,為了閱讀就不得不安裝幾種不同的閱讀器。其他文件格式,包括方正的CEB文件、書生的SEP文件、知網(wǎng)的CAJ文件等等,據(jù)說目前國內(nèi)的電子書文件大約有二十余種,這當(dāng)然不利于電子書的應(yīng)用傳播。盡管2008年11月,由中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)聯(lián)合多家國內(nèi)軟件公司制定的電子文檔互聯(lián)互通接口標(biāo)準(zhǔn)UOML,已被國際開放標(biāo)準(zhǔn)組織OASIS列為正式標(biāo)準(zhǔn)。但目前我們看到的各個(gè)利益集團(tuán)仍然是各行其是,電子書標(biāo)準(zhǔn)的真正統(tǒng)一似乎仍需時(shí)日。至于選擇底本,這是任何一項(xiàng)古籍整理工作都必須注意的問題,這里就不加論述了,只是希望有關(guān)從事古籍電子書工作的單位能首先做好有關(guān)的文獻(xiàn)摸底與選擇工作,而不是隨便拿過一本古籍就來“數(shù)字化”。數(shù)字化古籍的制作是需要專用的工具設(shè)備才能更好地完成。2007年筆者在浙江大學(xué)圖書館參觀CADAL項(xiàng)目工作的時(shí)候,對(duì)其規(guī)模之大,設(shè)備之精有深刻印象。下面是當(dāng)時(shí)的兩張照片,插在這里以資介紹:第一張是其工作現(xiàn)場,幾十位工作人員正在認(rèn)真工作;第二張是工作人員正在用西門子專業(yè)掃描儀調(diào)整所掃描古籍的圖像。

  下面要談到的是文字化中文數(shù)字古籍,它所具有的最大優(yōu)點(diǎn)就是能夠準(zhǔn)確地進(jìn)行全文檢索。如北京國學(xué)時(shí)代文化傳播股份有限公司1999年推出的《國學(xué)寶典》,香港迪志文化出版有限公司和上海人民出版社1999年的《文淵閣四庫全書電子版》,廣西金海灣音像出版社與廣西師范大學(xué)出版社1999年聯(lián)合出版的《古今圖書集成》。此后北京書同文數(shù)字化技術(shù)有限公司2002年的《四部叢刊》全文檢索版,北京龍戴特信息技術(shù)有限公司與北京時(shí)代瀚堂科技有限公司聯(lián)合開發(fā)的“龍語翰堂典籍?dāng)?shù)據(jù)庫”及相關(guān)技術(shù)系列產(chǎn)品等等。其中《國學(xué)寶典》、《四部叢刊》、《四庫全書》都不斷推出新版甚至新的網(wǎng)絡(luò)版。新版會(huì)糾正原有版本的錯(cuò)誤,有的如《國學(xué)寶典》、“龍語翰堂典籍?dāng)?shù)據(jù)庫”還會(huì)增加其文獻(xiàn)內(nèi)容。就《四庫全書》、《四部叢刊》電子版來講。不存在底本的版本問題,所以其新版就是強(qiáng)化功能、改進(jìn)技術(shù)以及糾正原來錄入的錯(cuò)誤。我們知道,無論是人工錄入還是掃描圖像辨識(shí)都有一定的錯(cuò)誤產(chǎn)生。前人云,校書如掃落葉,才掃卻又生。100%的正確幾乎是不可能的,所以一開始《四庫全書》與《四部叢刊》在全文檢索版中都包含了圖像版,使得學(xué)術(shù)研究者引用時(shí)能方便地核對(duì)原文。但其最初推出時(shí)普通的計(jì)算機(jī)硬盤容量難以有力地支持圖像版,而且學(xué)界浮躁之風(fēng)也使得許多使用者無心核對(duì)。而現(xiàn)今的網(wǎng)絡(luò)版一般多提供全文檢索功能,而少有同時(shí)顯現(xiàn)原文圖像者。這就再一次強(qiáng)調(diào)文字版的正確率是多么重要。但是即使與底本100%相同,沒有任何錯(cuò)誤,研究者在引用時(shí)仍然會(huì)面臨字庫范圍與現(xiàn)行規(guī)范的種種要求。比如《四庫全書》中的避諱缺筆字在其字庫中有,但一般的計(jì)算機(jī)并沒有安裝這一特定字庫,所以是無法顯現(xiàn)的。而現(xiàn)行的文字規(guī)范,無論是字型規(guī)范還是異體字整理要求都會(huì)對(duì)文字化中文數(shù)字古籍使用發(fā)生影響。即使是紙本古籍的整理這方面的加工也是不可避免的。中華書局總編室在其《古籍校點(diǎn)釋例》中就說:“古書中的古今字、通假字、異體字、俗體字等,一律不出校。宋代以前的古書及有關(guān)語言文字學(xué)的著作,異體字一般不改。元明以後的書,不常見的異體字及不合規(guī)範(fàn)的俗體字,如「島」作「」,「沿」作「」、「惡」作「悪」、「船」作「舡」、「銜」作「啣」之類,可根據(jù)實(shí)際情況改成通行的繁體字,改了也不出校。版刻中的錯(cuò)字,如「焰」刻作「熖」、「祇」(只)刻作「秖」、「千」刻作「」、「餐」刻作「飱」,「寤寐」刻作「窹」之類,應(yīng)改成規(guī)範(fàn)的繁體字。一本書內(nèi)的用字應(yīng)力求統(tǒng)一。用簡體字排印的書可另作規(guī)定。”只有經(jīng)過這些整理加工后的古籍,才能正式出版。我們認(rèn)為今天的文字化中文數(shù)字古籍善本也必須經(jīng)過這樣的處理。

  這里要說明的是,《國學(xué)寶典》系列產(chǎn)品多是簡體字,這能否稱為善本呢?我們以為書籍的載體與字體本來就是與時(shí)俱進(jìn)不斷變化的,這并不影響其是否能成為善本。古書本來是“書於竹帛”(《墨子》),其載體是竹簡(其長度標(biāo)準(zhǔn)隨不同的內(nèi)容分類而變化)、木牘與縑帛(其標(biāo)準(zhǔn)長度是四丈),其字體是戰(zhàn)國古文、小篆、隸書,其裝訂是編連成冊與折疊舒卷。紙張發(fā)明之后成為書籍的主要載體,可以書寫各種字體,特別是后來流行的草書、行書、楷書。印刷術(shù)發(fā)明前的鈔本多是卷軸裝,當(dāng)時(shí)尚未有“善本”之名,但各種形式的“石經(jīng)”成為那時(shí)的規(guī)范標(biāo)準(zhǔn)。而印刷術(shù)發(fā)明之后,馮道首先用來印刷經(jīng)籍也成為當(dāng)時(shí)的規(guī)范。而字體也從仿效書法家的楷體字(即所謂軟體字)逐漸演變?yōu)楸阌诘癜娴挠搀w字(它濫觴于宋最終成熟于明季,就是“宋體字”——臺(tái)灣稱之為“明體字”[1])。而1965年頒布的《印刷通用漢字字形表》,當(dāng)時(shí)遵循的原則是“同一個(gè)宋體字有不同筆畫或不同結(jié)構(gòu)的,選擇一個(gè)便于辨認(rèn)、便于書寫的字體,同一個(gè)字宋體或手寫楷書筆畫結(jié)構(gòu)不同的,宋體盡可能接近手寫楷書,不完全根據(jù)文字學(xué)的傳統(tǒng)。”為什么這一“新字形”舍棄了雕版印刷長期形成的宋體字傳統(tǒng)呢?因?yàn)檫@時(shí)已不用全部雕刻木板而變成鑄造鉛字字模了。宋體字的易于雕刻的原則才能讓位于“便于辨認(rèn)、便于書寫”和“接近手寫楷書”的原則。對(duì)于今天的電子版古籍字庫來說,可以由專業(yè)機(jī)構(gòu)制定各種專門字庫,甚至隸書、小篆以至甲骨文、金文、戰(zhàn)國古文等古文字字形。在這種情況下,按照《中華人民共和國通用語言文字法》,一方面“學(xué)校及其他教育機(jī)構(gòu)以普通話和規(guī)范漢字為基本的教育教學(xué)用語用字”,即中小學(xué)的文言文教學(xué)都是使用規(guī)范漢字(包括簡化字),其實(shí)大學(xué)各科教學(xué),除了中文系的古代漢語與古代文學(xué)文選使用繁體字之外,都是簡化字。所以《國學(xué)寶典》恰恰同這一教育傳統(tǒng)接軌,有利于廣大使用者更好地接近傳統(tǒng),認(rèn)識(shí)古典。另一方面,該法律也規(guī)定了在“出版、教學(xué)、研究中需要使用的”情況下,可以使用異體字、繁體字。這就使得諸如《四部叢刊》、《四庫全書》之類的繁體字電子版古籍也有了合法存在的理由。當(dāng)然如前所述,即使是繁體字古籍,同樣也要經(jīng)過一定的校勘與字形處理。而使用簡化字的電子版古籍,我們以為應(yīng)該同紙本古籍一樣,基本上應(yīng)以重新發(fā)表的《簡化字總表》為準(zhǔn),而不應(yīng)該無限類推[2]。如果可能的話,可以利用現(xiàn)行字庫,適當(dāng)?shù)叵承┖喎薄耙粚?duì)多”所引起的困惑。比如繁體的“錢鍾書”,可以寫成簡體的“錢鍾書”,而不必一定要寫成“錢鐘書”。即以“鍾”為“鍾”的簡化字,而以“鐘”為“鐘”的簡化字。因?yàn)椤版R”當(dāng)“鍾聚”、“鍾愛”講,而“鐘”卻沒有這一義項(xiàng)[3]

  總之,文字版電子古籍,無論使用字庫為簡體或繁體,只要底本選擇的好,校勘精審,都可以成為善本。

注釋:

[1]參見王立軍:《雕版印刷對(duì)印刷字體的影響》,見商務(wù)印書館《漢字字形研究》2004年北京。

[2] 李先耕:《簡化字應(yīng)否無限類推》,見《求是學(xué)刊》2002.2期。

[3] 這一觀點(diǎn)較筆者《關(guān)于漢字簡化“后退”的思考》(見《語言規(guī)劃的理論與實(shí)踐》,語文出版社2006年)一文有所松動(dòng)。

發(fā)布日期:2009-08-18

主站蜘蛛池模板: 清丰县| 岚皋县| 清新县| 凌海市| 鹤岗市| 合阳县| 桂阳县| 连云港市| 湖州市| 新野县| 永嘉县| 大名县| 南开区| 乡宁县| 盖州市| 墨竹工卡县| 姜堰市| 钦州市| 池州市| 双鸭山市| 清镇市| 松滋市| 曲松县| 芷江| 左云县| 延庆县| 武邑县| 池州市| 财经| 泽库县| 临夏市| 凤山市| 元谋县| 航空| 扬州市| 洞口县| 肃北| 赤峰市| 清丰县| 兰州市| 攀枝花市|