午夜精品免费视频,亚洲区欧美区,久久成人精品视频,成人免费网站观看

談電子版古籍“善本”

(黑龍江大學古籍所)

  隨著中文信息化進程的發展,“電子版”或“數字化”中文古籍也越來越普及流行。從載體介質上來分,有軟盤版(這是早期產品,現在已極罕見)、光盤版(包括DVD光盤與CD光盤)、硬盤版、U盤版以及網絡版等等。從內容表現形式上來分,有圖像版與文字版之分。不論圖像版還是文字版,都屬于古籍整理工作,其成果自然有好壞優劣之分,也就是是否為善本電子版古籍。

  【首先要說明的是,原有的善本書的概念有兩個方面的含義,一是文物方面,如宋元刻本(《中國古籍善本書目》收至清乾隆刻本),一是校勘精審的古籍。本文所指當然是后一種。】

  圖像版電子古籍可以說與古籍善本縮微膠片以及影印版古籍有相似之處。影印古籍是源于古籍的影寫本與覆刻本(或稱影刻本、仿刻本),如清末黎庶昌編刻的《古逸叢書》就是十分逼真的覆刻本。而當石印技術、珂羅版技術傳入中國后,也就利用這些技術來重印或縮印古籍。如同文書局石印的以武英殿銅活字本爲底本的《古今圖書集成》,董康珂羅版印制的《劉夢得文集》,商務印書館的《續古逸叢書》。而現在則可以先用照相制版或電腦掃描制版再采用膠印或其他印刷方法完成。如中華書局的《古逸叢書三編》。而北京圖書館出版社的《中華再造善本》更是達到了把珍稀的孤本、善本化身千百,妥善保護的境地,使得各省市的讀者有幸看到以前終生難見的古籍善本。可以說,目前的古籍影印工作已較成熟,中華書局總編室的《古籍影印釋例》就是基本規范。其中對“合格的古籍影印本”有如下要求:“(1)所采用的底本具有一定的學術價值;(2)參校他本作出校勘記;(3)有足以反映當代研究成果的序文(或稱前言、出版說明);(4)正文有斷句或新式標點;(5)編制有新的目錄或索引;(6)附錄有相關研究資料。”以此來看,今天的圖像版電子古籍仍有不小的差距。目前廣為流傳的電子版古籍,如武漢大學出版社的光盤圖像版《文淵閣四庫全書》、超星的網絡版《四庫存目叢書》,高等學校中英文數字化國際合作計劃(CADAL)的網絡版《續修四庫全書》等等都是具有代表性的大型叢書型電子版古籍,即對現有的紙本影印本古籍加以數字化制作。但事實上無論是電子書標準、底本選擇還是數字化制作本身都存在一定問題。就以前述三家為例,其文件格式不同,為了閱讀就不得不安裝幾種不同的閱讀器。其他文件格式,包括方正的CEB文件、書生的SEP文件、知網的CAJ文件等等,據說目前國內的電子書文件大約有二十余種,這當然不利于電子書的應用傳播。盡管2008年11月,由中國電子工業標準化技術協會聯合多家國內軟件公司制定的電子文檔互聯互通接口標準UOML,已被國際開放標準組織OASIS列為正式標準。但目前我們看到的各個利益集團仍然是各行其是,電子書標準的真正統一似乎仍需時日。至于選擇底本,這是任何一項古籍整理工作都必須注意的問題,這里就不加論述了,只是希望有關從事古籍電子書工作的單位能首先做好有關的文獻摸底與選擇工作,而不是隨便拿過一本古籍就來“數字化”。數字化古籍的制作是需要專用的工具設備才能更好地完成。2007年筆者在浙江大學圖書館參觀CADAL項目工作的時候,對其規模之大,設備之精有深刻印象。下面是當時的兩張照片,插在這里以資介紹:第一張是其工作現場,幾十位工作人員正在認真工作;第二張是工作人員正在用西門子專業掃描儀調整所掃描古籍的圖像。

?

  下面要談到的是文字化中文數字古籍,它所具有的最大優點就是能夠準確地進行全文檢索。如北京國學時代文化傳播股份有限公司1999年推出的《國學寶典》,香港迪志文化出版有限公司和上海人民出版社1999年的《文淵閣四庫全書電子版》,廣西金海灣音像出版社與廣西師范大學出版社1999年聯合出版的《古今圖書集成》。此后北京書同文數字化技術有限公司2002年的《四部叢刊》全文檢索版,北京龍戴特信息技術有限公司與北京時代瀚堂科技有限公司聯合開發的“龍語翰堂典籍數據庫”及相關技術系列產品等等。其中《國學寶典》、《四部叢刊》、《四庫全書》都不斷推出新版甚至新的網絡版。新版會糾正原有版本的錯誤,有的如《國學寶典》、“龍語翰堂典籍數據庫”還會增加其文獻內容。就《四庫全書》、《四部叢刊》電子版來講。不存在底本的版本問題,所以其新版就是強化功能、改進技術以及糾正原來錄入的錯誤。我們知道,無論是人工錄入還是掃描圖像辨識都有一定的錯誤產生。前人云,校書如掃落葉,才掃卻又生。100%的正確幾乎是不可能的,所以一開始《四庫全書》與《四部叢刊》在全文檢索版中都包含了圖像版,使得學術研究者引用時能方便地核對原文。但其最初推出時普通的計算機硬盤容量難以有力地支持圖像版,而且學界浮躁之風也使得許多使用者無心核對。而現今的網絡版一般多提供全文檢索功能,而少有同時顯現原文圖像者。這就再一次強調文字版的正確率是多么重要。但是即使與底本100%相同,沒有任何錯誤,研究者在引用時仍然會面臨字庫范圍與現行規范的種種要求。比如《四庫全書》中的避諱缺筆字在其字庫中有,但一般的計算機并沒有安裝這一特定字庫,所以是無法顯現的。而現行的文字規范,無論是字型規范還是異體字整理要求都會對文字化中文數字古籍使用發生影響。即使是紙本古籍的整理這方面的加工也是不可避免的。中華書局總編室在其《古籍校點釋例》中就說:“古書中的古今字、通假字、異體字、俗體字等,一律不出校。宋代以前的古書及有關語言文字學的著作,異體字一般不改。元明以後的書,不常見的異體字及不合規範的俗體字,如「島」作「」,「沿」作「」、「惡」作「悪」、「船」作「舡」、「銜」作「啣」之類,可根據實際情況改成通行的繁體字,改了也不出校。版刻中的錯字,如「焰」刻作「熖」、「祇」(只)刻作「秖」、「千」刻作「」、「餐」刻作「飱」,「寤寐」刻作「窹」之類,應改成規範的繁體字。一本書內的用字應力求統一。用簡體字排印的書可另作規定。”只有經過這些整理加工后的古籍,才能正式出版。我們認為今天的文字化中文數字古籍善本也必須經過這樣的處理。

  這里要說明的是,《國學寶典》系列產品多是簡體字,這能否稱為善本呢?我們以為書籍的載體與字體本來就是與時俱進不斷變化的,這并不影響其是否能成為善本。古書本來是“書於竹帛”(《墨子》),其載體是竹簡(其長度標準隨不同的內容分類而變化)、木牘與縑帛(其標準長度是四丈),其字體是戰國古文、小篆、隸書,其裝訂是編連成冊與折疊舒卷。紙張發明之后成為書籍的主要載體,可以書寫各種字體,特別是后來流行的草書、行書、楷書。印刷術發明前的鈔本多是卷軸裝,當時尚未有“善本”之名,但各種形式的“石經”成為那時的規范標準。而印刷術發明之后,馮道首先用來印刷經籍也成為當時的規范。而字體也從仿效書法家的楷體字(即所謂軟體字)逐漸演變為便于雕版的硬體字(它濫觴于宋最終成熟于明季,就是“宋體字”——臺灣稱之為“明體字”[1])。而1965年頒布的《印刷通用漢字字形表》,當時遵循的原則是“同一個宋體字有不同筆畫或不同結構的,選擇一個便于辨認、便于書寫的字體,同一個字宋體或手寫楷書筆畫結構不同的,宋體盡可能接近手寫楷書,不完全根據文字學的傳統。”為什么這一“新字形”舍棄了雕版印刷長期形成的宋體字傳統呢?因為這時已不用全部雕刻木板而變成鑄造鉛字字模了。宋體字的易于雕刻的原則才能讓位于“便于辨認、便于書寫”和“接近手寫楷書”的原則。對于今天的電子版古籍字庫來說,可以由專業機構制定各種專門字庫,甚至隸書、小篆以至甲骨文、金文、戰國古文等古文字字形。在這種情況下,按照《中華人民共和國通用語言文字法》,一方面“學校及其他教育機構以普通話和規范漢字為基本的教育教學用語用字”,即中小學的文言文教學都是使用規范漢字(包括簡化字),其實大學各科教學,除了中文系的古代漢語與古代文學文選使用繁體字之外,都是簡化字。所以《國學寶典》恰恰同這一教育傳統接軌,有利于廣大使用者更好地接近傳統,認識古典。另一方面,該法律也規定了在“出版、教學、研究中需要使用的”情況下,可以使用異體字、繁體字。這就使得諸如《四部叢刊》、《四庫全書》之類的繁體字電子版古籍也有了合法存在的理由。當然如前所述,即使是繁體字古籍,同樣也要經過一定的校勘與字形處理。而使用簡化字的電子版古籍,我們以為應該同紙本古籍一樣,基本上應以重新發表的《簡化字總表》為準,而不應該無限類推[2]。如果可能的話,可以利用現行字庫,適當地消除某些簡繁“一對多”所引起的困惑。比如繁體的“錢鍾書”,可以寫成簡體的“錢鍾書”,而不必一定要寫成“錢鐘書”。即以“鍾”為“鍾”的簡化字,而以“鐘”為“鐘”的簡化字。因為“鍾”當“鍾聚”、“鍾愛”講,而“鐘”卻沒有這一義項[3]。

  總之,文字版電子古籍,無論使用字庫為簡體或繁體,只要底本選擇的好,校勘精審,都可以成為善本。

注釋:
[1] 參見王立軍:《雕版印刷對印刷字體的影響》,見商務印書館《漢字字形研究》2004年北京。
[2] 李先耕:《簡化字應否無限類推》,見《求是學刊》2002.2期。
[3] 這一觀點較筆者《關于漢字簡化“后退”的思考》(見《語言規劃的理論與實踐》,語文出版社2006年)一文有所松動。

  

Comments are closed.

主站蜘蛛池模板: 永修县| 大城县| 临清市| 兴业县| 华宁县| 包头市| 平遥县| 桃江县| 牙克石市| 黄陵县| 德江县| 兴城市| 基隆市| 兴业县| 宣城市| 彩票| 会理县| 玉门市| 大兴区| 望都县| 通海县| 峡江县| 秀山| 永昌县| 呼图壁县| 布拖县| 巴马| 阿克陶县| 商丘市| 金寨县| 梨树县| 且末县| 晋江市| 新余市| 沁水县| 灵山县| 德格县| 邵武市| 咸宁市| 富宁县| 阜南县|