午夜精品免费视频,亚洲区欧美区,久久成人精品视频,成人免费网站观看

關于制作古籍數據庫的幾點想法

  7月8日下午,我應邀參加了在紫玉飯店舉行的“《國學備覽》光盤出版發行座談會”。座談會由首都師范大學和商務印書館國際有限公司聯合主辦,主要內容是由首都師范大學電子文獻研究所所長,亦即國學時代文化傳播有限公司總經理尹小林先生演示《國學備覽》的功能。尹小林先生的演示極為精彩,充分證明《國學備覽》的制作是很成功的。因此,無論對巧思妙用的研制方,還是對卓有眼光的出版方,我都應由衷地表示祝賀和欽感。

  和通常意義上的座談會相仿佛,盡管其形式更多于其內容,但我還是被深深地感動了,感動我的正是《國學備覽》的成功所昭示的古籍電子化道路,以及未來發展的廣闊前景?!秶鴮W備覽》光盤小巧,容量巨大,檢索手段多樣,且圖文并茂,配有背景音樂,還附編有多種閱讀時使用的工具(字典、年表等)。這些功能大大超出了傳統紙媒體書本的負載能力,閱讀使用中的便捷,亦非書本所能比擬。這讓我不由想到,現在的古籍整理出版工作要想跟上時代前進的步伐,要想取得超逾前人的突破性進展,不正應該從廣泛采用電子技術、多媒體技術、數字化技術入手嗎?

  這個發展的大方向比較容易認清,也比較容易確立。然而要實際做起來,特別是在事情的起步階段,在決策上如何確定自己的立足點,如何制訂符合大方向的可操作性原則,如何解決目前存在的一些具體障礙,則需要認真研究,慎重對待。在座談會上,我曾匆匆談了幾點建議,表達不甚嚴謹,不甚完整,為免引起不必要的誤解,現在想借助筆談的方式再補上幾句話。

  第一個問題是古籍數據庫首先應做什么,也就是古籍電子化的立足點問題。古籍數據庫的最大特點,不外三條:一是容量巨大,一是檢索便捷多樣,一是便于永久保存。這是古籍數據庫的三大優勢,其中不論哪一條都是書本無法望其項背的。那么,這三大優勢運用于古籍整理領域,做些什么項目才最能盡展其長呢?從近幾年各方面開發古籍電子產品的努力及其結果來看,我以為答案已經明了,而且此答案頗有些說服力。

  就以尹小林先生為例,他十數年如一日,苦心孤詣,慘淡經營,所開發研制的《國學寶典》,共收錄經史子集各類典籍3000多種,近7億字,迄今雖未正式發行,卻已不脛而走,澤被萬家,學人莫不大受其益,交口頌其功德。這意味著什么?顯而易見,這說明電子技術非常適合制作大型古籍數據庫項目,而制作大型古籍數據庫項目,對于古籍的保存與傳播,對于古籍的版本價值、學術價值的發掘和利用,無疑是事半功倍的一項偉大創舉。不妨設想一下,如果把《國學寶典》的7億字做成書本,那將會是多大篇幅,會占據多么大的空間,當我們閱讀使用時,又將會化費多大的氣力才能夠翻檢到所需要的內容啊!

  可見計算機技術應用于古籍整理出版領域,最能夠發揮其優勢,最能夠體現其能量的項目,就是制作大型、超大型的數據庫。這樣的數據庫不但信息量極大豐富,而且互相之間可以通檢,一查到底,再加上檢索方法的多種多樣,足可以令人進入隨心所欲的境界。制作這樣的古籍數據庫,我以為目的在于兩方面,一是要盡可能多地完好保存古籍,使之永世長存,徹底根除水火之虞;再就是讓盡可能多的古籍在廣泛的范圍內流通和使用,全面快捷,博大精深,更好地為學術研究服務,為培育全民族的文化素養服務。

  至少在當前一個時期,這兩大目的決定了制作古籍數據庫只能是一種提高性質的工作,換言之,我們當前應該集中力量去開發研制各種大型、超大型的(綜合的或專題的)古籍數據庫,而不必分散精力去做所謂的普及讀物?,F在推出的《國學備覽》,選書81種,簡體輸入,有插圖,有聯機字典,有背景音樂和版面設置,有人認為此即一種普及讀物的典范。而我則難以茍同,請看它收錄的書,統統為無注的白文,別說是高中水平的青少年,即便是大學研究生、講師,甚至專業研究人員,又有誰能夠完全讀通讀懂呢?假如真的要普及到大眾,就不能只是簡體白文,還必須加上注釋,必須做些節選的工作,方可達到取其精華、去其糟粕、弘揚優秀傳統文化的初衷。不過這種普及性工作,用書本來做足矣,而且書本做小一些既便攜帶,又不需電腦設備,何必一定要殺雞用牛刀,動用以大見長、以多樣性見長的計算機技術去與之較短長呢?

  第二個問題是古籍數據庫應該用什么字體輸入,這不止是手段問題,而主要是一個與終極目標聯系在一起的本質性問題。上面已經說到,制作大型數據庫的終極目的之一,就是要盡可能多地完好保存古籍,使之遠離劫難,永存其真。當然,由紙本轉為電子版后,除非掃描,否則原來的行款格式必然會發生改變,但這一切變化都不應成為促使原本文字失真的借口。就是說,行款格式盡可以改變,唯一不能改變、完全可以做到使之不改變的乃是原文。這就牽扯到古籍數據庫該用什么字體輸入,在輸入時應遵循何種原則的問題了。

  當前所見到的古籍光盤,大多采用簡體輸入。這或許主要是考慮到中青年讀者的需要(市場化需要),也或許是受到計算機字庫的限制不得不爾,不管怎么說,用簡體輸入的做法是值得商榷的。用簡體輸入與檢索的便捷無庸懷疑,然而不知制作者想過沒有,如果一旦要恢復引用原文,用簡體版可以做到一字不誤嗎?試舉一例,我在校讀《國學研究》雜志(北京大學傳統文化研究中心主辦)的清樣時,常常發現原稿如為簡體字,則出版社在恢復為繁體時,其中的引文多靠不住,必須復核原書后才可確保其文字不誤。而這種因為由簡轉繁而帶來的復核工作,往往繁瑣不堪,讓人徒增煩惱。

  由此可見,簡體字的一字多義的特點,非常不利于古籍在傳承中保持原汁原味。再說,古籍原本對于研究者來說,很重要的一個作用就是其版本價值。如果我們采用一種經過今人整理的好本子作底本,卻不附原有校記,再用簡體輸入,那么,其固有的版本價值早已隨同重新輸入喪失殆盡,即使在制作過程中再三認真校對,又有何用?就如同清人修纂的《四庫全書》,我們到如今珍視它,不為別的,只因為它所收錄的書品類繁多,有不少屬于稀見書、絕版書,取閱方便而已,若論其版本,則委實不足信據也(《四庫》獨有孤本除外)。

  清朝人深恨明朝書商翻刻宋元諸本往往裁篇別出,偽造剜改,版本冗濫不堪,慨嘆“明朝人刻書則古書亡”。如果我們今天制作古籍數據庫,一概遵從簡體,使用者亦就便一切從“簡”,久而久之,有幾人還能識得繁體古書?簡體古籍數據庫愈流行,愈便于使用,繁體原文愈少人問津,每想到此處,我真有些杞人憂天,擔心后世子孫會不會指責我們這一代人“以簡體制作數據庫而古籍亡”。所以,我堅決主張從現在開始所有古籍數據庫的制作,其輸入一定要采用繁體字,而且還可以再保守一點,古籍底本上的異體字、通假字一字不動,悉如其舊,惟有底本的后人避諱字、脫誤衍倒之類謬誤予以改正,并逐一寫成??庇浖右哉f明。

  也許有人會說,用繁體制作數據庫,不是成心和當代讀者過不去嗎?非也。這不是和圖書市場對著干,成心做賠本生意嗎?不會的。因為現階段的計算機技術已經可以輕易解決繁簡翻轉問題,在鼠標一點便可將調出的繁體文字轉換為簡體的情況下,絲毫不會影響熟悉簡體的讀者們的閱讀興趣。而對于學術研究者來說,卻可以省去翻檢原書復核原文的麻煩,徑直用古籍數據庫替代眾多的古籍版本使用,豈不妙哉?

  第三個問題是在光盤制作中如何安全通過著作權這一路障,既能保證光盤的學術質量,又可避免陷入無謂的版權之爭?,F在制作古籍數據庫,通常采用兩種方法,一是直接選用未經整理的某種古籍版本作底本,稍加點斷后改用簡體輸入;一是借助他人已有的整理本,去其校記和注釋改用白文輸入。前者雖不會有版權糾紛,但學術質量難以保證。后者學術質量肯定要好些,但弄不好也會露出馬腳,遭人詬病。況且這種偷梁換柱的屑小手法,與堂堂正正制作古籍數據庫的聲勢旗幟也有些不合拍。

  如何計出兩全,我以為應從制作方和出版方兩方面著手,共同做出努力。就制作方來說,除了網羅計算機技術的高手,還應該擁有一定的古籍整理人才,二者結合則可以先把未經整理的古籍整理好,然后輸入制成光盤,制作方享有著作權,確保自身利益得以實現。有志于此項事業的尹小林先生,現在已經被首都師范大學招至麾下,組建了電子文獻研究所(國學時代文化傳播有限公司),成了一支威武雄壯的正規軍。相信他們會走技術加學術的路,延攬兩個方面的人才,自主整理古籍,自主開發數據庫,不但在計算機技術上始終走在時代前沿,而且也會發展成為古籍整理研究的一方重鎮。

  從出版方來說,如何保障制作方的權益是至關重要的。其中最主要的環節是防止盜版,以維持發行數量,實現經濟效益。當前要杜絕盜版還是一個難題,但愿伴隨政府有關部門治理力度的加大,情況會有根本性改變。我這里想說的主要還不是盜版問題,而是出版方和制作方的合作問題。一些專業古籍出版社如中華書局,古籍整理出版的成果豐厚,堪稱資源大戶,如能將其已有資源再作數字化開發,必然會在繁榮學術方面做出更大貢獻,這件事中華書局固然可以在社內組織力量做,自產自銷,但也可以與外部合作,譬如與尹小林先生的國學時代文化傳播公司合作,這樣可以使雙方優勢互補,反而會將投入成本降低,產品出得快,質量好。合作的關鍵是資源如何共享,利益如何分割,不僅制作方、出版方的利益要有保證,而且參與點校的整理者的利益也要有保證。加上學術界的受益,這應該是一種四方共贏的良好結局。

  目前的現實狀況不容樂觀,一則制作方變相使用出版方的資源,出版社的利益流失嚴重;一則制作方為防授人以柄,干脆擯棄點校精湛、有注有譯的整理本,徑用白文輸入,導致學術上重走回頭路。在這兩種情況下,古籍整理者的利益根本無從談起。為使三方愉快合作,避免將書本式整理成果編入數據庫時產生版權糾紛,我建議在出版社與古籍整理者簽定的出版合同中,事先列入授權日后制作電子版的條款,并提出合理的付酬標準。

  第四個問題是綜合性數據庫和專題性數據庫的制作孰先孰后的問題,這只是一種策略考慮,并不存在優劣之分。譬如尹小林先生制作的《國學寶典》、《中國歷代基本典籍庫——隋唐五代卷》(商務印書館國際有限公司2000年版)屬于綜合性數據庫,同樣由他制作的《十三經注疏》(商務國際2003年版)、《六十種曲》(附《盛明雜劇》,商務國際2003年版)則屬于專題性數據庫。這兩種數據庫各有用途,制作起來也各有難易。不過相比較而言,主題性數據庫畢竟范圍明晰,做起來可能時間會短一些,也會更精細一些。

  憑我個人的感覺,綜合性數據庫如能分成一個個專題性數據庫來做,似乎更易于見成效,最后建成的綜合性數據庫也更顯得基礎扎實,檢索細密。如上舉《中國歷代基本典籍庫》,它的性質是綜合性數據庫,而其做法則是分為幾步完成。現在完成的是第一步,推出了《隋唐五代卷》。下面將是第二步、第三步、第四步,陸續推出《先秦兩漢魏晉南北朝卷》、《宋遼金元卷》、《明清卷》。每一步都可以視為一個專題,每個專題下所收錄的內容又是綜合性的?!端逄莆宕怼饭蹭浫?36部有關唐五代的重要文獻,總字數多達1億字,十分了不起。但順便說一句,也許因為結稿時限緊迫,所收書目思慮未周,間有可商之處。譬如唐代詩文類有總集而無別集,史籍選讀類有《唐會要》(宋王溥撰)而無《五代會要》(宋王溥撰),地理文獻類不收《元和郡縣圖志》(唐李吉甫撰),類書類不收《北堂書鈔》(唐虞世南撰),其他雜著類不收《續高僧傳》(唐釋道宣撰)等,均不免令人感到遺憾。

  以上所說,是我參加座談會后的幾點感想,無庸諱言,這樣的粗淺表述,既缺乏理論研究的深度,也不具備實際操作的經驗,之所以貿然形諸文字,無非野人獻曝,藉此感謝座談會主人邀約之殷,同時亦愿向制作古籍數據庫的先驅者——我一向敬重的朋友尹小林先生討教而已。

原載《古籍整理出版情況簡報》2003年第11期(總393期)

  

Comments are closed.

主站蜘蛛池模板: 翼城县| 贵港市| 北京市| 启东市| 青河县| 济宁市| 无锡市| 葵青区| 彝良县| 象州县| 金坛市| 合江县| 淮阳县| 泗水县| 山东| 连城县| 邢台县| 南召县| 巫山县| 高雄县| 尼勒克县| 吉安市| 新化县| 湄潭县| 安宁市| 东丽区| 武定县| 蕲春县| 新郑市| 瑞安市| 保亭| 安龙县| 万全县| 措美县| 道孚县| 宁陵县| 洪雅县| 文安县| 镇平县| 安仁县| 贵定县|