淺議古籍數字化建設中的學科分類與古籍專題庫建設
【內容摘要】本文梳理、分析了中國古籍數字化研究中涉及到的分類概念,區別了古籍文獻分類與數字化過程中學科分類的概念,闡述了二者各自的內涵和意義,從理論探索和實踐需求的角度,提出了古籍專題庫建設的原則和要求。
【關 鍵 詞】古籍數字化;分類;專題庫建設
【作者簡介】李桂榮,女,1966年生,青海省委黨校圖書館,副研究館員。
一、分類、學科分類、文獻分類的概念及聯系
分類是以事務的本質屬性或其它顯著特征作為依據,把各種事務集合成類的過程,是人們認識事物、區分事物、組織事物的一種邏輯方法。不同目的的側重和不同對象的關注,產生不同的分類邏輯方法。
所謂學科,是關于客觀世界中特定事物對象的本質特征和規律的知識體系。[1]學科是科學的個體,是科學區分不同領域知識系統的框架工具。學科分類是對對象進行學科劃分,確定其在整個科學體系中的位置以便于識別、區分的分類體系。學科分類法是按照對象的學科屬性結合對對象的使用需求(如研究需要)對對象進行分類的方法。
文獻是記錄知識的載體,文獻分類是指根據文獻內容和形式的異向,按照一定的體系有系統地組織和區分文獻。如我國的“古籍”、“民國時期圖書”和“現代普通圖書”、“網絡文獻”、“國外文獻體系”等。文獻分類法側重以事物對象為中心加以編制,如我國古代的皇家藏書提要匯編《別錄》及在此基礎上編定的《七略》,后來的《四庫》系列、英國布朗的《主題分類法》的文獻分類等等。
由于文獻分類是以文獻主題內容等屬性關系進行的,符合知識之間關系的系統性。因此文獻分類的發展與學科分類是密切相聯系的。由于學科分類體系是按照知識關系的內在規律性進行的,所以以學科分類為基礎,可以更好地反映知識之間的聯系,更有利于文獻的系統揭示和使用。正是如此,現代文獻分類法基本上都是依據當時的學科分類水平或體系進行,例如《杜威十進分類法》、《美國國會圖書館分類法》、《日本十進分類法》、印度S.R.阮岡納贊的《冒號分類法》、我國劉國鈞編的《中國圖書分類法》、皮高品編的《中國十進分類法及索引》等等。由于我國歷史上的使用需求和局限,在我國古代,古籍分類的目的主要是“組織藏書,體現分類者‘辨章學術,考鏡源流’的學術水平”[2]。與學科分類不同,文獻分類關注的僅僅是國內已經生成和留存下來的文獻體系,沒有關心現存文獻以外領域和對象。因此沒有完全發展為科學意義上的學科分類,所以它與學科分類是兩個關注對象和內涵都有差異的概念,在結構上很相似,都是采用體系分類法,學科分類保持整個科學知識體系的系統性,我國古籍文獻分類法保持個體文獻體系(僅是我國“古代”、“現存文獻”這個區域、時段和對象的個體體系)的完整性。
我國古籍總類自晉代以來發展了一千八百多年,文獻分類法隨著文獻的內容、形式的發展而發展,“四部”分類法最終占上了主流地位;而學科分類法是為識別學科在科學體系中的位置類分而存在的理論邏輯,是隨著人類整體科學的發展和學科的日益豐富而出現和完善的。所以說,文獻分類法是一種偏重于編目、服務于編目的語言,而學科分類法是一種事務的類分邏輯,價值更側重于于檢索區分。在學科分類已成為科學研究發展的一個重要需求的今天,學科分類法為我國古籍在計算機條件下統一分類編制以更好地開發利用即古籍數字化提供了條件。
二、學科分類與古籍文獻分類的區別及古籍數字化的學科分類要求
綜上所述,學科分類法側重于對學科對象的條理區分,文獻分類法側重于對文獻對象的有邏輯地組織。我國古籍文獻分類法雖然也是以學科分類為基礎進行的,但除了上文中提到的產生、發展中的特點差異,要想進一步說明它與現代學科分類的區別,至少還要具體考察以下兩個方面:
其一,對象不同。現代學科分類的對象為某一主題或一組主題領域,是按照不同的研究方式以及其現象確定的,比較單純。古籍文獻分類的對象是古籍文獻,既有其內容方面,又有其體裁形式、版本等方面的要求,涉及的因素比較復雜,與學科分類存在著諸多差異。在內容范圍上,古籍文獻分類需要涉及的范圍更廣、更深、更復雜。一方面,一種古籍文獻往往會同時涉及兩門或多門學科,如儒家十三經,《易》、《論語》、《孟子》、《孝經》歸屬哲學學科,《尚書》、《左傳》、《公羊傳》、《谷梁轉》、《周禮》、《儀禮》、《禮記》歸屬歷史類,《爾雅》歸屬語言文字類,《詩》歸屬文學類。另一方面,古籍文獻中除了學科層次的內容以外,比學科分類的對象更為多樣。如除了經、史、子、集四部是按學科內容設立的,還有綜合性的和專門性的叢書以及輯錄匯集資料以利尋檢、引用的工具書—類書。文獻分類具有學科內容、著作方式和裝幀形式、生活用途等不同于學科分類要求的特點,以及以國家、地區、時代、人物等具體內容為獨立體例的立類標準,因此比學科分類復雜和專指。
其二,功能不同。學科分類的任務是根據其研究對象,明確學科的劃分及其相互關系,確定每門學科在學科分類體系中的位置,目的是用以制定科學研究計劃,建立科學研究機構和確定科學管理體制,正確設置專業以及進行不同門類之間的協調等服務。也可以作為各種具體應用,如文獻分類、行業分類等的基礎。在數字化網絡環境下,學科分類還可以用于文獻資源數字化分類的指導思想,揭示網絡信息環境下文獻資源的學科關系。其形勢可以比較自由,可以采用文獻分類采用的線性的列表形式,也可以根據計算機對學科知識關系表達的需要,以其他形式表示,例如,方框圖、樹形圖等,以二維、三維的圖形形式加以表示,并可以根據計算機對學科關系的理解,自由調整,揭示學科知識元之間、學科知識單元之間及其二者之間的關系,便于數字文獻使用者對學科知識的檢索、查詢以及計算機的智能處理。而古籍文獻分類法的任務主要是組織和揭示古籍文獻,功能應該是提供實體文獻的完整性(體例、體裁、類目、裝幀等)、真實性(善本、版本等)及其整體之間的聯系性、系統性、連續性。由于古籍文獻處理具有歷史累積性的特點,古籍文獻分類體系作為古籍文獻組織的工具,一般要求相對穩定,以已經發展成熟且具有代表性的“四庫”法為標志,合理組織古籍文獻體系,只能是將它完善、更趨于使用的便利,而不是將它廢棄、不用。
古籍數字化,是將古代典籍中以文字符號記錄的信息輸入計算機,從而實現了整理、存儲、傳輸、檢索等手段的計算機化。[3]是按照文獻信息所載知識的學科屬性,根據文獻信息內容之間的相關性,組織成科學的便于計算機識別和處理的體系,由計算機對古籍文獻進行管理和再現,滿足讀者、用戶對古籍的數字閱讀需求。因此,古籍的學科分類首先是數字閱讀時代由計算機提出的。古籍數字化過程中計算機性能和系統把古籍與學科分類法緊密拉在一起。
三、面向數字化學科分類需求的古籍專題庫建設
適用于學科基礎建構,推動學術發展的古籍數據庫,應該是結合古籍文獻體系特點和計算機雙方長處的結晶,面對古籍體系的價值和機讀后檢索要求,一方面我們不能毀棄傳統目錄學中關于圖書的四部分類法對所收文獻所進行的組織分類,同時在技術上,還要保證計算機、數據庫有強大的檢索功能,知識重組功能。
首先,文獻分類不能等同于學科分類用做計算機分檢方法。從文獻本身的完整性價值來看,文獻分類的對象必須是文獻,而不是單純的學科內容本身,所以必須以保留文獻的完整性特點加以處理,完整地提供給讀者用戶。特別是在建設面向學者,為科研服務的文史類數據時,應審慎、嚴格、規范地按照傳統目錄學的相關知識對所收文獻進行排列、設置。絕對不能憑借數據庫強大的檢索功能而疏于對數據按照古籍體例特性進行考慮。
其次,文獻的計算機處理還必須使用學科分類語言,根據科學研究和管理的需要對古籍體系在保持它的相對完整性前提下加以學科分類。符合學術規范、對學科建設有更大裨益的古籍數據庫應是將文獻分類法組織起來的古籍文獻和計算機方面的功能結合起來的讓讀者和用戶了解與研究中國傳統文化與學術的開放式生態系統。
對于計算機而言,無論是列舉式分類法還是分面組配式分類法,最終都還需要歸結為線性次序;同時,還需要以一定的標記符號對古籍文獻類目之間的關系進行表達,以便可以使其作為文獻標引和檢索的工具有效地加以使用。理想的數字化過程,是給古籍類目配上學科分類號,再把類號交給讀者,讓讀計算機使用者能夠自主、快捷地使用分類檢索途徑查檢古籍分類及其所需內容。新的古籍分類法還應同時附上“古籍分類法主題索引”[4],以方便分類法和分類目錄的使用者自如操作、使用。
再次,建立古籍專題數據庫要注意遵循以下原則進行選題和策劃:
1、突出專題性和保持體系性。古籍專題數據庫建設的目的根本上就是要向用戶提供一種在內容上具有某一專題特色的資料查考或知識信息服務。為了吸引用戶,也為了避免資源建設的重復浪費,就一定要考慮有一個很好的選題。專題數據庫的選題策劃既要考慮用戶的個別需求,又要考慮古籍完整體系的價值,同時也要考慮計算機處理的可行性,進行可行性分析。專題數據庫之所以能夠脫穎而出,在許多綜合性的大型數據庫已經建成使用的情況下有其生存的空間,正是因為其突出專題原則,可以兼顧個性化需求和達及個體文獻開發利用的深度。有利于零碎的館藏資源深加工和被利用。因為盡管一些大型數據涉及的專業、學科全面而廣泛,但就某一學科、某一專業或某一領域而言,它不可能像專題數據庫那樣能夠集中力量,最大限度地去窮盡相關的不同類型的數據資料。還有好多圖書館,所藏古籍資料是零散的,體系不完整的,利用專題庫方式把零散典籍及其相關研究成果組織起來,加以揭示就是可以實現有限資源的深加工和充分利用。
2、建設實用性和兼顧共享性。數據庫只是工具層面的東西,實用性才是目的。專題數據庫建設的目的是為了最大限度地滿足用戶的文獻信息需求,發揮圖書館的功能和體現圖書館存在的價值。一個專題數據庫的價值的存在的意義主要在于它是否能用,有用,實用,好用數據庫群建設的主要目標之一是在使用過程中產生知識增值,如在不同的檢索路徑中衍生知識地圖,給檢索中意外的知識收獲。計算機智能技術可為特定讀者量身定做所需,例如引文分析,數據評估,等。來自多處來源地的信息聚集在同一平臺為讀者進一步準確選擇,縮小范圍,提供步步逼近目標的基礎可檢索的結構,提供調整思考的機會,創建快速訪問的條件。同時,利用數據庫的基本數據模型的足夠靈活性和古籍資源體系的多維性,實現資源共建共享。由于各古籍收藏單位的古籍排架順序和手工目錄相對穩定,而電子目錄編排的極端靈活,只要確定計算機系統與古籍資源體系的對應關系即可達到分類統一的目標,可使各單位已經長期使用的不同的古籍分類法保持不變。不僅不會改變古籍原有分類目錄和藏書布局,也方便本館讀者的習慣使用。協調組織機構實現“統一平臺、統一界面、統一標準”,從而充分體現出專題數據庫的共享原則,使共享為實用性的前提和必要。
3、注意古籍文獻文本信息分類和數字化后成為網絡信息的學科分類區別,同時重視網絡用戶獲取信息的方便性和易用性,采取分類法與關鍵詞同時并用的古籍知識組織和檢索技術。由于網絡用戶的范圍十分廣泛,他們的知識水平、知識結構、工作崗位、專業、上網目的和利用信息的種類存在明顯差異,這一切導致各種用戶查詢和利用古籍信息的角度不同、方法不同、類型不同、深淺程度不同。在這種情況下,對古籍搜索引擎類目的命名除了要保證其科學性、準確性、簡潔性以外,還要注意盡量采用自然語言,以增加類名的透明度,滿足廣大終端用戶的需求。古籍知識之間的聯系是多方面的,一個主題或事物,可以同時從屬于兩個或多個知識門類,也可以在從屬關系以外有其他的聯系。古籍分類搜索引擎應該提供不同角度的檢索入口,以適應各種類型終端用戶的需要。同時由于網絡信息資源的虛擬性和可多角度揭示性,可以使古籍文獻體系在網絡環境下擺脫文獻分類法單線性的限制,在網絡傳播中進行靈活的全方位揭示。超文本技術和鏈接技術能夠為構建多維化的古籍知識體系提供技術支持。
總而言之,隨著現代信息技術和互聯網技術的迅猛發展,在古籍數字化建設過程中建構完善的現代網絡信息分類法已經成為圖書館學、情報學、計算機技術與網絡技術專家學者共同關注的亟待解決的一個重大課題。
注釋與參考文獻:
[1] 圖謀博客,面向學科分類的高校圖書館文獻資源建設,2005年12月3日。
[2][4] 鮑國強,數字網絡中古籍分類的作用和趨勢,《文津流觴》第八期,2005年4.15.
[3] 劉琳,吳洪澤.古籍整理學,成都:四川大學出版社,2003年版。