午夜精品免费视频,亚洲区欧美区,久久成人精品视频,成人免费网站观看

古籍資源的金字塔知識結構數據組織

(發言提綱)

  一、非常幸運的是,古籍資源的數字化工作相比于民國書報刊和建國以來書報刊資源的數字化而言,一點也不顯得落后,從上世紀80年代以來,有全面開花、蓬勃發展之勢,其中的原因,主要是古籍中存在著若干個集合性界限分明的板塊、原始古籍沒有版權問題以及當代出版人的后知后覺;

  二、但目前古籍數字化的重點,在于板塊的選擇(如《四庫全書》《地方志》《家譜族譜》《中國基本古籍》等等)、文字的處理、全文檢索和輔助工具的設置等等,在數據的組織、信息的相關相似度計算處理以及隱含知識的挖掘等方面,還相對較弱,也就是說,數據處理尚有深入的余地;

  三、就數據組織而言,我在這里提出金字塔知識結構的概念,并準備在古籍資源數字化的實踐中試加運用;

  四、金字塔知識結構或曰金字塔知識層次,是基于知識創造的次第而提出的。就大的框架來說,我將文本資源分為原始資料、研究成果和工具書三個層次,原始資料當然應該是最先有的,其次是研究成果,最后才是工具書,工具書一定是在原始資料和研究成果的基礎之上提煉概括出來的。如果將工具書置于頂部,其中間部分是研究成果,底部則是原始資料,這樣就形成了我所說的金字塔結構;

  五、原始資料、研究成果和工具書又各可以分為若干個小層次,工具書可以分為綜合性大型辭典、字典詞典、專科辭典、大事記年表等層次,研究成果可以分為綜合性比較強而又主要循橫截面結構邏輯展開的、具有梳理性和一定程度的學術原創性的著作的“志”類圖書(《中華文化通志》、各種專志方志、教材類著作亦可入此)、大體以時間為序主要循縱向邏輯展開的、具有梳理性和一定程度的學術原創性的著作“史”類著作(如《中國通史》《中國斷代史》《中國文學史》及諸多專史等)、循作者各自選擇的論證邏輯展開的表述研究結果的富有學術原創性的學術文化專著(包括學術文)等層次,原始資料則可以分為經過標校整理的古籍(如《古典文學叢書》《全宋文》等等,這是加工程度較高的古籍資料,對于進一步的專題研究功用最大,可惜數字化程度卻最低)、經過整合而未經標校整理的古籍(如《四庫全書》《續修四庫全書》《古本小說集成》等等)、以圖片為主的圖書和圖片;

  六、如就純古籍而言之,則亦大體可以分為工具書、研究整理著作和原創作品三大層次,其中工具書可以分為類書和訓詁書、字書和韻書、大事記和年表等等,研究整理著作可以分為原典的注疏釋箋著作、史志類著作和研究專著、筆記等等,原創作品可以分為經史子原典、詩文作品等等;

  七、前面已經說過,金字塔知識結構的構筑,大體以知識創造的次第為序,由下而上,將提煉程度最高的工具書放在金字塔的塔頂上,由經過梳理和概括的成熟知識深入到學術成果乃至原始資料,知識點之間由淺入深地有機鏈接,成為一個有內在聯系的知識整體,這樣的數據庫組織和鏈接方式是根據使用者的層次和需求決定的;

  八、如《中國大百科全書》《辭海》這樣的百科全書和百科辭典,是經過高度提煉的高質量工具書,在知識體系的嚴密性、平衡性,知識點表述的準確性和簡明性方面,是其他文本數據所無法比擬的。而且它們用眾多的條目展開全部知識,一個條目就是一個知識細胞,使查檢靶的明確而集中,故可以其條目為金字塔的核心知識群,其他文本數據,均可與之依緊密程度呈漣漪狀地與之相鏈接。

  九、對于一般的求知者來說,可以借助工具書條目直接、迅速地找到所需知識的簡明而準確的表述,成為他們不可或缺的知識之友;對于大學以上的深造者和專業人士來說,又可通過塔型知識庫從有關問題的一般表述開始,進而找到相關研究成果和所需的研究資料,使研究的起點更高,從這一點上來說,它又將成為專業研究和論文撰寫的最好的工具,這也是一種研究支持功能;

  十、基于上述目的,應從對擬收資源各層級文本之表述方式的分析出發,運用先進的數據庫技術,逐步對塔中的全部知識作科學而細致的類分和標引,使其知識之存儲方式發生質變,從而其搭配取用方式也發生質變,類聚相關相似知識,挖掘隱性相關知識,而且產生無窮的新知識。它將獨立于紙介質出版物而存在,既利于查檢,也利于研究,其功能在原出版物的基礎上得到增強。

  

Comments are closed.

主站蜘蛛池模板: 巩留县| 天门市| 岳阳市| 三亚市| 富平县| 洪洞县| 开鲁县| 徐水县| 旌德县| 汝城县| 澄城县| 榆林市| 随州市| 马山县| 勐海县| 汤阴县| 开原市| 广水市| 南召县| 巫山县| 佛山市| 登封市| 汾西县| 板桥市| 武宁县| 永吉县| 西丰县| 永靖县| 澜沧| 哈巴河县| 福清市| 灵寿县| 仁寿县| 房产| 东平县| 华坪县| 都匀市| 准格尔旗| 漳平市| 电白县| 桃江县|