“日本所藏中文古籍數據庫”簡介
該數據庫由京都大學人文科學研究所附屬的“漢字情報研究中心”(2008年4月后改稱“東亞人文情報學研究中心”)在2001年發動,參加者有東京大學東洋文化研究所附屬的東洋學情報研究中心。至2008年5月,加入數據庫的主要是全日本的大學圖書館,國立圖書館和地方政府的公立圖書館次之,財團法人的私立圖書館較少,計55個,目前錄入的數據總數達748585條,現仍在進行之中。
“日本所藏中文古籍數據庫”的古籍目錄的分類,以《京都大學人文科學研究所漢籍目錄》為基礎,參酌《內閣文庫漢籍分類目錄》。漢字編碼用的是國際通用的UTF-8編碼。據主編者的意圖是“不僅限于日本國使用,而是以提供給世界各國使用為目標”。編者為了讓日本、中國大陸、臺灣、韓國等任何一種編碼系統都能檢索,編者還將各國的漢字對照表加進檢索軟件中。
該數據庫基本上是個目錄數據庫,沒有收錄文本內容。但為了辨別不同版本,盡可能附上卷頭的影印件,目前已影印一萬多件。還有一部分圖書,已連接到人文科學研究所的全文畫像數據庫,可以閱讀全文。
資料來源:高田時雄《“日本所藏中文古籍數據庫”介紹》,見《漢學研究通訊》2010年2月,總113期)
陳友冰摘編