簡述史學研究的新手段
(上海師范大學? 人文與傳播學院,上海? 200234)
史學研究的新手段指隨著科學技術和電子信息的發展,歷史學的研究手段和工具也發生重大變化甚至可以說是革命性的變化,如網絡(查詢方式的變化)、計算機(書寫工具的變化)、研究資料的數據化,知識庫(檢索方式的革命),這些手段和工具的改變對歷史學的研究產生重要影響。這種影響不僅僅是史學工作者“換筆運動”那么簡單,而是涉及到在信息時代史學本身如何現代化的問題,也是關系到史學自身發展的深層次問題。
1.網絡
隨著計算機技術的發展和信息化時代的到來,歷史學科的研究也進入了一個嶄新的階段,利用國際互聯網絡,對古籍、文物資料進行檢索傳送、鉤稽參照,已成為現代史學研究的發展趨勢。日新月異的計算機與網絡技術,正在給古老的歷史研究注入新的活力。國際互聯網絡上的史學資源浩如煙海,若離開網絡搜尋器的支持,要找到所需的資料,如同大海撈針一般。因此,在進行以學術研究為目的的資料查詢時,率先訪問能夠提供超級文本鏈接的相關網站,不失為一條捷徑。學會使用搜索引擎是重要的環節,是尋找一切資料的最基本手段。如百度、Google、雅虎和搜狐等公共搜索引擎不僅可進行搜尋檢索,而且可進行實時性的提問。許多國家的研究機構和大學圖書館的網站以及一些學術性的網站,如中國期刊網、學位論文網等更是我們經常利用的。有關史學的一些專業性的網站,如中國歷史資訊網、光明歷史網、國史探微以及各種斷代史、專門史研究網站等也如雨后春筍般出現,大大便利了學者們的研究工作的開展。拿敦煌學來說,據陳爽先生統計目前有關敦煌學的網站資源達32個,相關網站與網頁資源16個,如此之多的網絡資料,確實為敦煌學研究的發展起到促進作用。另外,論壇也不能忽視。運用論壇進行學術交流是一種新的交流方式,學者們已經逐漸熟悉和適應。現在比較具有代表性的文史方面的論壇有北京大學中國古代史研究中心國史論壇、上海師范大學域外漢文古文獻研究中心網站論壇、國學論壇、中國經濟史論壇、象牙塔、往復等。
2.計算機
計算機的出現是書寫工具上的一次革新,鍵盤取代了筆桿,無疑使論著寫作更加便捷。過去撰寫論文、著述,往往用復寫紙復寫數份,除郵寄投稿外,還須保留底稿,以便今后查核、利用。且不說這幾份復寫稿是否夠用,即使再次利用時,查檢文章中某一內容也十分不便。計算機技術則有效地改進了這一傳統學術研究中的缺陷。這主要表現在以下四個方面:一是計算機保留的文本是長期乃至可以說是無限時的,需要時就可以輸出文本,省去了原來再次抄錄的時間。二是它允許作者將保存的資料隨意復制全部文本或部分內容,而且可以任意修訂,因而為論著寫作提供了極大的便利。三是計算機寫作速度大大超過手工寫作。目前常用的輸入法有十幾種,如微軟拼音輸入法、智能ABC輸入法、全拼、鄭碼、王碼、智能陳橋輸入平臺、紫光拼音輸入法,甚至還出現了可手寫輸入的“逍遙筆”。許多輸入法還可進行中文簡體和繁體的輸入及轉換。比起手工寫作,可謂省時省力,這些都是有目共睹的事實,無須贅述。四是作品的寄送、出版也更加快捷。過去把文章或專著交給雜志社、出版社,大都以郵寄的方式,現在發送Email給對方,安全便捷,還省去一些出版工作環節。
3.研究資料的數據化
隨著計算機技術的迅猛發展,我們已經開始進入一個數據化文獻時代。所謂數據化文獻時代是與傳統文獻時代對比而言的,傳統文獻時代是以有形文獻(如甲骨文以甲骨、金文以青銅器、書籍以紙張之類)作為主要傳播手段,因此研究者只能依靠眼看手記的手工方式進行學術研究,而數據化文獻時代則主要以無形化文獻(研究資料的數據化)作為傳播手段,研究者依靠強大的計算機功能來進行學術研究,擺脫了原始的研究方式。傳統的學術研究,查閱文獻、摘抄卡片、添加批注、排比整理,是歷史學者搜集、處理所需原始資料的常用方式。學者的首要任務是進行創造性的思維,但資料工作花費了他們一半以上的時間與精力,大大縮短了其學術生命,這是史學研究中的最大浪費。數據化文獻時代對傳統人文科學與社會科學的發展提出了挑戰,利用電腦等手段對中國古籍進行整理、分析和研究,已成為學術界迫在眉睫的工作,也為史學研究的現代化提供了種種便利。電腦檢索具有速度快、容量大、準確度高和搜尋范圍廣的特點,能夠高速度、高效率地窮盡史料,可以把學者從枯燥的翻檢工作中解放出來,從而把主要精力投入到更深層次的分析比較和理論思索中,以便能準確地把握歷史發展的脈絡。總之,研究資料的數據化為學者研究帶來了莫大的便利,其中包括:文獻資料的家庭化、珍貴資料與善本書籍的普及化、研究信息傳播的迅速化、資料卡片的有序化、資料檢索的準確化及論文寫作的便捷化等等。特別值得注意的是,研究資料的數據化為史學研究提供了充分的量化資料,有利于學者利用數理統計的方法進行定量研究,這種計量史學的方法可以應用于許多歷史現象發生周期的研究,例如人口增減、物價波動、經濟升降、王朝更替、社會盛衰、邊界變動、戰和交替等。
目前大部分歷史學研究資料幾乎都已經開始數據化,如文淵閣四庫全書電子版、漢籍全文檢索系統、二十五史多媒體全文檢索閱讀系統、國學寶典等等。譬如,《四庫全書》是清代乾隆年間官修的規模龐大的百科叢書,它彚集了從先秦到清代前期的歷代主要典籍,共收書3400余種,79000多卷,分裝36000多冊,總字數約9億。現在的文淵閣四庫全書原文電子版只占7個多G的硬盤空間,在保存了原書文獻真實性的基礎上,還提供完備的閱讀及檢索功能,它在使用、存放、搬運、價格等各方面的性價比優勢是顯而易見的。又如,由陜西師范大學歷史文化學院開發的漢籍全文檢索系統,是史學數字化平臺建設的典范,該系統目前已改進為4.20版,收入文史哲類古籍文獻2960種,共15.4億字。其中包括繁簡兩體《二十五史》、《十三經注疏》、《大正新修大藏經》、《四庫全書總目提要》、《通典》、《朱子語類》、《藝文類聚》、《全唐詩(加注本)》、《全唐文》九種,共3.9億字。該系統對于從根本上改變文史哲研究者的工作手段和條件具有重要意義。
4.知識庫
“知識庫”是指將數據經過加工整理成知識,并對這些知識以一定的結構加以分類、組織及管理,以供人檢索利用的數據集合。體現一種人和知識間的“互動”以及人和人之間的“互動”的理念。如所周知,傳統的紙本工具書,包括索引、類編、目錄、年表、歷史地圖等,盡管已經提供了相當多的便利,但是仍然不能擺脫紙本檢索工具的種種缺陷,如門類不齊全,排檢方式單一,缺少綜合條件和漸進式檢索方式,無法產生再生資源,只能部分地完成信息查詢功能,不能做到海量數據中的知識發現,攜帶不便等。知識庫的開發正是為了解決紙本媒介存在的上述問題,確保信息查詢的查準率和查詢率,并實現海量信息中的知識發現。
知識庫(Knowledge Base)又不同于一般的數據庫(Data Base),所謂的數據庫就是將數據匯集、整理并加以結構化,以供人檢索瀏覽的數據群。資料是僵硬的、死板的,數據所能發揮的功效視使用人的學養而定,不同的使用者會有不同程度的運用與發揮;相對而言,知識是靈動的、活化的,容易為人所吸收利用的,使用者的程度并不構成吸收或利用上的障礙。以敦煌學為例,目前專為敦煌學建立或者與敦煌學相關的數據庫已然不少,已經完成或尚在規劃及進行中的如“敦煌學研究論著目錄數據庫”、“敦煌文字數據庫”、“絲綢之路地名規范數據庫”、“敦煌吐魯番學學者檔案數據庫”、“絲綢之路專題數據庫”、“國際敦煌學項目(IDP)數據庫”、“敦煌遺書數據庫”、“敦煌佛教人物數據庫”、“敦煌圖像數據庫”等等。比較而言,敦煌學知識庫的入庫范圍更加廣泛,它不同于任何單個數據庫,也不是多個資源庫的疊加。2005年11月,由上海師范大學域外漢文古文獻研究中心和中國敦煌吐魯番學會、敦煌學國際聯絡委員會共同主辦的敦煌學知識庫國際學術研討會在上海師范大學召開,提議建立一個可以融通各大數據庫、具備跨數據庫的檢索功能、涵蓋敦煌學常識、學識、文物、文獻、學術資料、研究成果等理想的“敦煌學知識庫”。
歷史學研究的新手段當然不只是以上四種,譬如我們還可以利用計算機對某些歷史場景進行模擬,通過虛擬復原使研究得到比較直觀的參考。海外這一方面的發展已相當成熟,產品相當多,比如《古埃及虛擬旅行大百科》(Egypt Antique 3D 2004 DVD),這一軟件可以使人徜徉于古埃及的立體場景之中,隨意瀏覽,好像回到了5000年前。國內也有一些很好的嘗試,例如浙江大學計算機科學系與敦煌研究院合作進行的“敦煌石窟虛擬重現與壁畫修復模擬”研究,除了利用虛擬現實技術實現了敦煌石窟虛擬展示而外,還利用壁畫復原與演變模擬系統完成了壁畫圖像色彩的數字化復原與歷史演變過程的模擬。
最后需要指出的是,計算機雖屬智能工具,但畢竟只是工具而已,不能代替人腦。新手段的應用對于歷史學研究來說是一把雙刃劍,一方面它大大推動著史學研究的深入,另一方面其本身也存在著一些弊端。歷史學作為一門規律性的理論研究,最終還要靠人腦的分析和升華。我們只有在重視史學基本功的學習和訓練的基礎上,把新手段當作一個輔助性的工具,有選擇地加以利用,才能使之為歷史學研究的開展提供有價值的幫助。
基金項目:本文系上海市教委科研創新項目(10YS82)、上海市晨光計劃項目階段性成果。
作者簡介:陳大為(1979~),男,北京順義人,上海師范大學人文與傳播學院歷史系講師,主要從事敦煌學與隋唐史研究。