新聞資訊
站內(nèi)搜索 / download
專(zhuān)業(yè)資訊丨中國(guó)歷代人物傳記資料庫(kù)(CBDB)
轉(zhuǎn)載自微信公眾號(hào)“數(shù)字人文資訊”
CBDB的長(zhǎng)期目標(biāo)是對(duì)中國(guó)史料中所有重要的傳記信息進(jìn)行系統(tǒng)性收集,免費(fèi)供學(xué)術(shù)研究使用。項(xiàng)目人員會(huì)定期對(duì)資料庫(kù)中的數(shù)據(jù)進(jìn)行擴(kuò)充,同時(shí)也在不斷錄入唐、五代、遼、宋、金、元、明、清等朝代的新的人物傳記信息。
CBDB的原形是Robert M. Hartwell(1932 - 1996)的研究項(xiàng)目。Hartwell教授最后將他的資產(chǎn)遺贈(zèng)給了哈佛大學(xué)燕京學(xué)社(Harvard-Yenching Institute),其中就包括最初版的資料庫(kù), 不過(guò)燕京學(xué)社后來(lái)又放棄了CBDB的所有權(quán)。
如今,CBDB已經(jīng)發(fā)展成為一個(gè)聯(lián)合項(xiàng)目,由費(fèi)正清中國(guó)研究中心(Fairbank Center for Chinese Studies at Harvard University)、中國(guó)臺(tái)灣“中研院”歷史語(yǔ)言研究所(Institute of History and Philology of Academia Sinica)和北京大學(xué)中國(guó)古代史研究中心(Center for Research on Ancient Chinese History at Peking University)聯(lián)合開(kāi)發(fā)。
CBDB的歷史
CBDB的原形是Robert M. Hartwell為“中國(guó)歷史軟件有限公司(China Historical Software, Inc.)”開(kāi)發(fā)設(shè)計(jì)的一個(gè)軟件項(xiàng)目和數(shù)據(jù)集。Hartwell教授將資產(chǎn)遺贈(zèng)給哈佛大學(xué)燕京學(xué)社后,燕京學(xué)社才主持開(kāi)展了CBDB項(xiàng)目。最初,資料庫(kù)是MS-DOS下的dBase格式。在2004 – 2005年間,Michael A. Fuller對(duì)資料庫(kù)進(jìn)行了重新設(shè)計(jì),改為適用于FoxPro和MS Access的應(yīng)用程序,分別命名為CBDBWin和CBDB.mdb,應(yīng)用程序資料庫(kù)的內(nèi)容則還是來(lái)自于Hartwell教授。北京大學(xué)中國(guó)古代史研究中心已經(jīng)根據(jù)中國(guó)臺(tái)灣“中研院”歷史語(yǔ)言研究所提供的《宋人傳記資料索引》對(duì)資料庫(kù)內(nèi)容進(jìn)行了擴(kuò)充。自2006年起,有關(guān)應(yīng)用程序的進(jìn)一步工作都交由陳松負(fù)責(zé)。
▲CBDB網(wǎng)站訪(fǎng)問(wèn)者可視化分布圖
從在芝加哥大學(xué)(University of Chicago)開(kāi)啟學(xué)術(shù)生涯,到在賓夕法尼亞大學(xué)(University of Pennsylvania)擔(dān)任終身教授,再到退休后在懷俄明州生活,Robert M. Hartwell直至去世前都極為關(guān)注中國(guó)歷史上的社會(huì)與經(jīng)濟(jì)變化。Hartwell教授依據(jù)他的主要研究?jī)?nèi)容——中古(中唐至元朝)史料,開(kāi)發(fā)了大量意義重大的研究輔助工具,并發(fā)表了一系列極具影響力的研究論文。在閱讀Hartwell的著作時(shí),讀者立刻就能意識(shí)到,他的每一個(gè)論點(diǎn)都引用了大量的資料,并且支持性數(shù)據(jù)的體積也非常大。事實(shí)上,Hartwell教授在意識(shí)到學(xué)術(shù)文獻(xiàn)中缺少這種研究后,就開(kāi)始自己創(chuàng)建大范圍的數(shù)據(jù)集,并一直致力于大型數(shù)據(jù)集合的建設(shè)。到20世紀(jì)70年代中期,他已經(jīng)獨(dú)立完成了程序設(shè)計(jì),為中國(guó)歷史研究收集到了有史以來(lái)覆蓋面最廣的人物傳記數(shù)據(jù)。而且Hartwell教授直至1995年去世前,都在不斷完善這項(xiàng)成果。20世紀(jì)90年代早期,他逐漸將注意力轉(zhuǎn)向數(shù)據(jù)的學(xué)術(shù)應(yīng)用準(zhǔn)備工作。在這一段時(shí)間,Hartwell教授成立了咨詢(xún)委員會(huì),即后來(lái)的“中國(guó)歷史研究有限公司(Chinese Historical Studies, Inc.)”,由哈佛大學(xué)的Peter K. Bol主持,向成員提供Hartwell教授的數(shù)據(jù)集和應(yīng)用程序。
Hartwell教授去世時(shí),資料庫(kù)的多元傳記和譜系資料已經(jīng)覆蓋了超過(guò)25000位歷史人物,索引數(shù)據(jù)庫(kù)也有超過(guò)4500本書(shū)的書(shū)目信息,并且提供多種以地理信息為參照系的對(duì)象和功能。Hartwell的目標(biāo)就是要好好利用類(lèi)型如此豐富的中國(guó)歷史文獻(xiàn),比如政府專(zhuān)為公眾編寫(xiě)的資料(如國(guó)家史學(xué)記錄)和出于私人目的編寫(xiě)的資料(如墓志銘)等。在CBDB中,我們可以依照不同情景對(duì)歷史人物進(jìn)行分析:比如可以根據(jù)中央地方或行政機(jī)構(gòu)查看人物分布;可以根據(jù)官僚階級(jí)和品級(jí)查看人物分布,也可以根據(jù)親屬網(wǎng)絡(luò)關(guān)系查看人物分布等。CBDB所包含的人物資料越豐富,所能繪制的家族樹(shù)就越茂密,人物之間的親屬關(guān)系和聯(lián)姻情況也就越清晰。除了從人物視角考慮外,我們也可以根據(jù)不同地點(diǎn)進(jìn)行分析,比如看看某個(gè)特定地方培養(yǎng)仕子和高官的能力是如何隨時(shí)間而變化的。CBDB還可以將某一特定時(shí)期、特定地點(diǎn)的人所寫(xiě)的文章進(jìn)行相互關(guān)聯(lián)。未來(lái)也許還會(huì)出現(xiàn)更多的數(shù)據(jù)使用方式。
如今,Robert Hartwell的數(shù)據(jù)庫(kù)已經(jīng)完全并入“中國(guó)歷史人物傳記資料庫(kù)”,是同類(lèi)型資料庫(kù)中數(shù)據(jù)最全面的一個(gè);它對(duì)于中古(中唐至元朝)歷史研究的價(jià)值是無(wú)法估量的,未來(lái)也不太可能被超越。但是就技術(shù)而言,Hartwell教授去世時(shí)的資料庫(kù)基本上還是在20世紀(jì)90年代早期的信息技術(shù)大環(huán)境下開(kāi)發(fā)出來(lái)的。而Michael Fuller通過(guò)開(kāi)發(fā)FoxPro語(yǔ)言下的應(yīng)用程序CBDBwin,讓原先的數(shù)據(jù)庫(kù)在Windows的環(huán)境下也可以正常使用,使得數(shù)據(jù)的檢索與查詢(xún)更加方便快捷。他開(kāi)發(fā)的MS Access數(shù)據(jù)庫(kù)使得從臺(tái)式機(jī)錄入新的數(shù)據(jù)成為可能,不過(guò)這一功能僅限于一臺(tái)臺(tái)式機(jī)使用。此外,還要感謝柳立言(Lau Nap-yin)教授對(duì)CBDB的支持,從2006年起,中國(guó)臺(tái)灣“中研院”歷史語(yǔ)言研究所開(kāi)始為支持?jǐn)?shù)據(jù)錄入的在線(xiàn)應(yīng)用開(kāi)發(fā)提供資金支持。該平臺(tái)于2007年春季正式上線(xiàn),支持公眾查詢(xún)和報(bào)告的應(yīng)用程序也隨后在2008年秋季開(kāi)發(fā)完畢。
2005年,北京大學(xué)中國(guó)古代史研究中心加入CBDB。在張希清教授和鄧小南教授(曾與Hartwell在賓夕法尼亞大學(xué)共事一年)的指導(dǎo)下,一眾研究生開(kāi)始盡可能地對(duì)Hartwell錄入的條目進(jìn)行核查和修正,同時(shí)根據(jù)王德毅校訂的數(shù)字版《宋人傳記資料索引》——由中國(guó)臺(tái)灣“中研院”歷史語(yǔ)言研究所提供——錄入新的條目。
2008年秋季,哈佛團(tuán)隊(duì)開(kāi)始與計(jì)算機(jī)科學(xué)家合作,利用“正則表達(dá)式”等數(shù)據(jù)挖掘技術(shù)從數(shù)字化的傳記資料中抽取數(shù)據(jù)。時(shí)至2009年春,大家都明顯看出這種方式未來(lái)將遠(yuǎn)比任何人所預(yù)想的都要成功的多。2009年2月,哈佛大學(xué)燕京學(xué)院將CBDB的所有權(quán)轉(zhuǎn)讓給費(fèi)正清中國(guó)研究中心。
CBDB近聞
1
2018年3月,Peter K. Bol教授在上海與北京中文在線(xiàn)數(shù)字出版集團(tuán)、北京大學(xué)中國(guó)古代史研究中心簽署了CBDB項(xiàng)目的合作協(xié)議,共同打造中國(guó)古籍?dāng)?shù)據(jù)的數(shù)字人文資源平臺(tái),希望能夠“重構(gòu)古文獻(xiàn)研究服務(wù)新脈絡(luò),運(yùn)用人工智慧科技,提高處理歷史資料的效率和準(zhǔn)確度,聚合更多主體并不斷優(yōu)化用戶(hù)體驗(yàn)”。
2018年6月,中文在線(xiàn)在“2018中國(guó)高校圖書(shū)館發(fā)展論壇”上推出了“引得”CBDB數(shù)字人文資源平臺(tái)。該平臺(tái)現(xiàn)今共收錄約420, 000個(gè)人物的傳記資料、著作資料,由150余位專(zhuān)家學(xué)者提供學(xué)術(shù)支持。未來(lái)除了將開(kāi)放全部人物傳記資料外,還將拓展提供可視化研究工具以及UGC開(kāi)放圖文庫(kù)服務(wù)。
▲“引得”CBDB數(shù)字人文資源平臺(tái)主頁(yè)
2
2018年10月18日,Peter K. Bol教授在“第九屆上海國(guó)際圖書(shū)館論壇(SILF 2018)”的開(kāi)幕式上作了題為《數(shù)字人文與中國(guó)學(xué)的信息基礎(chǔ)架構(gòu)》的主旨報(bào)告。報(bào)告對(duì)CBDB的發(fā)展歷程以及CBDB如何借助信息技術(shù)服務(wù)于“中國(guó)學(xué)”的研究進(jìn)行了全面介紹,更從關(guān)系型數(shù)據(jù)庫(kù)、GIS空間分析等多個(gè)角度講述了信息技術(shù)在數(shù)字人文研究中的重要作用。Peter K. Bol教授還表示日后將加強(qiáng)與上海圖書(shū)館在數(shù)字人文領(lǐng)域的合作。
3
上海圖書(shū)館建立了CBDB關(guān)聯(lián)數(shù)據(jù)網(wǎng)站(cbdb.library.sh.cn),已經(jīng)將CBDB中約420, 000個(gè)人物的傳記資料發(fā)布為關(guān)聯(lián)數(shù)據(jù)。該網(wǎng)站目前免費(fèi)對(duì)外開(kāi)放,將來(lái)可能會(huì)采取邀請(qǐng)制的注冊(cè)方式。
