新聞資訊
站內(nèi)搜索 / download
推進大數(shù)據(jù)背景下人文社科跨學(xué)科交流與合作——南京大學(xué)人文社會科學(xué)大數(shù)據(jù)分析工具與方法工作坊綜述
為了進一步推進大數(shù)據(jù)背景下人文社科跨學(xué)科交流與合作,助力文科科研轉(zhuǎn)型創(chuàng)新,南京大學(xué)人文社會科學(xué)大數(shù)據(jù)研究院、南京大學(xué)信息管理學(xué)院聯(lián)合主辦了“南京大學(xué)人文社會科學(xué)大數(shù)據(jù)分析工具與方法工作坊”。本次會議吸引了校內(nèi)多個院系和機構(gòu)的教職工、博士生以及來自清華大學(xué)、武漢大學(xué)、大連理工大學(xué)、丹麥哥本哈根大學(xué)等高校和科研機構(gòu)的專家學(xué)者近200人參會。
南京大學(xué)校長呂建院士、黨委常務(wù)副書記楊忠教授、宣傳部長王靖華、文科資深教授賴永海先生等出席了本次會議。會議由社科處處長王月清教授主持。呂校長在致辭中表示,數(shù)據(jù)時代的到來對人文社會科學(xué)的學(xué)術(shù)研究與評價產(chǎn)生了深刻的影響,而南京大學(xué)的人文社會學(xué)科需要直面發(fā)展中的轉(zhuǎn)型性挑戰(zhàn)和問題性挑戰(zhàn),積極探索新方案、推動新實踐,努力走出新道路、建設(shè)新高峰,加快構(gòu)建中國特色、世界一流、南大風(fēng)格的哲學(xué)社會科學(xué)體系。隨后,孫建軍教授演示和報告了南京大學(xué)人文社會科學(xué)大數(shù)據(jù)近一年的建設(shè)進展,圍繞南京大屠殺史料集語義出版、科學(xué)家流動與遷徙網(wǎng)絡(luò)、上市公司創(chuàng)新能力指數(shù)等幾個典型應(yīng)用,從文科研究方法、數(shù)據(jù)研究思維等角度探討了跨學(xué)科聯(lián)合研究的前景。
此外,人文社科資深教授賴永海,宣傳部、社科處、出版社、哲學(xué)系、商學(xué)院、外國語學(xué)院、信息管理學(xué)院、環(huán)境學(xué)院、地理海洋與科學(xué)學(xué)院等職能部門和院系的10余位專家、學(xué)者就人文社會科學(xué)大數(shù)據(jù)建設(shè)工作及其重要意義提出了相關(guān)建議,認(rèn)為南京大學(xué)應(yīng)進一步強化問題導(dǎo)向、強化融合導(dǎo)向、強化創(chuàng)新導(dǎo)向,面向國家重大戰(zhàn)略需求及經(jīng)濟社會發(fā)展面臨的重大問題,發(fā)揮南大優(yōu)勢,爭取在文化傳承、經(jīng)濟轉(zhuǎn)型、社會治理、生態(tài)環(huán)境、大國關(guān)系等領(lǐng)域有所突破,推動“學(xué)者-團隊-學(xué)科”融合發(fā)展,探索新文科在學(xué)術(shù)原創(chuàng)、方法轉(zhuǎn)型、服務(wù)國家等方面的創(chuàng)新發(fā)展。與會學(xué)者還分別從各自學(xué)科優(yōu)勢、數(shù)據(jù)驅(qū)動在研項目、大數(shù)據(jù)技術(shù)與平臺需求等方面,圍繞中國古典數(shù)據(jù)工程、環(huán)境保護與健康、長江經(jīng)濟帶資源承載力、企業(yè)產(chǎn)業(yè)創(chuàng)新、文化走出去與術(shù)語語料建設(shè)等專題展開討論。
專題報告:基于數(shù)據(jù)分析的人文社會科學(xué)交叉研究
本次工作坊的五場主旨報告,主題為“基于數(shù)據(jù)分析的人文社會科學(xué)交叉研究”,來自信息管理科學(xué)、社會學(xué)、環(huán)境科學(xué)與計算機科學(xué)等不同學(xué)科背景的學(xué)者,圍繞數(shù)據(jù)分析方法與本學(xué)科科學(xué)問題,進行了充分交流與對話。主旨報告由南京大學(xué)朱慶華教授主持。
武漢大學(xué)信息管理學(xué)院王曉光教授是國內(nèi)數(shù)字人文研究的先行者,他從智慧數(shù)據(jù)的視角闡述如何進行數(shù)字人文研究。演講涵蓋了數(shù)字人文的緣起與研究內(nèi)容、面向數(shù)字人文的數(shù)據(jù)資源建設(shè)、智慧數(shù)據(jù)的興起、構(gòu)建智慧數(shù)據(jù)的關(guān)鍵技術(shù)以及智慧數(shù)據(jù)的建設(shè)路徑與趨勢等主要內(nèi)容。
南京大學(xué)中美中心陳云松教授通過生動的研究案例闡釋了如何借助大數(shù)據(jù)進行人文社科的研究,他分別從大數(shù)據(jù)的人文社科價值、大數(shù)據(jù)的思維信息維度、人文社科定量分析案例等角度總結(jié)人文社科大數(shù)據(jù)的作用體現(xiàn)于記錄當(dāng)下、重讀歷史、啟發(fā)思辨,思維角度包括時間趨勢、空間差異、時空差異、網(wǎng)絡(luò)結(jié)構(gòu)等,數(shù)據(jù)結(jié)構(gòu)涉及時間序列、面板數(shù)據(jù)與網(wǎng)絡(luò)數(shù)據(jù)等。
南京大學(xué)環(huán)境學(xué)院張炳教授從環(huán)境科學(xué)的視角分享了如何基于大數(shù)據(jù)做環(huán)境政策分析,重點分享了他的研究團隊怎樣利用政府統(tǒng)計數(shù)據(jù)、隨機試驗數(shù)據(jù)、網(wǎng)絡(luò)大數(shù)據(jù)與市場調(diào)研數(shù)據(jù),分別服務(wù)于污染的精細化暴露與健康影響、環(huán)境政策的社會經(jīng)濟綜合評估等科研實踐。劉志遠副教授與胡偉副教授都來自計算機科學(xué)領(lǐng)域,他們各自對自然語言處理與知識圖譜表示學(xué)習(xí)在計算社會科學(xué)中的應(yīng)用相得益彰。
清華大學(xué)計算機學(xué)院劉志遠副教授從語言與社會科學(xué)的關(guān)系入手,引入對計算社會科學(xué)的介紹,并從計算機科學(xué)的視角給出自然語言處理如何應(yīng)用在計算社會科學(xué)的精彩案例,內(nèi)容涉及社交媒體中的關(guān)鍵詞抽取、基于關(guān)鍵詞的職業(yè)預(yù)測、事件監(jiān)測、基于符號的表示、分布表示、詞嵌入的應(yīng)用、語言表示學(xué)習(xí)、知識圖譜、網(wǎng)絡(luò)表示學(xué)習(xí)等豐富內(nèi)容。
南京大學(xué)計算機學(xué)院胡偉副教授具體分享知識圖譜表示學(xué)習(xí)及其應(yīng)用,從知識圖譜的歷史與內(nèi)涵、知識圖譜表示學(xué)習(xí)及其在知識圖譜補全、實體對齊、知識庫問答等方面的應(yīng)用,并結(jié)合他近期的研究給出了具體的闡釋與研究展望。
工作坊A:數(shù)字技術(shù)與歷史人文研究工具
“數(shù)字技術(shù)與歷史人文研究工具”工作坊分別從藝術(shù)、文學(xué)、歷史和傳播學(xué)等不同的學(xué)科領(lǐng)域,圍繞等計算化方法帶來的方法革新與典型應(yīng)用,探討了數(shù)字技術(shù)帶來的研究視角和研究尺度的變化。講座由武漢大學(xué)王曉光教授主持。
南京大學(xué)數(shù)字人文研究中心研究員陳靜副教授圍繞數(shù)字人文與人文圖文數(shù)字研究,提出傳統(tǒng)人文數(shù)據(jù)的表現(xiàn)形式主要是文本和圖像,一類模擬的、非連續(xù)的數(shù)據(jù),無法直接使用計算化方法處理,需要經(jīng)過研究者的經(jīng)驗或者具體的研究情境加以量化;而數(shù)字人文處理的是數(shù)字的、選擇性建構(gòu)的、可機器處理的數(shù)據(jù)。因此,數(shù)字人文不僅體現(xiàn)了數(shù)字轉(zhuǎn)向時代人文學(xué)者學(xué)術(shù)研究方法的變化,同時學(xué)者受數(shù)字技術(shù)和數(shù)字思維的影響,提出的一種跨學(xué)科的、“問題導(dǎo)向”的更智能的方法。數(shù)字人文的研究應(yīng)該基于良好的數(shù)據(jù)基礎(chǔ)設(shè)施,新的人文研究思維設(shè)計以及跨學(xué)科的研究實施團隊。從方法角度看,數(shù)字人文提出了文本分析、網(wǎng)絡(luò)分析、時空分析和圖像分析等新的研究方法與研究模式,比如弗吉尼亞大學(xué)JeromeMcGann提出的“理性超文本”(RationaleofHyepertext)理論、芝加哥大學(xué)FrancoMoretti提出的遠讀模式(DistantReading)、MatthewJockers提出的宏觀分析模式(macroanalysis)、Jean-Baptiste Michel提出的文化組學(xué)概念等、哈佛大學(xué)“中國歷代人物傳記數(shù)據(jù)庫(CBDB)”開展的“群體傳記學(xué)(Prosopography)”、臺灣大學(xué)項潔團隊開展的文本脈絡(luò)圖景研究等。這些方法的出現(xiàn),也導(dǎo)致了人文科學(xué)的研究尺度、研究問題設(shè)計方面的差異性。最后,陳靜副教授通過大尺度文化分析、類書、民國報刊廣告、大運河超尺度展示、黃帝內(nèi)經(jīng)中的顏色與問診等典型研究,展示了相關(guān)數(shù)字人文的研究設(shè)計與分析過程。
南京大學(xué)歷史學(xué)院的梁晨副教授圍繞量化數(shù)據(jù)與歷史研究,提出在中國的量化史學(xué)研究視野中,不論是對歷史信息或文本的處理精度,還是在多樣化展示、大規(guī)模量化等方法應(yīng)用,都得到了前所未有的發(fā)展。但對歷史研究最大的沖擊,是對史料的“唯一性”與“開放性”的變更,是對歷史研究材料和歷史研究方法的重大變化。中國歷史量化研究的發(fā)展,推得動了一種新的“求是型”學(xué)術(shù)的發(fā)展,即追求數(shù)據(jù)自身或隱藏其中的無聲“事實”,而非基于研究者的理解和解釋。隨后,梁晨副教授圍繞李中清-康文林研究團隊的1700-2000年個人生命史研究中自己承擔(dān)的中國教育精英數(shù)據(jù)庫,詳細介紹了其數(shù)據(jù)獲取來源和加工方法、數(shù)據(jù)變量設(shè)置、不同變量的整理與關(guān)聯(lián),到最后利用數(shù)據(jù)庫技術(shù)整理和發(fā)現(xiàn)數(shù)據(jù)中隱含的規(guī)律。
南京大學(xué)新聞傳播學(xué)院王成軍副教授圍繞計算傳播的方法和工具,從人們傳播行為的變化和計算傳播學(xué)的方法論著手,重點介紹了python用于解決計算傳播問題的數(shù)據(jù)包及其應(yīng)用場景。在研究方法層面,主張計算傳播學(xué)是領(lǐng)域知識、數(shù)學(xué)和計算工程能力相結(jié)合的產(chǎn)物,需要在觀察、分析的基礎(chǔ)上,提出更高階的模型、算法、預(yù)測,從而建構(gòu)大理論和重大問題。在案例分析環(huán)節(jié),王成軍副教授通過對手機使用與財富預(yù)測、傳播行為預(yù)測、虛假新聞識別、自動書寫、英雄情節(jié)模型等典型應(yīng)用,提出了計算方法、計算技能對于人文社會科學(xué)研究的重要價值。
工作坊B:交叉學(xué)科與數(shù)據(jù)科學(xué)方法
“交叉學(xué)科與數(shù)據(jù)科學(xué)方法”工作坊關(guān)注的是大數(shù)據(jù)分析方法和工具在交叉學(xué)科的應(yīng)用。其話題包括大數(shù)據(jù)時代的思維對撞與機遇挑戰(zhàn)、多源數(shù)據(jù)融合的研究方法創(chuàng)新、大數(shù)據(jù)挖掘與可視化、行為科學(xué)研究中的大數(shù)據(jù)應(yīng)用等議題。
清華大學(xué)經(jīng)濟管理學(xué)院陳國青教授圍繞大數(shù)據(jù)時代背景,對人文社會科學(xué)研究中大數(shù)據(jù)帶來的思維對撞、機遇和挑戰(zhàn)進行了探討。大數(shù)據(jù)具有規(guī)模、多樣、價值、速度四個維度特征,大數(shù)據(jù)問題具有粒度縮放、跨界關(guān)聯(lián)和全局視圖的特點。在大數(shù)據(jù)時代,數(shù)據(jù)與每個人密不可分,各行各業(yè)都受到大數(shù)據(jù)的沖擊,大數(shù)據(jù)也對經(jīng)濟、管理、藝術(shù)等學(xué)科領(lǐng)域的研究也帶來了新挑戰(zhàn)和研究空間。
建筑與城市規(guī)劃學(xué)院秦蕭助理研究員認(rèn)為,傳統(tǒng)城市研究受到物質(zhì)空間論、因果分析論、宏觀分析論三個方面的方法論限制,大數(shù)據(jù)的出現(xiàn)革新了城市研究的方法,具體表現(xiàn)為物質(zhì)空間與活動空間的結(jié)合、因果關(guān)系與相關(guān)關(guān)系的結(jié)合、宏觀分析與微觀挖掘的結(jié)合。隨后,秦蕭助理研究員從區(qū)域城鎮(zhèn)聯(lián)系研究、城市問題研究、城市人口活動研究、城市居民出行研究、城市居民感知研究五個角度詮釋了城市研究中的多源數(shù)據(jù)應(yīng)用,通過濟南城市發(fā)展戰(zhàn)略規(guī)劃、常州城市總體規(guī)劃、揚州棗林灣地區(qū)產(chǎn)業(yè)發(fā)展策劃、上海張江科技園(西北片區(qū)) 規(guī)劃設(shè)計、武漢經(jīng)濟開發(fā)區(qū)東風(fēng)大道沿線城市設(shè)計、南京虹悅城商業(yè)綜合體內(nèi)部空間設(shè)計六個案例詳細闡述了城市規(guī)劃設(shè)計的大數(shù)據(jù)應(yīng)用場景。
建筑與城市規(guī)劃學(xué)院張姍琪博士后以地理大數(shù)據(jù)的挖掘與可視化為主題,基于互聯(lián)網(wǎng)地理大數(shù)據(jù)、行為活動大數(shù)據(jù)兩種數(shù)據(jù)類型展開討論。其中,互聯(lián)網(wǎng)地理大數(shù)據(jù)具有語義信息豐富、類型豐富、空間精度高、時效性高等優(yōu)點,數(shù)據(jù)來源包括空間社交媒體數(shù)據(jù)、生活服務(wù)類網(wǎng)站/APP、電子地圖類數(shù)據(jù)、政企開放數(shù)據(jù),其應(yīng)用方向包括基于空間社交媒體數(shù)據(jù)的城市功能區(qū)識別與評價、基于空間社交媒體數(shù)據(jù)的空間聯(lián)系分析、基于語義的空間主觀感受分析、基于群體智慧的預(yù)警和評估。行為活動大數(shù)據(jù)指出行、從事不同活動時的位置、軌跡數(shù)據(jù),也包含活動類型、個體屬性等屬性信息,常用數(shù)據(jù)集包括手機數(shù)據(jù)、實時軌跡數(shù)據(jù)、OD(origin-destination)數(shù)據(jù),其分析與應(yīng)用包括出行行為時空間特征分析、網(wǎng)絡(luò)分析、個體活動空間分析。
丹麥哥本哈根商學(xué)院姜祺琪助理教授以游戲化健身應(yīng)用為例,探討了行為科學(xué)研究中現(xiàn)場試驗數(shù)據(jù)分析研究?;诟偁帣C制的游戲化元素和合作機制的游戲化元素,依托社會互賴?yán)碚?,?gòu)建了游戲化應(yīng)用設(shè)計框架,通過設(shè)計實驗、開發(fā)實驗系統(tǒng),對實驗數(shù)據(jù)進行分析。
數(shù)據(jù)科學(xué)推動了跨學(xué)科融合和學(xué)科知識體系的網(wǎng)絡(luò)化發(fā)展,在“交叉學(xué)科與數(shù)據(jù)科學(xué)方法”工作坊中,與會者圍繞大數(shù)據(jù)分析與研究方法展開了熱烈討論,既包括大數(shù)據(jù)發(fā)展時代背景的宏觀洞見,也包括跨學(xué)科的大數(shù)據(jù)應(yīng)用的具體技術(shù)與方法實踐。
工作坊C: 專題數(shù)據(jù)集與數(shù)據(jù)分析方法:科學(xué)活動數(shù)據(jù)的獲取與分析
“專題數(shù)據(jù)集與數(shù)據(jù)分析方法:科學(xué)活動數(shù)據(jù)的獲取與分析”圍繞專題數(shù)據(jù)集——科學(xué)家活動數(shù)據(jù),探討其數(shù)據(jù)收集、處理以及分析等整個生態(tài)過程中的具體方法與應(yīng)用。其內(nèi)容包括文獻計量分析與科學(xué)知識圖譜方法與應(yīng)用、基于開放科學(xué)理念的知識服務(wù)實踐、科學(xué)數(shù)據(jù)與科學(xué)家行為數(shù)據(jù)跟蹤等內(nèi)容。
大連理工大學(xué)WISE實驗室副主任胡志剛副教授圍繞文獻計量分析,著重通過對文獻分析的數(shù)據(jù)、工具等內(nèi)容具體描述了?獻分析的流程。他通過講解國內(nèi)外知名數(shù)據(jù)庫的使用、檢索等方法來對文獻分析的數(shù)據(jù)來源與獲取進行細致地解釋,并對相應(yīng)的文獻分析方法進行闡述?;诖?,胡志剛副教授分別從Online分析與Office分析兩個視角對文獻分析的工具進行詳細說明。其中重點對HistCite、BibExcel+Pajek、VOSviewr、CiteSpace等文獻分析工具的使用特點與場景、具體的操作過程以及實踐應(yīng)用等進行較為詳盡的解說。
中國科學(xué)院文獻情報中心資源建設(shè)與知識組織中心副主任許哲平副研究員則結(jié)合中科院具體科研項目實踐,圍繞開放數(shù)據(jù)、科學(xué)數(shù)據(jù)、科研資源整合與關(guān)聯(lián)來探討知識服務(wù)的具體應(yīng)用與實踐。許哲平副研究員在回溯數(shù)據(jù)演化歷史OSF、開放科學(xué)框架、OA資源清單、國外專業(yè)數(shù)據(jù)倉儲等內(nèi)容的基礎(chǔ)上,重點圍繞數(shù)據(jù)資源類型、術(shù)語(Term/Taxonomy)主題詞表與知識組織體系(Thesaurus)、元數(shù)據(jù)、擴展和映射、本體(Ontology)、關(guān)聯(lián)開放數(shù)據(jù)、數(shù)據(jù)挖掘工具等相關(guān)內(nèi)容的具體講解對知識服務(wù)類型及其擴展數(shù)據(jù)整合服務(wù)展開解析。最后,他結(jié)合科學(xué)院機構(gòu)知識庫、APP和微信公眾號開發(fā)、國際合作項目BIFA、中國科學(xué)數(shù)據(jù)倉儲系統(tǒng)登記與共享平臺等相關(guān)技術(shù)服務(wù)案例對“資源+知識+技術(shù)”的新型服務(wù)和介入模式進行實踐應(yīng)用介紹。
此外,南京大學(xué)信息管理學(xué)院教授李江教授則基于科學(xué)數(shù)據(jù)與科學(xué)家行為數(shù)據(jù)跟蹤向大家描繪了科學(xué)活動數(shù)據(jù)的獲取與分析的具體路徑。李江教授首先分別對諸如Open Science Data:Magacademic、Publons、Altmetric.com、PubMed、ORCID等開放數(shù)據(jù)集的特點、獲取應(yīng)用以及數(shù)據(jù)集相互之間的比較分析展開詳盡的說明。緊接著,李江教授基于ORCID科學(xué)數(shù)據(jù)介紹具體的研究設(shè)計與應(yīng)用,他基于睡美人的定量標(biāo)準(zhǔn)、創(chuàng)新的測度等知識點的詳盡介紹,對科學(xué)家行為數(shù)據(jù)跟蹤的研究設(shè)計展開具體的分析與闡述。
在該部分工作坊的討論中,每位學(xué)界嘉賓都分別從不同的視角對專題數(shù)據(jù)集與數(shù)據(jù)分析方法展開了詳盡的描述。總體來看,“專題數(shù)據(jù)集與數(shù)據(jù)分析方法:科學(xué)活動數(shù)據(jù)的獲取與分析”分論壇的議題多元,既有嚴(yán)謹(jǐn)扎實的科學(xué)研究,也有富含豐富實踐操作的案例應(yīng)用輔以支撐,他們共同圍繞科學(xué)活動數(shù)據(jù)的獲取與分析這一具體內(nèi)容為同學(xué)們答疑解惑。
6月25日,工作坊學(xué)員還參訪了南京大學(xué)人文社會科學(xué)大數(shù)據(jù)研究院,并了解了Dataverse以及相關(guān)大數(shù)據(jù)平臺的運營管理以及使用方法。
(轉(zhuǎn)自南京大學(xué)新聞網(wǎng))
