劉釗：數字人文拓展諸多新概念上

說到AI，先要提到數字人文。計算機技術應用於人文社科研究，可以追溯到1949年。當時，意大利耶穌會神父羅伯特·布薩率團隊用IBM計算機花費了30年左右，到1980年編成了56卷百科全書式的托馬斯著作索引。20世紀末，美國的一些研究機構開始使用數字人文，到2024年《數字人文指南》一書誕生，這個名稱正式確定。

目前，國際上的數字人文機構已有200多家，中國有70多家數字人文專門研究機構，另有30多家高校機構也積極開展數字人文交叉研究。

從研究角度看，近年來，數字人文拓展出很多新概念，如數字文化、數字史學、數字考古學、計算哲學等，此外還包括計算語言學和自然語言處理。計算語言學和自然語言處理萌芽於1940至1950年代，核心問題是語言的自動理解和生成。基礎研究包括算法框架、知識圖譜；應用研究也涵蓋很多種類，其中就包含有古文字信息處理。

谷歌公司2017年推出的Transformer深度學習架構是算法框架上的突破；2018年推出的預訓練語言模型BERT，在語言理解指標上超越人類。另一AI巨頭OpenAI則從2018年起推出GPT系列模型。

在這樣的影響下，中文語言大模型也層出不窮，例如通義千問、文心一言、智譜清言、百川等。同時，在垂類領域，還出現了很多古漢語語言模型、民族語言模型及古籍智能平台。

技術影響下的傳統文科

談到數字人文，也不得不說說AI與人文社科的關係。

其實，文學對AI的衝擊更為敏感，文學家在AI面前越來越顯得無奈。中文逍遙大模型基於創作者的想法靈感，能夠一鍵生成萬字、一張圖寫出一部小說，它能大幅提升創作者的效率，也具備一次讀懂100萬字小說的功能。雖然對文學創作來說，作者的個性思維是機器永遠無法替代的，但是AI寫作的《機憶之地》已在第五屆江蘇省青年科普科幻作品大賽評選中獲得二等獎——這是人類作家用3個小時，與AI平台前後對話66次、形成4萬多字的稿件後，從中複製5900多字形成的作品。

再以哲學為例。中國工程院院士李德毅2023年在《人工智能看哲學》一文中提出：「人工智能的飛速發展正深刻地改變著人類的生產方式、生活方式以及思維方式，沒有哪門學科比人工智能更需要和哲學打交道。」2024年，日本名古屋大學團隊利用生成式AI開發了一款可以與古希臘哲學家們進行對話的系統。

在歷史學研究中，AI也有廣泛應用。比如，通過綜合運用數據挖掘、指標評價、可視化分析等技術，研究人員可基於歷代《食貨志》文本研究古代中國農作物的空間分佈與集聚性特征；此外，通過AI制作復原的數字人，諸多歷史人物得以「復活」，從教材中走出來，穿越到現實之中。

考古學對科技進展最為敏感，有兩個案例令人印象深刻。其一是地質學家朱利安·湯普森團隊2016年在學術期刊《科學》上發表的《公元前1920年的洪水爆發為中國傳說中的大洪水和夏朝的存在提供依據》。他通過建立黃河流域數字高程模型，在鄭州至開封段發現寬達30公里的古河道遺跡，證明在公元前1920年的前後20年間存在一場持續20年以上的超級洪災，這正是大禹治水的現實背景。它不僅印證了《尚書》中「湯湯洪水方割」的記載，更意外觸發了關於大禹治水技術體系的全球大辯論。

Promote

8 members promoted this