劉釗:數字人文拓展諸多新概念 上

說到AI,先要提到數字人文。計算機技術應用於人文社科研究,可以追溯到1949年。當時,意大利耶穌會神父羅伯特·布薩率團隊用IBM計算機花費了30年左右,到1980年編成了56卷百科全書式的托馬斯著作索引。20世紀末,美國的一些研究機構開始使用數字人文,到2024年《數字人文指南》一書誕生,這個名稱正式確定。

目前,國際上的數字人文機構已有200多家,中國有70多家數字人文專門研究機構,另有30多家高校機構也積極開展數字人文交叉研究。

從研究角度看,近年來,數字人文拓展出很多新概念,如數字文化、數字史學、數字考古學、計算哲學等,此外還包括計算語言學和自然語言處理。計算語言學和自然語言處理萌芽於1940至1950年代,核心問題是語言的自動理解和生成。基礎研究包括算法框架、知識圖譜;應用研究也涵蓋很多種類,其中就包含有古文字信息處理。

谷歌公司2017年推出的Transformer深度學習架構是算法框架上的突破;2018年推出的預訓練語言模型BERT,在語言理解指標上超越人類。另一AI巨頭OpenAI則從2018年起推出GPT系列模型。

在這樣的影響下,中文語言大模型也層出不窮,例如通義千問、文心一言、智譜清言、百川等。同時,在垂類領域,還出現了很多古漢語語言模型、民族語言模型及古籍智能平台。

技術影響下的傳統文科

談到數字人文,也不得不說說AI與人文社科的關係。

其實,文學對AI的衝擊更為敏感,文學家在AI面前越來越顯得無奈。中文逍遙大模型基於創作者的想法靈感,能夠一鍵生成萬字、一張圖寫出一部小說,它能大幅提升創作者的效率,也具備一次讀懂100萬字小說的功能。雖然對文學創作來說,作者的個性思維是機器永遠無法替代的,但是AI寫作的《機憶之地》已在第五屆江蘇省青年科普科幻作品大賽評選中獲得二等獎——這是人類作家用3個小時,與AI平台前後對話66次、形成4萬多字的稿件後,從中複製5900多字形成的作品。

再以哲學為例。中國工程院院士李德毅2023年在《人工智能看哲學》一文中提出:「人工智能的飛速發展正深刻地改變著人類的生產方式、生活方式以及思維方式,沒有哪門學科比人工智能更需要和哲學打交道。」2024年,日本名古屋大學團隊利用生成式AI開發了一款可以與古希臘哲學家們進行對話的系統。

在歷史學研究中,AI也有廣泛應用。比如,通過綜合運用數據挖掘、指標評價、可視化分析等技術,研究人員可基於歷代《食貨志》文本研究古代中國農作物的空間分佈與集聚性特征;此外,通過AI制作復原的數字人,諸多歷史人物得以「復活」,從教材中走出來,穿越到現實之中。

考古學對科技進展最為敏感,有兩個案例令人印象深刻。其一是地質學家朱利安·湯普森團隊2016年在學術期刊《科學》上發表的《公元前1920年的洪水爆發為中國傳說中的大洪水和夏朝的存在提供依據》。他通過建立黃河流域數字高程模型,在鄭州至開封段發現寬達30公里的古河道遺跡,證明在公元前1920年的前後20年間存在一場持續20年以上的超級洪災,這正是大禹治水的現實背景。它不僅印證了《尚書》中「湯湯洪水方割」的記載,更意外觸發了關於大禹治水技術體系的全球大辯論。

Views: 13

Comment

You need to be a member of Iconada.tv 愛墾 網 to add comments!

Join Iconada.tv 愛墾 網

愛墾網 是文化創意人的窩;自2009年7月以來,一直在挺文化創意人和他們的創作、珍藏。As home to the cultural creative community, iconada.tv supports creators since July, 2009.

Videos

  • Add Videos
  • View All