數字人文作為一種方法:西方研究現狀及展望(4)

讓布薩神父的工作與眾不同的是,他早在那個時代已經明確地圍繞計算機技術來考慮這項工作了,也就是說,將文本編碼為穿孔卡片,可以用於分析,也可以用來再轉化為其他形式的數據, 布薩神父在 IBM 公司的協助下,懂得了如何將聖托馬斯的大量文本編碼為穿孔卡片, 這裏的關鍵在於制作一種“字母索引,”也就是出現在某個文本中的詞匯表,按字母表順序排序而成,這個詞表引征了這些詞匯每一次出現在文本中的例子, 需要注意的是,“字母索引”本身並非一種新形式,而且在計算機發明很早之前就誕生了,比如第一個拉丁文版聖經的字母索引表是由多明我會修道士於1230年發明的,但是,電子計算機所具備的搜索和組織功能,卻使得電子索引表成為十分強大的工具: 例如,它能夠提供一種交互式的“超文本”環境) , 這種將文本轉化為數據的方法,激發了有意於用計算機研究文本的學者的想象力,到了 1960年代,一些研究小組開始為其他語種和語料庫制作電子索引表,比如愛爾蘭現代主義詩人葉芝1865—1939)的詩歌等, 這些索引適用於高效的量化文本分析,例如計算多個作者語料庫中作者使用兩字母詞匯的數量, 這也激發出一種 “作者身份研究”的新研究領域,也就是利用詞出現的頻率或者詞的計數,去分類作者文本,因為通常會認為每位作者對普通詞匯的使用有著獨特的———然而非常微妙的———風格差異, 這方面一個著名的例子是對«聯邦黨人文集» (1787—1788)的研究, 這 85 份檔案由三位美國國父,即亞歷山大·漢米爾頓(Alexander Hamilton,1755—1804) 、詹姆遜·麥迪遜( James Madison,1751—1836) 、以及約翰·傑伊( John Jay,1745—1829)起草, 其中 12 份檔案的作者身份,150年來一直存在疑問, 1964 年,兩位學者運用統計學的方法分析了這 12 份檔案,認為他們很可能出自麥迪遜之手,這便解決了一項長期存在於歷史學界的涉及美國立國問題的思想史方面的爭議,②1960年代也同樣見證了數字人文學者群體和期刊雜誌的崛起,研究者們開始為解決相似的問題而聚集到一起, 例如,1964 年 IBM 公司組織了一場會議,他們的活動於第二年以«文學數據處理會議議程» ( Literary Data Processing Conference Proceedings)為題發表, 1966 年,一個全新的雜誌«計算機與人文科學» (Computers and the Humanities)誕生了, 在 1970年代,“文學與語言計算協會” (The Association for Literary and Linguistic Computing)與“計算機與人文研究協會” (The Association for Computers and the Humanities)雙雙成立,這些信息交流和出版討論了一些業內的常見問題,諸如如何將不同的文本形式或語言編碼、文體量化研究的可能性,以及編程的問題等等, 這一趨勢自 1970年代一直延續到 1980年代中期,像牛津大學和賓夕法尼亞大學創設了人文計算的專門研究中心,而且文本數據庫也在慢慢擴展, 同時,軟件程序也變得標準化,為大範圍的研究者們所共享, 從方法論上說,這一時期的研究並沒有進步很多,依然聚焦於如何使用詞頻統計的手段來進行文體分析,1980年代中期以降,隨著個人電腦和因特網的發展,越來越多的人開始使用計算機和軟件, 人文計算快速傳播開來,繼而產生了一種標準化實踐的新需求,以及由此而來的對於普及性協議( common protocols)的發展,後者以標準通用標記語言( Standard Generalized Markup Language,SGML)和文本編碼計劃( Text Encoding Initiative,TEI)為代表, 文本編碼計劃被認為是“為了歸類和界定學者們可能會感興趣的人文文本,而做的第一次系統性嘗試”③,它創造了一種全球通用的處理和標記文本的結構,成為當今時代圖書館數碼化項目的通行標準, 個人電腦最重要的功效可能是,它將信息技術推到了日常生活的最前沿,將“使用機器”迅速歸化為學術研究、互相合作的必要部分,最終預示了“信息時代”的來臨和今日被稱為“天生數字化”的年輕一代學者的出現.

三、2000年以後:從“人文計算”到“數字人文”和“遠讀”

現在看來,在“人文計算”以及不久之後出現的“數字人文”之間,2000年是較為重要的過渡的一年, 這一年裏,斯坦福大學英文系教授美籍意大利裔學者弗朗科·莫瑞蒂( Franco Moretti)在«新左派評論» (NewLeft Review)上發表了後來成為經典的«世界文學的猜想» ( “Conjectures on World Literature” )一文, 莫瑞蒂教授作為一名現代小說研究專家和馬克思主義者,因為其學術工作及其在斯坦福建立起來的傳奇性的“文學實驗室” ( “Literary Lab” )②,很可能已成為數字人文最能言的代表,他的工作已成為無論是支持量化分析、還是對此持懷疑態度的人都關注的焦點, 意味深長的是,在«世界文學猜想»這篇文章中,莫瑞蒂並沒有明確地提到要使用計算機去研究小說, 他批評了比較文學研究空間的局限性,並提出一項研究“世界文學”的更有雄心的方法,他設想了什麽終將成為數字人文最重要的“原初場景” ( “primal scene” ) ,以及最終會有什麽簡便的方法來促進大規模的、計算機輔助下的文本分析, 為了說明當一個人想要思考世界文學問題時,需要將多少文學考慮在內,莫瑞蒂寫道:

文學如今已經明白無誤地成為了一個行星體系——當然,很多人比我閱讀得多而且好,然而我們談論的是百來種語言和文學, “更多的”閱讀似乎並非解決問題的辦法, 尤其是因為我們剛開始重新發現瑪格麗特·科恩(Margaret Cohen)稱之為“偉大的不為閱讀的部分” , (我可以聲稱:) “我是從事西方歐洲敘事學研究的,等等......” 

[] 戴安德 姜文濤 (賓夕法尼亞州立大學;美國 賓夕法尼亞州 19019;浙江大學 外國文學研究所;浙江) 杭州310058

原載: 東 社 會 科 學,2016年第11期,總第255期)

Views: 30

Comment

You need to be a member of Iconada.tv 愛墾 網 to add comments!

Join Iconada.tv 愛墾 網

愛墾網 是文化創意人的窩;自2009年7月以來,一直在挺文化創意人和他們的創作、珍藏。As home to the cultural creative community, iconada.tv supports creators since July, 2009.

Videos

  • Add Videos
  • View All