潘綏銘:生活是如何被篡改為數據的?(上)

——大數據套用到研究人類的“原罪” 

摘要:目前對於大數據已經出現了盲目崇拜,“一切皆可量化”是其核心口號和基本理論。但是在量化過程中,不可避免地會出現四種情況:剪裁現實生活、忽視社會情境、抹煞主體建構、取消生活意義。這種“原罪”並不能由於數據規模的無限增大而被消除。因此,大數據不能質疑,更不能取代各種非量化的人文社會研究。大數據只有對其“原罪”進行深刻反思,並且予以充分展示,才有資格在人文社會研究中保留一席之地。 

近年來,對於大數據已經出現了盲目崇拜,就是無質疑、不反思地跟風頌揚和無限拔高。[1]本文不涉及任何自然科學領域中的大數據及其應用,僅討論一個根本問題:大數據能夠套用到對於人類的研究中嗎?

對這個問題,我國學術界雖然也出現了一些質疑,但是不僅寥若晨星,而且在學理上也主要是在可操作性的層次上爭論,並沒有擊中要害。其實,大數據最值得質疑的,既不是其定義,[2]也不是其功能或意義,[3]還不是方法論層次上的“以相關分析取代因果分析”,[4]而是“一切皆可量化”[5]這個核心口號和基本理論。它表述了大數據的三層意思:其一,沒有量化,就沒有數據,更不可能有什麽大數據;其二,物質世界當然是可以被量化的,但是如果僅限於此,那麽所謂的大數據就僅僅是數量的增加,性質毫無改變,純屬炒作,例如天氣預報一直就在分析海量的數據,卻並沒有以大數據自居,更沒有形成崇拜;其三,現在的大數據之所以被崇拜,要害其實只有一點:把人類的行為及其結果,也給量化了,而且號稱無所不包。

這樣一來,大數據的性質就變了,從自然科學侵入到人文社會研究,從科學蛻變為“唯科學主義”。這就不僅僅是一個研究工具的問題,而是一個認識論的根本問題。對此進行批評的人文社科著作汗牛充棟,本文不再一一列舉,僅在操作的層次上分析一下,人類無限豐富的生活實踐,在被“唯科學主義”改造成“數據”的過程中,究竟發生了什麽。

 

一、現實生活被裁剪

 

大數據崇拜者極力鼓吹“4V”(規模大、種類多、高速度、高價值),[6]卻故意回避了一個根本的問題:在最開始,您收集到的,就是可以用來分析的數據嗎?[7]

在社會學的問卷調查中,這是有可能做到的;但是在所謂的大數據中,卻絕對不可能。因為大數據並不是研究者主動去收集的人類行為及其結果,而是五花八門的所謂“客觀記錄”,是人類生活中微乎其微的那一部分“可獲得信息”,例如上網活動所留下的痕跡、監控記錄等。

可是盡人皆知,在人類活動的全部信息中,可獲得的要遠遠少於不可獲得的。後者最典型的就是人類的一切精神活動的信息,在可預見的未來,仍然不但是無法獲得的,而且根本就是無法監測的。這樣一來,所謂大數據所獲得的信息,首先是極端片面;其次是漫無邊際;第三是支離破碎;第四是毫無意義;根本不可能直接用於任何量化的分析。

那麽,這樣的信息怎麽才能轉化為可分析的數據呢?首先是必須加以“界定”,就是保留什麽和舍棄什麽;其次是進行“分類”,就是把什麽歸屬於什麽;第三步是加以“定義”,就是給某類信息賦予特定的人類意義;最後一步則是“賦值”,就是把不同的定義轉換為可計算的數值。

以上網活動的痕跡為例,大數據的生產者,怎麽來界定那些痕跡是有意的還是無意的、閑置的還是凝視的、主動尋找的還是被引導而來的?界定之後,到底是根據停留時間長短還是活動的頻率,來制造出“活躍”或者“不活躍”

這樣的類別呢?為什麽把“活躍”就給定義為“需求”呢?最後,把“需求”賦值成什麽?從“不需求”到“強需求”的不同賦值之間,究竟是什麽樣的數量關系呢?

顯而易見,在這個四部曲的過程中,完完全全是研究者自己在主觀地、人為地、強制地“整理”那些“可獲得信息”,把人類生活的痕跡,完完全全地篡改為自己的世界觀和價值觀所能接受的“數據”。往好裏說,這叫做無可避免地加工;往壞裏說,這就是赤裸裸地偽造。

這就是說,所謂的大數據,其實一點都沒有超出“小數據”原有的局限性:裁剪生活,撕碎人生;非要把整體生存的“人”,視為一堆雜亂的零碎。在實際生活中,人類絕對不是,也不可能是這樣來“量化地”認知和行動的。因此,大數據其實並不是幫助人類思考,而是企圖取代和控制人類的生活經驗,是人工智能的噩兆。

 

二、社會情境被忽視

 

有人已經發現,大數據記錄的都是單獨個人的行為,無法發現不同行為者之間的關系;[8]於是問題就來了:在這個現實世界裏,難道真的存在一種與他人毫無關系的個人行為嗎?難道個人的一切行為,不都是在一定的人際關系中,才會產生,才會帶來某種結果嗎?

社會不是個人的簡單集合,而是人們通過各種關系有機地組織起來的。同時,人們又是在特定的社會環境中做出各種行為的,不可能天馬行空,獨往獨來。因此,人類活動留下的一切痕跡,必定蘊含著無限豐富的社會內容。如果舍棄之,那麽不管什麽樣的數據,不僅是浮光掠影,而且必定是盲人摸象。

尤其是,每一個人都在特定的社會中,一點一點地成長為“此時此景中的此人”,然後才會做出“此因此果的此行為”。這就是每個人的社會歷史建構過程,其中最重要的就是我們的一切社會背景、生活狀況和成長經歷。

可是這一切,往往僅僅存在於我們自己的經驗與記憶之中;往往難於言表,更往往無法記錄。從“客觀監測”的角度來說,根本就是“風過無痕”。那麽,就算毫無隱私,就算監測可以天羅地網,所謂大數據的信息源又是從何而來的呢?[9]因此,對於了解人類生活而言,大數據其實根本就是空中樓閣。

如上所述,這樣的批評還是很中肯的:“數據不懂社交、不懂背景,會制造出更多噪音,遺漏真正有價值的東西。大數據無法解決大問題。”[10]

Views: 125

Comment

You need to be a member of Iconada.tv 愛墾 網 to add comments!

Join Iconada.tv 愛墾 網

愛墾網 是文化創意人的窩;自2009年7月以來,一直在挺文化創意人和他們的創作、珍藏。As home to the cultural creative community, iconada.tv supports creators since July, 2009.

Videos

  • Add Videos
  • View All