Andy Clark·自由能原理，看凖世界的未来 6

預測編碼最初是一種為實施信號處理而開發的數據壓縮策略（相關歷史見Shi&Sun, 1999）。以一類基本任務，如圖像傳輸為例，在大多數圖像中，一個像素點的值穩定地預測其鄰近像素點的值，除卻一些例外情況——這些例外情況反映了圖像某些重要的特征，如對象之間的邊界。這意味著：通過僅對意料之外的變動（即真實值與預測值發生偏離之處）進行編碼，一幅圖像的代碼可以由一個「充分知情」的接收裝置進行有效地壓縮。一個最為簡單的預測原則是相鄰的像素點都具有相同的值（如相同的灰度值），當然更為複雜的預測也是完全可能的。只要存在可檢測的規律性，就可以實施預測（進而可以實施特定類型的數據壓縮）。我們感興趣的是真實值與預測值的偏離，它們被量化為實際信號和預測信號之間的差異（即「預測誤差」）。這種數據壓縮策略大大節約了帶寬，而節約帶寬正是20世紀50年代James Flanagan和貝爾實驗室的其他工作人員努力開發新技術背後的動力。

通過「知情的」數據壓縮，人們可以從相當簡練的編碼中重現豐富多彩的原始聲像。這項技術對諸如影像資料的運動壓縮編碼意義相當重大。在構成影像的圖像序列中，重建當前幀圖像所需要的大量數據已經呈現在前一幀圖像之中了。如果一段影像記錄了某物體在一個穩定背景下的移動，我們可以假定當前幀圖像中絕大多數背景信息與前一幀圖像中的完全相同，除卻被遮擋部分的變化和鏡頭平移導致的差異。在預測編碼較為複雜的應用中，只要物體運動的速度（甚至加速度）保持不變，我們就能夠使用所謂運動補償的預測誤差掌握其可預測的運動信息。換言之，只要對運動進行了適當的補償，重建當前幀圖像所需的全部信息就都包含在前一幀圖像里了。要得到當前幀圖像，你只需要發送一條簡單的訊息（例如，不那麼正式地說，它大概可以表示為「和之前一樣，只是將所有內容向右移動兩個像素」）。原則上，任何系統性、規律性的變化都能被預測，殘余下來的只有那些真正意想不到的誤差（例如，一個先前被遮擋的物體突然意外地出現）。

這里面的訣竅是使用智能和知識降低當前編碼和傳輸過程的成本。注意，我們並不需要接收裝置進行「有意識的」預測或期望。重要的是，預測裝置需要能夠充分利用其檢測到的規律，或基於其他有效的預設重建傳入信號。通過這種方式，像我們這樣的動物就能通過使用自己已經具備的知識，盡可能多地預測當前的感知刺激，以節約寶貴的神經帶寬。當窗簾以某種方式輕輕搖晃，你立刻意識到是心愛的小貓小狗在後頭搗亂（盡管也可能只是一陣風）——在每一個這樣的時刻，你都在利用訓練有素的預測機制完成感知任務。這節約了你的帶寬，並且通常能讓你更好地認識世界。

因此，預測加工機制將「自上而下」的概率生成模型，與保證編碼及傳輸過程高效性的核心預測編碼策略相結合，在多層雙向級聯中使用。如果預測加工的邏輯是正確的，那麼知覺就是一個我們（或我們的大腦不同的部分）對內外部事件進行猜測的過程，輸入信號更多地被用於對猜測進行微調，而非詳細地編碼目標事件的狀態（後者太佔用帶寬）。當然，這並不是說只有在所有前饋誤差信號都被消除後，我們才能感知到什麼。雖說只有當下行預測和傳入刺激在多個層級上實現了匹配，完整而豐富的感知才能形成，但這種匹配（我們稍後將看到）本來就是逐步完成的。動物擁有一套訓練有素的的前饋掃描機制，對一些簡單的（如低空間頻率的）線索高度敏感。通過使用這一機制，它們能夠快速地感知到場景的一般性質或「主旨」（gist）。而後，隨著一波波自上而下的預測持續展開，殘餘的誤差信號逐漸減弱，同時更為豐富的細節也湧現出來。以此觀之，持續不斷的感知過程是大腦利用其存儲的知識，以一種循序漸進、逐步細化的方式，對由當前感知刺激引發的多層神經反應模式進行預測。這反過來也強調了期望結構（不論它們是有意識的還是無意識的）能夠在多大程度上決定我們的所見、所聞和所感。

Promote

5 members promoted this