短期记忆容量必需有限
來源:CreateAMind
介紹一篇論文:
預測性大腦的短期記憶能力肯定是有限的
短期保持信息的能力可能是人類認知的一個標志, 因為它是許多領域所需要的,如感知、行動計劃和語言。沒有大腦的這一核心功能,人類無法思考、推理或計算,甚至可能無法感知。盡管短期記憶(STM)的概念通常僅指信息的存儲,但工作記憶被認為涉及額外的執行過程,如信息的整合和處理, 并被認為支持復雜的認知活動,如語言處理、推理和問題解決(Baddeley,2003)。
從經驗上來說,STM 是使用延遲匹配樣本和變化檢測任務等范式來檢驗的,在這些任務中,要求參與者對給定的感覺輸入進行編碼,以便最終在隨后的時間點識別或回憶它。這些和其他相關的任務都揭示了一個有力但令人困惑的發現,即人類在短時記憶中所能保存的信息量(或人工操作的工作記憶) 受到嚴重限制。平均而言,據估計人類在短時記憶中只能保存四個項目(Cowan,2001)。
傳統上,重點是解決這種限制背后的機制。認知過程,如信息的衰減或干擾
迄今為止,只有少數作者提出了對短時記憶限制的功能性解釋,例如,認為它提高了記憶搜索的效率(例如,Dirlam,1972;MacGregor,1987), 有益于語言習得(如 Elman,1993),有助于檢測環境中的共變(Kareev,2000),或作為動作控制的裝置(Heuer 等人,2020)或作為眼動系統的核心組件
預測大腦
在過去十年中,人們對預測過程的興趣急劇增長(最近的綜述見 Clark,2013)。從這個角度來看, 大腦是主動的:它不僅僅依賴于自下而上的信息, 還會在感知推理過程中添加預期。一些實證研究為大腦預測其感覺輸入提供了證據(例如,Alink 等人,2010)。大規模框架,如自由能原理,表明最小化驚喜可以提高大腦功能,如感知、記憶和行動(Friston,2010)。預測性大腦的概念為人類大腦的核心功能帶來了新的功能解釋:例如,從這個角度來看,注意力并不主要被視為一個選擇過程,因為該系統否則會淹沒在感官溢出中,而是被視為一種 為 預 測 和 預 測 錯 誤 分 配 權 重 的 機 制(Friston,2010)。同樣,長期記憶(LTM),傳統上被認為是一種存儲過去信息的裝置,已經被重新考慮為一個為未來事件的模擬提供先決條件的系統(Schacter & Addis,2007)。未來第一假說甚至假設“我們重溫過去的能力可能只是我們構想未來能力 的 一 個 設 計 特 征 ”
預測和短期記憶
STM 是如何與預測過程聯系起來的?預測框架的關鍵思想是,將傳入的感覺輸入與先前的信息或預期進行比較,只有偏差或預測誤差在感覺層級中被前饋(參見 Clark,2013)。盡管許多研究調查了預測和處理預測誤差的神經相關性,并用預測模型擬合了行為數據,但是很少討論相關的心理或認知過程,例如感覺信息如何與先前的期望進行比較,在與感覺輸入進行比較的過程中,如何從 LTM 中提取先前信息并使其可訪問,以及它們的表示形式是什么。
大腦可以使用一種機制來突出和暫時保持來自 LTM 的先驗知識中與感知決策或手頭任務相關的部分。在大多數認知模型中,短時記憶被認為是來自 LTM 的提升或突出的信息,即,將選定部分標記為與當前加工相關的活動(例如,Ruchkin 等人,2003)。因此,STM 原則上可以為預測感覺輸入提供最佳的機制,因為它可以在隨后的比較過程中以高度可訪問的狀態保持相關的先驗。有一些經驗證據表明 STM 是預測所必需的。在一項相關的研究中,Travis 和他的同事(2013 年)使用了一種叫做上下文提示的視覺搜索范式,在這種范式中,參與者在看似隨機的布局中搜索一個特定的目標,這個目標的身份在整個實驗中保持不變。在他們不知道的情況下,一些布局在實驗中重復了幾次,參與者學會在這些布局中比在其他布局中更快地找到目標的位置。Travis 等人發現,當參與者在執行視覺搜索任務時必須在 STM 中保持額外的信息時,這種便利性受到阻礙,這表明 STM 對于預測物體的位置是必需的。此外,Cashdollar 等人(2017 年)證明, 在要求參與者注意一系列圖像的任務中,STM 容量與預測的神經相關性相關。這些圖像有一個概率分布,允許對其中一些進行預測。被試的短時記憶能力與預期過程的神經關聯相關,這表明短時記憶在預測客體身份方面也有作用。
STM 與預測過程相關的觀點也得到行動計劃和執行領域的研究的支持。工作記憶一詞最初是在計劃行為的語境中引入的,指的是一種“當計劃正在形成、轉換或執行時,可以被暫時保留”的系統(Miller ?et ?al ?. , 1960 , p. ?207) 。有 人 認為,“工作記憶‘只不過’是執行一個動作的準備 , 無 論 是 動 眼 、 手 動 、 口 頭 還 是 其 他 方式”(Theeuwes 等人,2009 年,第 198 頁)。具體來說,工作記憶被認為對儲存運動相關的視覺空間信息和行動計劃都很重要(Postle,2006)。最近一項結合腦電圖和功能性磁共振成像的研究表明,當工作記憶中保留的視覺內容與未來將要執行的特定動作相關聯時,運動區的預激活,從而支持了工作記憶 在 行 動 規 劃 中 發 揮 作 用 的 觀 點 (van Ede,2020)。
工作記憶和行動計劃之間的聯系與最小化意外和預測錯誤的原則高度一致,因為感覺數據的一個重要原因是經歷這些數據的有機體所追求的行動過程。如果人類根據他們計劃的行動來預測他們的感覺,那么他們必須代表他們過去和未來的行動過程所產生的數據。在下文中,我們認為如果將 STM 視為預測設備的衍生物,則可以解釋 STM 容量的限制。
預測必須是容量有限的
為了做出準確的預測,大腦必須代表事件的所有不確定性。然而,動態自然環境的一個重要特征是, 人們對未來的預測越深入,預測通常就變得越不確定。因此,與預測的不確定性的表示相關聯的成本隨著時間距離而急劇上升:如在國際象棋游戲中, 可能的配置(即,環境的狀態)的數量隨著要預測的移動的數量而指數上升。一個人要對下一步行動做出明智的決定,所有這些可能性和它們的不確定性都必須表現出來。
自然環境中的事件本質上是隨機的,因為一個事件的概率取決于前一個事件的概率。例如,如果一個剛剛遇到的人伸出他的手,他的手勢是友好的可能性取決于他之前是否表現出友好的面部表情;如果相反,他的面部表情暗示著攻擊性,那么他伸出手來表示暴力行為的可能性就要高得多。為了繞過未來事件固有的不可預測性及其隨機依賴性,最好使用有限的預測窗口。理想情況下,這個窗口不應該在離現在太近的地方結束,因為那樣它不能有效地指導感知和行動,但也不應該延伸到太遠的未來,因為那樣表示會變得太昂貴(計算復雜)。圖 1 顯示了在隨機環境中,作為從現在到未來的時間距離的函數的可能事件的數量。僅僅幾個時間步驟之后,對未來的預測(a)變得太昂貴,因為需要表示所有可能的事件,以及(b)變得幾乎無用,因為即使最可能的事件發生的概率也很低。因此,大腦的最佳策略是只預測短序列,這些短序列足夠長以允許調整行為,但又足夠短以避免可能性的指數爆炸和最可能序列的概率的指數衰減
在表示世界上的狀態軌跡的準確性和復雜性之間的平衡方面,可以更技術性地表達基本思想。簡而言之,依賴于離散狀態的序列或連續的主動推理和預測處理的當前公式(例如,使用馬爾可夫決策過程)考慮了從時間周期的開始到結束的少量離散步驟。隨著時間的推移,這些順序表征扮演著短時記憶和前瞻記憶的雙重角色(即,對短期過去和未來的表征)。這些表示賦予生成模型以時間深度,并且對于根據預期的結果來評估動作的質量是必要的。至關重要的是,這些類型的生成模型可以根據它們的證據(或變化的自由能界限)進行優化。因為證據是準確性和復雜性之間的差異,所以必須有過去(或未來)的最佳時間步數來保持給定程度的預測準確性。如果有太多的時間步長,則生成模型中的自由度將增加其復雜性,其方式無法通過伴隨的精度增加來平衡,因為世界的未來狀態變得越來越不確定
通過說 STM 的容量限制是適應性的,我們的意思是它產生于對生物系統中計算復雜性的限制和準確性益處之間的最佳折衷。隨著 STM 容量的增加,精度優勢飽和(即,達到上限),容量的進一步增加帶來額外的計算成本(復雜性),而沒有好處。這意味著,根據 STM 的擬議功能作用,容量限制是可以預期的。
這種時間尺度的分離在層級生成模型中普遍存在,在層級生成模型中,較高層預測較低層的短軌跡。閱讀提供了一個直觀的例子:句子預測單詞的短序列,單詞本身預測字母的短序列(Friston et al .,2018)。這種設置還被用于模擬涉及延遲期的工作記憶任務,以說明對某個項目的持續呈現超過了其可見的時間段(Parr & Friston,2017)。同一種結構可能支持記憶策略,如組塊,其中一系列短序列,通常約四至六個項目長,用于記憶長序列(如 Mathy & Feldman,2012)。
有人可能會說 STM 不一定只用于預期過程。然而,所有需要 STM 的實驗任務最終都需要參與者保存信息,以便與未來的感知信息(探測)和/或預期的行動(反應)進行比較。從這個角度來看,短時記憶任務構成了一個預測加工問題。從環境中提取與現在或不久的將來的感知推斷相關的信息,然后與輸入的感覺信息進行比較,并且執行內部推斷和/或外部動作來解決任何差異
如果一個考慮到 LTM 是一個保存過去的結構,人類對錯誤記憶的易感性似乎是次優的。關于人類如何通過在原始暴露的編碼階段之后添加新信息來構建新的、虛構 的 情 節 , 有 大 量 的 文 獻 ( 關 于 綜 述 , 參 見Loftus,2005)。然而,如果 LTM 利用過去的信息來模擬未來的情節,這樣的錯誤就更有意義了,因為它們可以被認為是 LTM 在創作小說情節時的靈活性的副作用(Schacter & Addis,2007)。同樣的想法也適用于 STM。STM 可以用來推斷過去和未來, 但是如果從預測大腦的角度來看 STM,它的能力限制是最有意義的。
對進一步理論化和研究的啟示
我們已經提出了一個關于 STM 容量限制的計算觀點。也就是說,我們專注于系統必須解決的問題, 也就是說,盡可能實現最準確和最有信心的預測。
這一觀點揭示了 STM 的容量限制是可以預期的。我們的觀點可能會提供新的研究途徑,偏離目前對STM 作為儲存過去感覺輸入的功能的關注。先前關于預測過程的工作主要集中在偏離預期(即預測誤差)的神經后果上。大腦如何為即將到來的信息做準備的問題還沒有得到廣泛的解決,通過將 STM 視為代表自上而下預測的活動,可以刺激該領域的研究,這些預測是為了隨后與感官輸入進行比較而保留的。未來工作的另一個途徑是對個體差異的評估,即低短時記憶能力和高短時記憶能力的個體在不同水平上的預測能力是否不同以及如何不同。
未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)大腦研究計劃,構建互聯網(城市)大腦技術和企業圖譜,為提升企業,行業與城市的智能水平服務。每日推薦范圍未來科技發展趨勢的學習型文章。目前線上平臺已收藏上千篇精華前沿科技文章和報告。
??如果您對實驗室的研究感興趣,歡迎加入未來智能實驗室線上平臺。掃描以下二維碼或點擊本文左下角“閱讀原文”
總結
以上是生活随笔為你收集整理的短期记忆容量必需有限的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 这就是深度学习如此强大的原因
- 下一篇: gin-jwt对API进行权限控制