導語
為什么人腦僅占2%的體重,卻消耗了人體20%的能量?人腦與計算機之間誰的能耗更高?大腦的代謝模式怎樣啟發(fā)計算機與人工智能設計?最近的研究發(fā)現(xiàn),大腦在處理計算與通信兩種任務時,代謝模式不同,且大腦通信的代謝成本遠高于計算。大腦能耗研究也為下一代高性能低功耗計算機的研發(fā)提供了啟示。
研究領域:大腦能量消耗,最優(yōu)計算,神經(jīng)計算,信息處理
1. 大腦能量消耗之謎
人腦僅占體重的 2%,卻占人體代謝負荷的 20% [1-3],單位質量的代謝成本是肌肉的10倍。另一方面,大腦能在大約 20 W 的能量預算下創(chuàng)作詩歌、藝術以及設計航天器——考慮到用來寫作這篇文章的計算機就需要 80 W 的能耗,大腦的能耗簡直微不足道。
大腦中何處消耗能量,能量被用來做什么?為什么大腦的代謝成本相對于其她生命活動如此高昂?大腦又是如何實現(xiàn)遠高于硅基產(chǎn)品的能量效率?
許多經(jīng)典論文都研究過這些問題。Attwell 和 Laughlin [4] 進行了詳細的生物物理估計,表明神經(jīng)信號傳導和神經(jīng)遞質釋放的突觸后效應合起來占大腦三磷酸腺苷(ATP,生物體最直接的能量來源)消耗的 80%,這一結論也得到了神經(jīng)生理學和解剖學的支持 [5, 6]。
許多研究探討了這種能量消耗的結構及功能后果,包括限制大腦尺寸和縮放規(guī)律(size and scaling)、有效連線模式、模擬(分級電位)與數(shù)字(尖峰)信號、分布式神經(jīng)代碼、沿神經(jīng)束的信息流量分布及其規(guī)模分布,還有計算異質性和效率等[8-17]。Sterling 和 Laughlin [18] 對這些想法進行綜合,得出一系列大腦的設計原則。Levy 和 Calvert [19] 提出了哺乳動物大腦功率預算的功能解釋,表明通信的代謝成本比計算高得多,并探索了神經(jīng)回路組織的功能后果。
2. 大腦中的通信和計算
Levy 和 Calvert [19] 以早期文獻為基礎,主要關注人腦中不同信息處理模式的相對能耗,而不是細胞層面不同功能的能耗。她們對通信和計算做出了關鍵的區(qū)分:“通信”一般是指信息點到點的傳輸(可能以某種方式編碼),不包括表征轉換、特征提取或決策的映射。大腦中通信的一個例子是視覺信息沿視神經(jīng)從眼睛到中央大腦的傳輸,這個過程中視覺信息保持不變。“計算”是一個更微妙的概念,通常從輸入-輸出轉換的角度來理解。
Levy 和 Calvert 在先前工作的基礎上,將每個神經(jīng)元視為對自身輸入中的潛在變量進行“微觀估計或預測”,并在脈沖間隔內(神經(jīng)元兩次傳輸信號的動作電位之間)對輸出進行編碼。微觀估計和預測是極其一般化的框架,能夠包含神經(jīng)計算的其他觀點(如將神經(jīng)元視為動力系統(tǒng)或邏輯門),并且還包含了單個神經(jīng)元在神經(jīng)網(wǎng)絡中的計算功能。同樣,脈沖間隔中信息編碼的形式也包含多種可能性,如速率編碼和模式編碼。因此,大腦中神經(jīng)元“計算”的一個例子可以是 V1 區(qū)(見圖1) 中的一個細胞對視神經(jīng)輸入信號的估計或預測,并將其編碼為視覺上某個物體(如一條水平線)的存在。
圖1.初級視覺皮層(V1),位于大腦內側枕葉的距狀溝中(后腦勺左右側)。
V1是皮層中的“第一個”視覺處理區(qū)域, LGN(外側膝狀體核,位于丘腦,接受視網(wǎng)膜大部分視覺信息輸入)將大部分軸突信號發(fā)送至V1皮層。
從這個角度出發(fā),作者對比了計算中涉及的單位脈沖間隔的興奮性電流中恢復離子梯度的 ATP 成本,以及通信中涉及的諸如軸突靜息電位、動作電位和囊泡回收等成本,最終得出結論:通信相關的生物物理過程消耗的能量是計算相關過程的 35 倍(生物相關單位以每秒消耗 ATP 分子計,物理單位以每秒消耗焦耳計) [19]。
通信與計算能耗的巨大差異為參考文獻 [4] 中隱含的發(fā)現(xiàn)證明,其作者表明神經(jīng)信號傳導和神經(jīng)遞質釋放的突觸后效應支配著大腦的功耗。來自參考文獻 [15] 的另一條證據(jù)表明,神經(jīng)元中的線粒體分布會追蹤放電率和突觸傳遞,因此軸突的粗細很可能取決于突觸終端的能耗需求,她占哺乳動物大腦能耗的 65% [20]。
在先前建立的框架中,文獻[4]與[15]中描述的高能耗過程都是通信過程,不包括文獻[19]中的計算過程。有趣的是,Levy 和 Calvert 還估計,27% 的皮層能量支出是用于與突觸發(fā)生相關的過程,例如通過肌動蛋白聚合、膜合成和摻入,以及相關的細胞內運輸?shù)纳L。這進一步細化了先前的能量預算,表明大腦將四分之一以上的能量用于促進持續(xù)學習,這與我們對大腦的印象相一致。
圖2.一個典型的神經(jīng)元由胞體(cell body),樹突(dendrite)和軸突(axon)組成
軸突的最遠端是突觸(synapse),神經(jīng)元可以通過突觸將信號傳輸?shù)搅硪粋€細胞。
3. 大腦耗能對計算機設計的啟發(fā)
在物理層面,Levy 和 Calvert 計算出皮層灰質消耗了大約 3 W 的功率,而根據(jù)大腦葡萄糖攝取量,估計大腦功率消耗為 17~20 W [1 , 2],其中 10% 在正常情況下未被使用,大約 9W 以熱量形式耗散,剩余能量為大腦其余部分供能。
對皮層灰質 3 W 的功耗估計與 Lennie [21] 早期工作的結果一致。但 Lennie 使用 20 年前可用的數(shù)據(jù),發(fā)現(xiàn)大腦能量預算的劃分略有不同——大腦50%的功耗用于與神經(jīng)電信號活動(即計算和通信)無關的過程。該結論與當前研究的差異部分來自于生物物理數(shù)據(jù),包括對突觸數(shù)量及其接通率(success rate)的估計。新的估計還表明,灰質中每個神經(jīng)元的能耗大約為2×10-9W,這與 Herculano-Houzel的工作一致[22] 。
Levy 和 Calvert 根據(jù)噪聲神經(jīng)積分器輸入和輸出之間的互信息,來估計大腦每焦耳能耗所計算的信息比特數(shù)。在這個定義下,他們發(fā)現(xiàn)神經(jīng)元每比特的計算能耗是 Landauer 理想熱力學極限*[23] 的108倍。他們認為這一巨大差異源于通信成本(Landauer 忽略了這一點)和生物需要快速響應行為的計算需求。通信成本和快速計算需求這兩個約束無疑是相關的,研究人員希望在未來仔細檢驗關于計算的定義,以及由活細胞計算施加的生物物理約束。
*譯注:Landauer 原理表明,擦除1比特信息在理論上至少要產(chǎn)生kBTln2 的能量耗散,這被稱為Landauer極限。
在 Levy 和 Calvert 的分析中,能量預算和每焦耳能耗所計算的比特數(shù)都取決于一個參數(shù):皮質錐體神經(jīng)元的平均輸入突觸數(shù)乘以她們的接通率。他們發(fā)現(xiàn),當這個參數(shù)大約為 2000 時,每焦耳能耗所計算的比特數(shù)估值將最大化,接近于他們從數(shù)據(jù)中得出的值。這個有趣的結果讓人想起之前使用能源效率來理解神經(jīng)放電應該如何組織的研究 [11, 13],以及信息應該如何在大腦中的細胞和結構之間進行分配的研究 [14, 17]。這項新工作為更精細地分析大腦中的回路結構以及大腦如何劃分計算任務打開了大門。
圖3. 大腦中的計算分布在網(wǎng)絡中通信的特定組件之間。
綠色圓圈表示皮質區(qū)域網(wǎng)絡,每個區(qū)域執(zhí)行不同的功能。橙色三角形表示錐體細胞網(wǎng)絡,她們通過協(xié)作計算單個皮質區(qū)域的功能。Levy 和 Calvert 認為基本單元的計算成本相比于她們之間的通信成本而言微不足道。
Levy 和 Calvert 的結果與在持續(xù)計算和通信方面解釋區(qū)域腦代謝的功能性磁共振成像(fMRI)測量值是相關的。新數(shù)據(jù)也適用于對大腦演化的研究,如針對大腦代謝成本高昂 [7] 及代謝生理上限制大腦結構 [8, 22] 的研究。
Levy 的研究結果也會引發(fā)工程師對設計下一代低功耗智能計算設備的興趣。研究指出由大腦灰質完成的計算和通信僅需3W的功率,即使加上用于保溫的9W功率,這一功耗也比典型的筆記本電腦低出近一個數(shù)量級。
先前的工作表明,信息處理速率和能耗間存在的收益遞減規(guī)律將推動計算機向異構架構發(fā)展,在這種架構中,整體功能在各尺度上通過大量特定單元間的協(xié)作涌現(xiàn),每個特定單元以物理基質決定的最高效率處理信息[17]。Levy 和 Calvert 的論文表明,這種向異構架構的轉變必須平衡好不同組件之間的網(wǎng)絡學習成本和通信成本,因為盡管每個單元的計算成本相對較低,但單元間的通信成本將是高昂的。
Vijay Balasubramanian | 作者
張澳 | 翻譯
梁金 | 審校
鄧一雪 | 編輯
商務合作及投稿轉載|swarma@swarma.org
◆ ◆ ◆
搜索公眾號:集智俱樂部
加入“沒有圍墻的研究所”
讓蘋果砸得更猛烈些吧!