“超聲讀心”新突破:用意念控制方向,實現“未動先知”
腦機接口,作爲當下神經科學領域最爲關注的科技前沿話題,在今年二月被《自然-電子》雜志評爲2023年年度技術。該雜志還強調,2023年是我們對腦機接口技術做出反思,並考慮其發展方向的關鍵時刻。今年七月,聯合國教育、科學及文化組織(UNESCO)發布了一份關于神經技術的報告,而腦機接口正是這個領域的核心[1]。
在獲得高關注的同時,腦機接口技術本身也不斷刷新著自身記錄:今年10月在《自然-神經科學》上發布的一項研究表明,借助功能性超聲(fUS)神經影像技術,可以做到“未動先知”,在不植入電極的前提下,在猴子沒有做出任何行動時就可以解讀出它們的運動計劃[2]。研究者來自美國加州理工學院神經科學教授、天橋腦科學研究院(TCCI)腦機接口中心主任Richard Andersen團隊。
▷圖源:論文封面 圖源:參考文獻2
簡單來說,研究者通過fUS從兩只恒河猴的後頂葉皮層獲取它們執行眼睛和手部運動時的數據。經過訓練,這些猴子能夠使用腦機接口(BMI)實時控制最多八個運動方向。他們還開發了一種使用先前會話的數據進行預訓練的腦機接口(BMI)方法。這樣就能在隨後的幾天,甚至相隔數月的實驗期間實現即時控制,而無需進行大量的重新校准。這項研究將人們的視野再次聚焦在這個帶有濃濃科幻色彩的腦機技術上,從它身上,我們可以窺見“超聲讀心”技術背後的特點與突破。
爲了測試fUS-BMI的可行性,研究者首先進行了在線閉環的兩個運動方向上的解碼。在猴子根據記憶引導完成左右眼動任務時記錄實時的fUS數據。在得到100個成功試次的數據後,實驗切換到閉環解碼階段:猴子只能通過運動的意圖來控制任務方向,並每次都會被告知BMI預測出來的是左邊還是右邊。在第二個階段中,解碼器在55次訓練試驗後准確性顯著提高,並在第114次試驗達到82%准確性。
爲了測試跨時段的重新校准問題,研究者通過預訓練的方法在不同會話之間保持了fUS-BMI的穩定解碼性能。他們比較僅使用當前會話數據和使用前一次會話數據進行預訓練的fUS-BMI性能,發現預訓練顯著提高了性能且縮短了訓練時間。
▷圖源:跨時段解碼的預訓練流程。圖源:參考文獻2
在解決了跨時區重新校准問題,保證了在線閉環解碼的性能之後,爲了進一步提升fUS-BMI的性能,研究者這一次嘗試實時解碼八個運動方向。首先分別預測運動意向的垂直(上、中、下)和水平(左、中、右)分量,然後將這些獨立的預測組合成最終的預測(例如,向上和向右)。這樣的設計與後頂葉皮層(PPC)神經元的響應特征是相符的:對相鄰運動方向有相似的響應,但對具有更大角度分離的運動方向有不同的響應。換句話說,這種多編碼器方法融入了相鄰方向之間的神經表示相似性,而不是將八個方向視爲八個獨立的類別。解碼器在86個訓練試驗後准確度達到顯著(高于與12.5%的隨機水平),並穩定在34-37%的准確度。這時,研究者再次測試了預訓練的效果,再次發現預訓練減少了達到顯著解碼所需的試驗次數。
得益于fUS技術,研究者得以記錄到多個功能腦區的活動,例如編碼手和眼動的區域。爲了驗證這一點,他們將上述訓練、解碼過程在手動任務中重複了一遍,也獲得了很好的效果。
▷圖源:眼動與手動實驗流程。圖源:參考文獻2
“超聲讀心”的原理
人們研究大腦最直接的目的是理解、解讀、最終自主控制大腦,腦機接口就爲此提供了大腦與外界設備直接通訊的連接,可以記錄、解碼和刺激神經活動。我們都知道,神經信號在神經元上以電信號傳播,最直接的測量方式是使用電極記錄局部場電位(如ECoG)或者穿過頭皮的電信號(如EEG),除此之外還有很多間接的方式來測量神經活動,如fMRI(功能性磁共振成像)、Ca2+(鈣離子)等。此次研究所使用的超聲波信號便是這樣一種間接信號,它被用于大腦成像只有十余年的曆史。
從成像原理上看,fUS與fMRI類似,依靠的是神經血管耦合效應。利用超聲波在大腦小動脈和毛細血管內成像血流動力學參數(血容量),以約1赫茲的頻率來間接推斷神經活動。位置信息則是基于脈衝波多普勒效應,對超聲波接收的反射聲音,根據靜止發射源和移動反射目標之間的距離推斷反射目標的運動信息。同時,爲了達到較深的成像距離,fUS必須使用極短的超聲脈衝,這使得直接測量頻率變化難以被實現,然而發送多個脈衝時,整合多個反射信號便可以間接計算出頻率的短時間延遲,這便是脈衝波的多普勒效應。
在收集到成像數據後,所得到的神經元信息還需要經曆一道關卡——濾波。血液細胞被移動的腦組織包圍,這些腦組織也會産生多普勒信號,而分離血液和組織信號的過程至關重要。由于心髒、呼吸和行爲活動引起的腦組織移動通常較慢,因此産生的多普勒信號的絕對頻率較低于血液。使用高通濾波器可以消除這些組織信號,僅保留血液信號。更先進的濾波技術則可以優化這種分離,因此高效的濾波對清醒狀態下的記錄尤爲重要[3]。
“超聲讀心”的前世今生
截至目前,大多數fUS研究都是在齧齒動物中進行的[4]。最初,研究者只能在固定頭部的麻醉大鼠上做實驗,得益于臨床技術的進步,長期耐受性良好的顱窗使得在清醒的頭部固定小鼠上采集fUS信號成爲可能[5]。在齧齒類動物身上使用fUS信號主要是爲了檢測技術的可行性。直到最近,對固定頭部清醒小鼠的研究才開始著重于觀測全腦成像與行爲、環路操縱的關系[6]。與fUS固定成像同時發展起來的還有在不同物種動物身上應用的拓展,這證明了這項技術可以廣泛應用于多個物種,只需要調整頻率以適應不同的大腦體積。
fUS的一個明顯優勢是它能夠跟蹤自由移動的齧齒動物的全腦活動。從技術上講,只需在動物頭上植入顱窗和支架,在實驗期間將超聲波探頭插入其中。當動物奔跑或執行行爲任務時,就可以同時通過電纜連接到超聲波掃描儀。自由移動成像技術的發展得益于小型線性超聲探頭的制造。這些微型探頭有一個堅硬的電纜,一次只能成像一個成像平面。盡管如此,當齧齒類動物執行比頭部固定的任務更自然的任務時,它們爲觀測大腦深處的活動提供了途徑。在論證了該技術的可行性後[6],大鼠自由移動的fUS主要用于系統層面的行爲狀態研究,如運動或睡眠,這些行爲狀態在無約束條件下才可以更自然地發生[7]。
此外,將fUS成像與同時進行的電生理記錄相結合,還可以使大規模血流動力學模式與特定區域的神經元活動相關聯。
除了齧齒類動物外,fUS對于非人靈長類研究也十分具有吸引力,從技術上來說研究方法均與齧齒類動物應用類似,但爲了適應非人靈長類動物(如猴子)頭皮有褶皺的結構,研究者對深層腦區成像使用了更低的頻率。例如近期有一項研究就利用fUS對清醒的非人靈長類動物深層視覺皮層進行精細研究[9]。此外,fUS還在猕猴身上被用于進行記憶引導的運動任務的成像,這被認爲是用fUS解碼靈長類動物大腦運動計劃的首項工作。盡管由于血管信號的幹擾,時間分辨率較低,但這爲利用深層大腦信號控制外界機械設備作下了重要鋪墊。自這篇文章發表之後,科學家便在臨床與數據分析兩方面持續突破。
今年,代表這項技術在信號處理與數據分析方面重大突破的便是此次來自Richard Andersen教授團隊的研究[2],而在十分相近的時間內,作者還發表了首例將fUS用于完全完整的成年人頭骨中監測大腦活動的工作[10]。
這一突破爲研究者提供了在不侵入人體的情況下獲取高靈敏度、大規模、高分辨率神經成像的新途徑。通過這一技術,研究者首次實現了對手指運動的皮層響應的完全非侵入式映射和解碼,生成了高分辨率(200微米)和大規模(50毫米x38毫米)的腦成像。這項研究將有助于深入理解腦活動,推動神經科學和腦機接口技術的發展,爲神經疾病治療和腦機接口應用提供創新性的方法。
▷圖源:首例將fUS用于成年人頭骨監測大腦活動的研究。圖源:參考文獻10
“超聲讀心”與其他信號的比較
到此,我們已能夠更好的理解fUS成像的特征,而與其他成像技術對比,就可以更直觀的感受到不同技術收集信號性能的優劣之處。它們的差異主要體現在性能、侵入性、覆蓋範圍、時空分辨率、便攜性和跨時段的解碼穩定性上。
從表現上來說,目前最先進的使用膜下ECoG或侵入式電極的腦機接口可以以高准確度解碼每分鍾>15-60個單詞、每分鍾>29-90個字符以及個別手指的運動。
非侵入式的EEG是另一種常用于控制腦機接口的技術,而當代基于EEG的BMI有很大的個體差異性,一般來說使用EEG可以實現70-90%的准確率來對運動意圖進行二分類。
再來看fUS,fUS記錄到的信號既能實現廣泛的覆蓋範圍,又能達到較高的空間分辨率(100微米)。15.6MHz的超聲波探頭可以提供12.8 mm × 20 mm這樣大而深的視場,可以同時可靠地記錄來自多個大腦皮層區域、廣泛分布于多個腦區的運動信號。此外,許多腦機接口技術僅限于從大腦表面幾毫米深的淺層皮層記錄(例如ECoG、Utah陣列和鈣成像)。但在本次研究中,研究人員采集到了解碼眼動信息最有信息量的位于中到深層的LIP腦區信號,大約在大腦皮層下5-9毫米,這是別的技術無法實現的。
另外,雖然目前fUS與EEG的性能指標相近,但相較EEG、fNIRS和fMRI,fUS更具發展潛力。先前的研究發現,用PPC腦區的fUS信號進行解碼,准確率隨著空間分辨率下降而迅速惡化。這意味著,對于其他宏觀空間分辨率的腦機接口技術,將難以有效地解碼在微觀和中觀神經群體中變化的信息。
此外,fUS還具有易于重定位和能夠穿透軟組織這些便攜性的優點。侵入性電極陣列通常只能插入一次,並且常由于定位不佳或爲了避免影響主血管而經常選擇放置在次優位置。植入電極陣列還需要額外的手術從而難以重新定位。並且對這些技術來說,組織反應會降低硬腦膜下和顱內慢性電極的性能。而當使用fUS的時候,超聲波探頭可以在鎖定位置之前進行多次定位、測試和重新定位,因此就更容易找到並記錄特定感興趣的區域。原則上,fUS可以無限期地通過硬腦膜操作,實現在很長時間內的慢性成像,並且信號質量幾乎不受損耗。
可見,fUS雖然是一項新興技術,卻具有很大的潛力。不過我們同時也需要看到它的不足與受限之處。它受制于中觀神經血管耦合(秒級),神經血管反應充當每個體素信號的低通濾波器,導致時間分辨率較低。在2赫茲的fUS下實時延遲約爲800毫秒。這也是fUS無法實現實時成像的原因。在目前的技術條件下,只能通過先前獲取的離線fUS數據進行滯後相關分析,近似得到100Hz fUS的成像結果。
但綜合考慮時空分辨率,fUS依舊具有獨特的優勢,可以檢測到腦內的神經血流動力學信號,例如監測神經精神疾病的生物標志物。在一些腦機接口的應用場景下,即使只有較慢的中觀神經血流動力學反應,也可以提取出意圖運動的軌迹有關的信號。
“超聲讀心”的未來發展方向
那麽,這項研究的意義何在?簡單來說,研究者們展示並驗證了一種在線、閉環功能性超聲腦機接口(fUS-BMI)的有效性,這代表了目前最前沿的結果。對此,他們主要提出了兩大突破點。
1. 解碼更多運動方向:基于以往解碼兩個眼動方向或者兩個手動方向的結果,成功實現了實時解碼八個運動方向。
2. 實現跨階段的解碼穩定性:使用顱內電極的腦機接口(BMIs),例如猶他陣列,特別擅長在行爲或刺激期間從空間定位的區域(<1厘米)感知快速變化(毫秒級)的神經活動,該活動與這些空間特定區域的活動相關,例如運動的M1區域和視覺的V1區域。
然而,顱內電極在較長時間內(例如在後續記錄會話之間)難以跟蹤個別神經元,因此解碼器通常每天重新訓練。類似的神經群體識別問題也存在于超聲設備中,包括在實驗會話之間的視野偏移。在當前研究中,作者使用了一種對齊方法,該方法在一個月以上的時間內穩定了基于圖像的腦機接口,即使需要重新訓練,也可以在最小程度下從相同的神經血管群體解碼。
而這是一項重要的發展,它使得研究者可以輕松地將前一天的模型與新一天的數據對齊,並允許在最小或沒有新的訓練數據的情況下開始解碼。與傳統基于流形的方法相比,作者采用的解碼器對齊算法利用了fUS神經影像學提供的內在空間分辨率和視野,以直觀、可重複和高性能的方式保證解碼器穩定性。
他們使用單個fUS幀(∼500毫秒)生成了當前會話解剖的圖像,並將前一會話的視野對齊到這個單一圖像上。值得注意的是,這不需要任何額外的行爲數據來進行對齊。
至于未來應如何提高超聲成像在腦機接口領域的性能,作者也提出了幾點。從采樣區域上,作者建議更改放置頭柱與探頭的位置,使得可以對于更大範圍的LIP腦區進行成像。其次,在成像技術上,過往主要關注如何獲得單層腦片的圖像,但爲了更全面的獲得大腦活動信息,3D體積成像是一種可能的解決方案。然而目前,由于帶寬、內存和計算能力的限制,高質量、低延遲的實時3D fUS成像尚不可能。然而,硬件和算法的不斷進步很可能很快就會實現3D fUS-BMI。
最後,提高性能的另一途徑可能是使用更先進的解碼器模型來代替當前的線性解碼器。卷積神經網絡專門用于識別圖像特征,並且對于fUS圖像中常見的空間擾動(如與呼吸或心率相關的腦脈動)具有魯棒性。此外,循環神經網絡和Transformers模型使用“記憶”的過程,可能特別擅長表征fUS時間序列數據的時間結構。不過,這類人工神經網絡(ANNs)的一個潛在缺點在于它們需要更多的訓練數據。
由此,作者也介紹了一種跨會話圖像的對齊方法,允許將先前記錄的數據彙總並組織成大型數據語料庫。這樣的數據語料庫可能足以訓練許多ANNs。
除了訓練ANNs所需的數據量外,最近的研究還強調了在爲閉環運動BMI控制訓練深度學習模型時所面臨的額外挑戰,特別是避免模型對先前記錄數據中的時間結構過度擬合。盡管目前ANN還未被用于當前的腦機接口實驗研究中,但它在未來研究更複雜的fUS-BMI有很大的潛力。
總結 : 當我們暢想大腦與機器的互動時,一定會好奇人類究竟能做到哪一步?通過回看fUS一步步的發展以及最近令人興奮的研究成果,我們對這一新興技術有了更全面的認識。
也許在不久的將來,人類就能看到它得以更廣泛地在人類身上得到應用,來解讀人類更複雜的“想法”。那時候它不會是神奇的“天外來物”,而是凝聚了人類醫學、工程學、數學等多領域智慧的結晶。---來源: 钛媒體-