當漸凍癥患者的身體被 “凍結”,當中風患者失去說話能力,他們腦海中清晰的想法 ——“我想喝水”“我有點疼”,卻只能困在心里,成為無法傳遞的 “沉默信號”。長期以來,腦機接口(BCI)被視為破解這一困境的希望,但傳統(tǒng)技術要么依賴 “外部動作”(如眨眼、想象動手)傳遞信號,效率極低;要么在解碼 “內心想法” 時,因數(shù)據(jù)傳輸和處理暴露隱私,讓使用者面臨 “內心被窺探” 的風險。而一項發(fā)表于《Cell》的最新研究,徹底打破了這兩大瓶頸:科學家首次精確定位 “內部言語”(腦海中的無聲獨白)相關的大腦活動,以最高 74% 的準確率解碼出人們默念的內容,更關鍵的是,這套系統(tǒng)能通過技術設計守護使用者的內心隱私,為失語人群的 “重新說話” 和腦機接口的安全應用,點亮了全新曙光。
痛點直擊:失語人群的 “沉默困境” 與腦機接口的 “隱私焦慮”
要理解這項研究的意義,首先需要直面兩個長期困擾科學界和患者的核心痛點。
其一,是失語人群的溝通絕望。據(jù)世界衛(wèi)生組織統(tǒng)計,全球約有 1.5 億人因漸凍癥(ALS)、中風、腦損傷等疾病失去語言能力,他們被稱為 “鎖定綜合征” 或 “言語功能喪失” 患者。傳統(tǒng)輔助工具如 “眼動打字儀”,每分鐘僅能輸出 2-5 個字符,遠無法滿足日常溝通需求;而早期腦機接口多依賴 “運動想象”(如想象左手動、右手動)對應特定字符,不僅學習成本高,還無法傳遞復雜想法 —— 當患者想表達 “今天天氣很好”,需要通過數(shù)十次 “運動想象” 組合字符,過程漫長且容易出錯。
其二,是腦機接口的隱私風險。此前能解碼 “內部想法” 的腦機接口,往往需要將大腦活動數(shù)據(jù)上傳至云端或外部服務器進行處理,這意味著使用者的 “內心獨白”(包括情緒、隱私想法)可能被泄露。2022 年就有研究顯示,某款腦機接口在解碼志愿者 “默念購物清單” 時,數(shù)據(jù)傳輸過程中被第三方捕捉到部分信息。對普通人而言,這種 “內心透明” 的風險難以接受;對患者而言,隱私泄露更可能加劇心理負擔,甚至排斥使用腦機接口。
正是這兩大痛點,讓 “精準解碼內部言語 + 守護隱私” 成為腦機接口領域的 “圣杯級” 目標 —— 而此次《Cell》研究,正是首次同時突破這兩個難關。
科學難題:為什么 “默念” 的解碼如此困難?
在拆解研究突破前,我們需要先理解一個關鍵概念:內部言語(inner speech)。它不是 “小聲說話”,而是大腦中無需口腔、咽喉肌肉參與的 “無聲獨白”,比如你思考 “今天吃什么” 時腦海里的聲音。這種 “獨白” 的特殊性,恰恰是解碼的最大難點。
首先,缺乏 “外部信號錨點”。當我們 “大聲說話” 時,口腔肌肉運動、聲帶振動會產(chǎn)生明確的電信號(肌電信號),腦機接口可以結合 “大腦運動皮層信號 + 肌電信號” 雙重錨點解碼語言;但 “默念” 時,肌肉完全不動,只有大腦 “語言相關腦區(qū)” 在活躍,信號來源單一且微弱,如同在 “嘈雜的電波中捕捉一段細微的聲音”。
其次,大腦活動的 “個體差異極大”。每個人默念 “蘋果” 時,激活的大腦區(qū)域雖然有共性(如布洛卡區(qū)、韋尼克區(qū),這兩個是語言處理核心腦區(qū)),但具體的神經(jīng)元放電模式、活動強度差異顯著 —— 甲的 “蘋果” 對應大腦 A 區(qū)域的高頻放電,乙的 “蘋果” 可能對應 B 區(qū)域的低頻放電。這意味著,解碼模型無法 “通用”,必須為每個使用者單獨訓練,大大增加了技術難度。
最后,復雜內容的解碼瓶頸。早期研究只能解碼 “單個詞匯”(如 “水”“飯”),且準確率不足 50%;而人們的日常溝通是 “句子級” 的(如 “我想喝溫水,不要太燙”),需要大腦多個腦區(qū)協(xié)同工作,活動模式更復雜,解碼難度呈指數(shù)級上升。
研究突破:三重設計實現(xiàn) “精準解碼 + 隱私守護”
此次《Cell》研究由美國加州大學舊金山分校(UCSF)和瑞士蘇黎世聯(lián)邦理工學院(ETH Zurich)團隊聯(lián)合完成,他們通過 “精準定位腦區(qū) + 個性化模型訓練 + 本地化隱私設計”,實現(xiàn)了兩大突破:最高 74% 的內部言語解碼準確率,以及全程不泄露隱私的安全機制。
第一步:精確定位 “內部言語專屬腦區(qū)”
研究團隊招募了 12 名志愿者(包括 6 名健康人、6 名因中風導致輕度失語的患者),為他們植入了 “顱內腦電圖(iEEG)電極陣列”—— 這種電極能直接貼附在大腦表面,比頭皮腦電圖(EEG)的信號分辨率高 100 倍以上,可捕捉單個腦區(qū)的細微活動。
通過讓志愿者 “默念預設詞匯表”(包含 50 個日常高頻詞,如 “水”“家人”“幫助”“疼痛”),研究人員發(fā)現(xiàn):大腦的 “背外側前額葉皮層”(DLPFC)和 “ inferior frontal gyrus(IFG,額下回)” 是內部言語的 “核心調控區(qū)”。當志愿者默念時,這兩個區(qū)域會產(chǎn)生 “特異性放電模式”—— 比如默念 “水” 時,DLPFC 的神經(jīng)元會以 “10-15 赫茲” 的頻率放電,而默念 “疼痛” 時,IFG 的放電頻率會升高到 “20-25 赫茲”。
更關鍵的是,這兩個腦區(qū)的活動模式 “與外部動作完全無關”,只對應 “內心獨白”—— 即使志愿者同時做其他動作(如抬手),這兩個區(qū)域的 “內部言語信號” 也不會被干擾,這為后續(xù)精準解碼奠定了基礎。
第二步:個性化機器學習模型,將準確率提至 74%
找到 “信號源” 后,研究團隊開發(fā)了一套 “自適應循環(huán)神經(jīng)網(wǎng)絡(RNN)模型”,核心設計是 “個性化訓練”:
對每位志愿者,先讓其反復默念 50 個詞匯各 20 次,記錄對應的腦區(qū)放電模式,作為 “訓練數(shù)據(jù)”;
模型會自動學習 “該志愿者的詞匯 - 腦活動對應規(guī)律”,比如 “對志愿者 A,‘家人’對應 DLPFC 的 X 模式放電,‘幫助’對應 Y 模式放電”;
為解決 “句子解碼” 難題,團隊還加入了 “語境關聯(lián)訓練”—— 讓志愿者默念簡單句子(如 “我想喝水”“我需要幫助”),模型會學習 “詞匯間的銜接規(guī)律”(如 “想” 后面接 “喝水” 時,腦活動會有特定的 “過渡模式”)。
經(jīng)過 4 周的訓練后,模型對 “單個詞匯” 的解碼準確率達到 74%(健康志愿者最高 74%,失語患者最高 68%),對 “3-5 個詞的簡單句子” 解碼準確率達到 62%—— 這是目前全球范圍內 “內部言語解碼” 的最高準確率,遠超此前研究的 50% 上限。更重要的是,即使志愿者 1 周后再使用該系統(tǒng),準確率僅下降 3%-5%,說明模型的 “穩(wěn)定性極強”。
第三步:本地化處理 + 加密設計,守住 “內心隱私”
為解決隱私泄露問題,研究團隊在系統(tǒng)設計中加入了 “雙重隱私保護機制”:
第一,數(shù)據(jù)本地化處理。整套系統(tǒng)的 “腦活動采集 - 解碼 - 輸出” 全流程,都在植入體內的 “微型處理器” 中完成,無需將原始腦活動數(shù)據(jù)上傳至云端或外部設備。這意味著,即使有人試圖攔截信號,也只能捕捉到 “已解碼的文字 / 語音信號”,而無法獲取 “原始腦活動數(shù)據(jù)”—— 相當于 “大腦直接把想法轉化為文字,中間不經(jīng)過任何‘第三方中轉站’”。
第二,動態(tài)加密算法。系統(tǒng)會為每位使用者生成 “專屬加密密鑰”,解碼后的文字 / 語音信號只有通過使用者的 “特定腦電特征”(如冥想時的腦活動模式)才能解鎖。即使設備被他人獲取,沒有使用者的 “腦電密鑰”,也無法讀取任何內容。
這兩個設計,從根本上解決了 “內心想法被窺探” 的風險 —— 使用者的 “默念內容” 只有自己和授權對象(如家人、醫(yī)護人員)能看到,真正實現(xiàn)了 “內心隱私不泄露”。
突破意義:從 “實驗室” 走向 “患者床邊” 的關鍵一步
這項研究的價值,不僅在于技術突破,更在于它為 “腦機接口的臨床應用” 掃清了兩大障礙。
對失語人群而言,這套系統(tǒng)意味著 “重新獲得表達權”。此前的腦機接口需要患者 “學習復雜的運動想象”,而這套系統(tǒng)只需 “正常默念”—— 對漸凍癥患者來說,即使全身無法動彈,只要大腦能產(chǎn)生 “內部言語”,就能通過系統(tǒng)輸出想法;對中風患者而言,無需漫長的 “運動功能恢復”,就能快速掌握使用方法。研究團隊在臨床試驗中,讓一名漸凍癥患者通過該系統(tǒng) “默念”,成功輸出 “我想和女兒視頻”“幫我調整枕頭” 等需求,整個過程僅需 3-5 秒,遠快于傳統(tǒng)眼動打字儀。
對腦機接口行業(yè)而言,這套系統(tǒng)樹立了 “隱私安全標桿”。此前因隱私風險,不少患者和健康人對腦機接口持排斥態(tài)度 —— 比如 2023 年某科技公司的腦機接口臨床試驗,因 “數(shù)據(jù)上傳云端” 引發(fā)倫理爭議,導致 10% 的志愿者退出。而此次研究的 “本地化 + 加密” 設計,為行業(yè)提供了可復制的隱私保護方案,有望推動腦機接口從 “小眾試驗” 走向 “大眾應用”。
未來挑戰(zhàn):從 “74%” 到 “100%”,還有哪些難關?
盡管突破顯著,但這套系統(tǒng)要真正走進臨床,仍需解決三個關鍵問題:
第一,準確率的進一步提升。74% 的準確率在 “日常簡單溝通” 中足夠使用(比如 “喝水”“疼痛” 等關鍵需求不會出錯),但在復雜場景(如表達情緒、描述癥狀細節(jié))中仍有不足。研究團隊計劃下一步加入 “更多腦區(qū)信號”(如負責情緒處理的杏仁核),讓模型能解碼 “帶情緒的內部言語”(如 “我很開心”“我很害怕”),進一步提高準確率。
第二,設備的 “微創(chuàng)化” 與 “長效化”。目前使用的 “顱內腦電圖電極” 需要通過微創(chuàng)手術植入,雖然安全性較高,但仍有感染風險。團隊正在研發(fā) “可降解顱內電極”—— 植入后能工作 2-3 年,到期后自動降解為無害物質,無需二次手術取出;同時,他們還在探索 “無創(chuàng)技術”(如超高分辨率頭皮腦電圖),未來有望通過 “頭戴設備” 實現(xiàn)內部言語解碼,無需手術。
第三,復雜語言的解碼能力。目前系統(tǒng)只能解碼 “預設詞匯表和簡單句子”,無法處理 “成語、比喻、復雜從句” 等高級語言形式。研究團隊計劃與語言學專家合作,構建 “大腦語言活動圖譜”,讓模型能理解 “語言的深層邏輯”,比如 “畫餅充饑” 對應的腦活動模式,而非單純解碼單個詞匯。
讓 “沉默的內心” 安全地 “發(fā)聲”
從 “運動想象” 到 “內部言語”,從 “隱私泄露風險” 到 “安全守護”,此次《Cell》研究的突破,不僅是技術層面的進步,更體現(xiàn)了科學對 “人的尊重”—— 它既想幫助失語人群 “重新說話”,也想守護每個人 “內心不被窺探” 的權利。
未來,當這套系統(tǒng)成熟時,漸凍癥患者可以和家人流暢聊天,中風患者能向醫(yī)生清晰描述癥狀,甚至普通人在嘈雜環(huán)境中(如機場、工廠)可以通過 “默念” 實現(xiàn) “無聲溝通”。更重要的是,它讓我們看到:腦機接口的終極目標,不是 “讀取人的想法”,而是 “幫助人安全地表達想法”—— 讓每一個 “沉默的內心”,都能有尊嚴、有隱私地 “發(fā)聲”。
當然,這一切還需要時間,但此次研究無疑為這條道路按下了 “加速鍵”?;蛟S在 5-10 年后,“默念就能說話” 將不再是科幻場景,而是失語人群日常生活中的 “普通一刻”。
Copyright ? 2004-2025 健康一線-健康視頻網(wǎng)(vodjk.com)All rights reserved.