Research press release

神経科学:発話を助ける脳インプラントの改良

Nature

脳の活動を解読して、発話音声を生成する脳-コンピューターインターフェース(BCI)について報告する2編の論文が、Natureに掲載される。新たに開発されたBCIは、既存の技術と比べて、解読の速度と精度が向上し、より豊富な語彙に対応することができる。この知見は、重度の麻痺患者のコミュニケーション能力の回復を目的とした技術開発の進展を示している。

神経疾患(脳幹脳卒中、筋萎縮性側索硬化症〔ALS〕など)の患者は、筋肉の麻痺のために発話できなくなることが多い。これまでの研究で、発話を試みる麻痺患者の脳活動を解読して、発話内容を表現できることが明らかになっているが、テキストの生成に限られており、解読の速度、精度、語彙に限界があった。

Francis Willettらは、被験者の脳内に埋め込まれた微小電極のアレイから得た個々のニューロンの神経活動を記録するBCIを開発し、人工ニューラルネットワークを訓練して、被験者による発話の試みを解読できるようにした。この装置を使ったALS患者は、平均で62語/分の速度でコミュニケーションを取ることができた。これは、既存の同種の装置が打ち立てた記録の3.4倍の速さであり、自然な会話の速度(約160語/分)に近づいた。50語の語彙に基づいた発話の場合、このBCIの単語誤り率は9.1%で、従来の最先端の発話BCIが2021年に記録した単語誤り率と比較して約3分の1になった。また、12万5000語の語彙に基づいた発話では、23.8%の単語誤り率を達成した。

一方、Edward Changらは、別の方法を使って脳の活動を記録するBCIを開発した。脳の表面に設置して、言語皮質全体の各部位の数多くの細胞の活動を検出する非穿通性の電極が用いられたのだ。このBCIは、脳の信号を解読して、3種類の出力(テキスト、発話音声、発話するアバター)を同時に生成する。Changらは、深層学習モデルを訓練し、脳幹脳卒中を原因とする重度の麻痺患者が声を出さずに複数の完全文の発話を試みた際の神経データを解読した。その結果、脳信号からテキストへの変換速度は78語/分(中央値)となった。これは、従来の記録の4.3倍の速さであり、自然な会話の速度にさらに近づいた。50フレーズ(句)のセットに基づいた文章を解読する場合の単語誤り率は4.9%で、従来の最先端の発話BCIと比較して5分の1になった。また、1000語以上の語彙に基づいた文章をリアルタイムで解読する場合の単語誤り率は25%で、3万9000語以上の語彙を使用したオフラインシミュレーションでの単語誤り率は28%となった。別の実験では、脳信号を基に、聞き取りの訓練をしていない人でも理解可能な聞き取りやすい合成音声への直接変換が行われた。その際には、脳幹脳卒中を発症する前の被験者一人一人の声に近い合成音声に変換され、529フレーズ(句)のセットに基づく発話での単語誤り率は28%だった。ChangらのBCIは、神経活動を解読して、発話するアバターの顔の動きや非言語的表現も生成した。今回の研究では、安定的で高性能な解読が数カ月にわたって実証された。全体として、このマルチモーダルBCIは、麻痺患者にとって、より自然で、表現力豊かなコミュニケーションの可能性を広げている。

同時掲載のNews & Viewsでは、Nick RamseyとNathan Croneが、これら2つのBCIは「神経科学と神経工学の研究における大きな進歩であり、神経損傷や神経疾患による麻痺の結果として声を失った人々の苦しみを軽減することが大いに期待される」と述べ、この技術を普及させるためにさらなる研究が必要だと指摘している。

doi: 10.1038/s41586-023-06443-4

「Nature 関連誌注目のハイライト」は、ネイチャー広報部門が報道関係者向けに作成したリリースを翻訳したものです。より正確かつ詳細な情報が必要な場合には、必ず原著論文をご覧ください。

「注目のハイライト」記事一覧へ戻る

プライバシーマーク制度