電極を脳に埋め込み「AIに会話を補助させる」新技術がスゴい

AppBank

話すことができない筋萎縮性側索硬化症(ALS)や脳卒中の患者に、AIを搭載した脳インプラントを使ってコミュニケーションをとる研究が行われました。するとコンピュータを通じて通常の会話のテンポに近いスピードでコミュニケーションをとることができるようになったのです。

*Category:テクノロジー Technology *Source:arsTECHNICA ,nature ,nature ,wired

リアルタイムに近い会話が可能に

スタンフォード大学とカリフォルニア大学サンフランシスコ校(UCSF)の2つチームによって研究された論文がそれぞれネイチャー誌に掲載されました。ブレイン・コンピューター・インターフェイス(BCI)を使い、会話に伴う顔の動きに関連する神経活動を解析し、それを外部デバイスが実行するコマンドに変換します。それぞれ1分間に62語と78語という、これまでの記録より数倍速い速度で意図した会話を解読することができました。これは英語話者の自然な会話速度である1分間におよそ160語よりは遅いですが、リアルタイムの会話を復元するための第一歩を踏み出したと言えるでしょう。

埋込み型と表面アレイ型

スタンフォード大学の研究では、研究者たちはユタ・アレイという、64本の針状の毛を持つヘアブラシのような小さな四角いセンサーを使用するBCIを開発しました。それぞれの針には電極があり、個々のニューロンの活動を収集します。そして脳の活動を解読し、画面上に表示される言葉に変換する人工ニューラルネットワークを訓練します。

研究チームは、このシステムをボランティアのALS患者ベネット(現在68歳)でテストしました。2022年3月、外科医はベネットの大脳皮質(脳の一番外側の層)にこの小さなセンサーを4つ挿入しました。ベネットは4ヶ月間、文章を声に出してソフトウェアを訓練させ、音を出すために行っている唇、顎、舌の動きに関連する明確な神経信号を認識することを学習させました。そこから、単語を構成する音を作り出すのに使われる動作に対応する神経活動を学習し、それらの単語のシーケンスを予測してコンピューター上で文章をつなぎ合わせました。この装置の助けを借りて、ベネットは1分間に平均62語でコミュニケーションができるようになりました。BCIは12万5000語の語彙を持ち、エラー率は23.8%でした。

2つ目の論文では、UCSFの研究者たちは、脳の内部ではなく脳の表面に設置するアレイを使ってBCIを構築しました。紙のように薄い長方形のアレイに253個の電極をちりばめ、音声皮質全体の多くのニューロンの活動を検出します。研究チームは、このアレイをアンという脳卒中患者の脳に設置し、彼女が音を出さずに唇を動かしたときに収集した神経データを解読するために、ディープラーニング・モデルを訓練しました。数週間にわたり、アンは1024語の会話語彙からフレーズを繰り返しました。スタンフォード大学のAIと同様、UCSFチームのアルゴリズムは、単語全体ではなく、音素と呼ばれる言語の最小単位を認識するように訓練されました。最終的に、このソフトはアンが意図した音声を1分間に78語の割合で翻訳することができました。50のフレーズから文章を解読したときのエラー率は4.9%で、39000語以上の語彙を使ったシミュレーションでは単語エラー率は28%と推定されています。

神経外科医のエドワード・チャン氏が率いるUCSFのグループは、以前にも、電極の数が少ない同様の表面アレイを使って、麻痺した男性の意図した音声をスクリーン上のテキストに変換したことがあります。その時の記録は1分間に約15語でした。今回のBCIは、高速であるだけでなく、アンの脳信号をコンピューターによって音声化することで、さらに一歩進んでいます。また研究者たちは、より自然で流暢で、表情豊かな人工音声を具現化するために「デジタルアバター」も作成しました。チャン氏は、最終的には麻痺患者が家族や友人とより個人的な交流ができるようになると考えています。

両グループのアプローチにはトレードオフがある

スタンフォード大学のチームが使用したような埋め込み型電極は、個々のニューロンの活動を記録するため、脳の表面からの記録よりも詳細な情報が得られる傾向があります。しかし、埋め込み型電極は脳内で移動するため、安定性に欠けます。1、2ミリ動いただけでも、記録された活動に変化が生じるため、何年も記録し続けるのは難しいのです。また、時間の経過とともに、電極を埋め込んだ部位の周囲に瘢痕組織が形成され、これも記録の質に影響を与える可能性があります。

一方、表面アレイは、より詳細な脳活動を記録することはできませんが、より広い領域をカバーします。記録される信号は、何千ものニューロンから得られるため、個々のニューロンのスパイクよりも安定しているとのことです。

しかし現在の技術では、一度に安全に脳に設置できる電極の数に限界があります。今後より多くの電極を使えるようになれば、脳内で何が起こっているのかより鮮明にわかるようになるでしょう。

今後の課題

このような機能を備えた埋め込み型デバイスを作るには、まだ技術的なハードルがあります。ひとつは、両グループのエラー率は、日常的に使用するにはまだかなり高いということです。それに比べ、マイクロソフトやグーグルが開発した現在の音声認識システムのエラー率は5%程度です。もうひとつの課題は、デバイスの寿命と信頼性です。実用的なBCIは、何年もの間、常に信号を記録し、毎日の再校正を不要にする必要があります。

これらの新しいBCIは、一般的な会話に比べればまだ遅いですが、既存の拡張代替コミュニケーションシステムよりも高速です。オレゴン健康科学大学の言語聴覚士ベッツ・ピーターズ氏によると「これまでのシステムでは、ユーザーは指や視線を使ってメッセージを入力したり選択したりしなければなりません。会話の流れについていけるようになることは、コミュニケーションに障害のある多くの人々にとって大きなメリットとなり、生活のあらゆる場面に積極的に参加しやすくなるでしょう」と、述べています。さらにBCIは、患者がコンピューターに接続することなく使用できるよう、ワイヤレスである必要もあります。ニューラリンク社、シンクロン社、パラドロミクス社などがワイヤレス・システムの開発に取り組んでいるところです。今後、急速な進歩が見られるかもしれません。


\ 最新記事 /


※収益化について:本サイトに記載されたアフィリエイトリンクを経由して商品の購入などが行われた場合、売り上げの一部が製作者に還元されることがあります。※免責事項:この記事はテクノロジーの動向を紹介するものであり、投資勧誘や法律の助言などではありません。掲載情報によって起きた直接的及び間接的損害に関して、筆者・編集者並びにAppBank 株式会社は責任を負いません。


Source

タイトルとURLをコピーしました