Googleが協力する「AIを使った動物とのコミュニケーション」を実現させる試みが進行中

GIGAZINE



近年はAIを利用した画像生成や高性能なチャットが注目を集めていますが、AIは芸術だけでなくさまざまな科学的研究にとっても役に立つ可能性を秘めています。新たに、GoogleのクラウドサービスであるGoogle Cloudが、機械学習を用いて動物とのコミュニケーションを実現しようとする非営利団体・Earth Species Projectの取り組みについてブログで紹介しました。

Can generative AI lead people to understand animals? | Google Cloud Blog
https://cloud.google.com/blog/transform/can-generative-ai-help-humans-understand-animals-earth-species-project-conservation


近年はAIを用いて動物の鳴き声を分析する研究が注目を浴びており、クジラの歌を解析して会話を試みるプロジェクト「CETI(Cetacean Translation Initiative:クジラ目翻訳イニシアチブ)」が海洋学者やAI研究者によって進められているほか、鳥の鳴き声を録音してAIで鳥の種類を識別するアプリも登場しています。

Earth Species Projectは2018年、機械学習を用いて地球に生息するさまざまな動物をよりよく理解し、コミュニケーションを取ることを目的に設立された非営利団体です。Earth Species Projectの共同創設者であるAza Raskin氏は、「人間である私たちの理解力は、物事を知覚する能力によって制限されています。AIがすることは、私たちが知覚できる範囲を広げることです」と述べています。

「本当に人間以外の動物も言語的なコミュニケーションを取っているのか?」という疑問もあるかもしれませんが、鳥の歌は世代を超えて伝承されており新たに生まれた歌が3000kmもの距離を伝わって流行することなども知られているほか、シジュウカラは単語や文法を持つ言語を操るという研究結果も報告されています。また、チンパンジーの膨大な鳴き声を解析した研究では、12種類の異なる鳴き声を組み合わせて390通りの構文を作っていることも示されました。

チンパンジーが390もの構文を使って会話をしていることが鳴き声5000回の録音から示唆される – GIGAZINE


Raskin氏は、鳴き声でコミュニケーションを取るクジラやイルカは3400万年にわたり文化や歌を伝えてきた可能性があり、人間はそこから学ぶことができるかもしれないと考えています。Earth Species Projectは動物とのコミュニケーションを実現するため、LaMDAのような大規模言語モデルを研究に利用する取り組みを進めているとのこと。

同じ翻訳システムの構築であっても、人間の言語と動物の言語では大きな違いがあります。それは、人間の場合はそれぞれ異なる言語を使う人同士で「この言葉が何を意味しているのか」という共通理解を構築して翻訳を進めることができますが、動物の言語は人間側と動物側で共通理解を構築することが困難だという点です。しかし、数十年にわたり蓄積されてきた動物の鳴き声についての研究結果と、AIの優れたパターン認識能力を利用することで、動物の鳴き声を解読することが可能になるとのこと。

Earth Species Projectは、生成AIの基礎にもなっている自然言語モデルの「機械学習によって言葉の意味的関係を幾何学的関係に変換することができ、言葉を概念間の関係として定義づけることができる」という点に着想を得ています。

たとえば、「DOG(犬)」という単語は「Man(人)」「Cat(猫)」「Wolf(オオカミ)」「Fur(毛皮)」「Yelp(ほえる)」といった単語と関連付けられており、単語間の関係を視覚的なマップとして示すことができます。


この単語間の関係パターンは異なる言語間でも類似性があり、spanish(スペイン語)であろうとenglish(英語)であろうとjapanese(日本語)であろうと、「犬」という単語はマップ上のほぼ同じ場所に表示されるそうです。Raskin氏は、「AIの仕組みについて1つだけ心に留めておいた方がいいことと言えば、それは『意味的な関係を幾何学的な関係に変える』ということです。これが核となる概念です」と述べています。


記事作成時点でEarth Species Projectは、世界中の科学者や研究者と協力してクジラ・アザラシ・イルカ・カラスなど、多くの動物種のデータを含むベンチマークと基礎モデルの作成に取り組んでいます。また、パートナーの動物研究所と協力して初期の動物とのコミュニケーション実験も行っているとのことで、既に史上初となる動物の発声に関するベンチマーク「BEANS」や、動物の鳴き声のエンコーダーであるAVESなどを開発しています。

Earth Species ProjectのCEOを務めるKatie Zacarian氏は、「この研究分野を前進させるにはパートナーシップが必要不可欠です。私たちは40人以上の生物学者や研究機関と協力してデータを収集します」「データをパートナーや私たちにとって有益なものに変え、ベンチマークに追加することで、私たちや他の人々がアルゴリズムがよりよくなっているのかを知ることができます」「数十年にもわたる研究の上に築かれたパートナーの貢献は極めて重要です」と述べています。Google Cloudは機械学習強化に用いるコンピューティングリソースを提供してEarth Species Projectをサポートしているほか、Googleの音声言語モデリングチームもEarth Species Projectと対話を行っているそうです。

Raskin氏は、12カ月~36カ月以内に生成AIによる音声を用いて、動物とコミュニケーションを取ることが可能になると推測しています。AIはパターン認識によって動物の鳴き声に応答できるため、人間には何を言っているのか理解できない状態で動物とAIのコミュニケーションが成立する可能性もあるとのこと。

その一方で、Earth Species ProjectはAIと動物のコミュニケーションが倫理的な懸念を生じさせることも認識しており、責任あるAIの使用についてさまざまな研究者と話し合っています。たとえば、動物に対して有害なメッセージをAIが伝えてしまい、それが動物たちの文化や生活に悪影響を与えるリスクがあります。そのため、Earth Species Projectの取り組みの多くは、データ収集と基礎モデルの構築に向けられてきたとGoogle Cloudは述べています。

Raskin氏は動物とのコミュニケーションを実現する意義について、「視点を変えて新たな方法で自分自身を見ることで、自分と相手、周囲の世界との関係などのすべてが変わる瞬間があると思います。その瞬間が、ムーブメントを起こすのです」とコメントしました。


この記事のタイトルとURLをコピーする

Source

タイトルとURLをコピーしました