AI分野で知られる東京大の松尾研究室発のベンチャーELYZA(イライザ)は、同社が開発する文章要約AI「ELYZA Digest」のデモプログラムとして、入力したテキストの内容を最大3行に要約するモデルをWebサイト上で公開した。利用は無料で、URLか文章を貼付することで利用できる。
ELYSA Digestは、自然言語処理 (Natural Language Processing)技術を実装した同社の日本語AIエンジン「ELYZA Brain」から、日常やビジネスの場でよく出現する「要約」という問題設定に特化させたAIとして進化させたもの。
同AIの強みとして、ELYZA Brainのもつ大規模言語モデルを利用できるほか、AIによる文章要約の手法として、元の文書にはない表現を使うことができ、より自然な要約を生成できる「生成型」を採用していることが挙げられる。
この生成型要約はインプットされた文章が少々破綻していても対応できる可能性もあり、電話での対話内容の書き起こしを要約することもできる。実際にWebサイトで対話テキストとして公開されているもので、えーなどといった相づちを無視して要約文が生成されていることがわかる。
また、同社のTwitterが2021年7月に投稿したツイートもこの「ELYSA Digest」を用いて文章生成したといい、FacebookのAIに関するブログ(参照)を翻訳し、要約したものとみられる。
モデルのトレーニングでデータを補強するデータ拡張ライブラリ「AugLy」を紹介。4つのモダリティと100以上のオーグメンテーションをサポートするデータ拡張ライブラリ。モデルのロバスト性のギャップを評価したりするために利用できる。https://t.co/mmD7Yg1E1hpic.twitter.com/LmDYjQus0q
— ELYZA, Inc. (@ELYZA_inc)July 13, 2021
同社では、開発背景などをnoteにまとめて公開している。興味のある読者はこちらも参考にしてほしい。
コメント