「動画は新しいテキストだ」。台湾テック企業役員が語るAI時代の情報伝達革命とは

インターネットの普及がもたらした｢情報爆発｣。

一人ひとりのユーザーがアクセス可能な情報量は、2000年前後から桁違いに増加していることが総務省の情報通信統計データベースによっても詳らかにされています。情報流通センサス調査結果を2005年度と1995年度とで比較してみると、10年間で原発信情報量は27倍、発信情報量は21倍、選択可能情報量は410倍、消費可能情報量は15倍、消費情報量は13倍に増加したことがわかっています。

このように爆発的に増加した情報の多くはテキストでした。ですが、今ではここに動画情報も増えてきています。

テキストに比べて約5,000倍の情報伝達が可能と言われている動画。効率的なコミュニケーションを図り、娯楽を提供してくれるだけでなく、企業や教育機関でのリスキリング・人材育成・教育指導などにも活用されつつあります。

一方で、動画は情報伝達量が多いだけに、テキストほど自由に検索することがままならず、求めている情報にたどり着くまでに苦労しますよね。

動画情報の洪水の中から、どうやったら必要な情報だけを抽出できるのか。それこそAIにまかせてみませんか？と提案しているのが、台湾のKKCompany Technologiesです。

今春発表されたAI活用技術を融合させたマルチメディア対応プラットフォーム｢BlendVision AiM（ブレンドビションエイム）｣とはどのようなサービスなのか？また台湾のビジネスシーンにおいてAIはどれほど活用されているのでしょうか。

KKCompany Technologies役員の来日に際し、Kevin C.H. Lee氏に詳しくお話を伺いました。

Kevin C.H. Lee（ケビン・リー）

KKCompany Technologies マルチメディアテクノロジー事業グループゼネラルマネージャー。

クラウドエンターテインメント業界で18 年の経験を持つテクノロジーリーダー。Sony Online Entertainment、Silicon Studio、HTC、HUAWEI などの世界的なテクノロジー大手企業に勤務し、持ち前の革新的な考え方と前向きなアプローチにより優れた製品の設計に重要な役割を果たしてきた。2021 年、KKCompany Technologies にマルチメディアテクノロジー事業グループのゼネラルマネージャーとして入社。同社のクラウドベースのAIプラットフォームに多大な貢献を続けている。南カリフォルニア大学でコンピューターサイエンスの修士号、コロンビアビジネススクールでデジタルビジネスの大学院卒業証書を取得。

台湾企業はAI導入に意欲的
生成AIは創造する力を民主化している
情報伝達の手段はテキストから動画へ
コンテンツの海から知識を抽出する技術
法整備は喫緊の課題
AIは自分以上に自分を理解してくれるかもしれない
1. 共有:
2. 関連

台湾企業はAI導入に意欲的

KKCompany Technologies マルチメディアテクノロジー事業グループゼネラルマネージャーのケビン・リー氏

───世界中のビジネスシーンで注目を集めているAIですが、台湾ではどのように受けとめられていますか？

ケビン・リー：台湾にはご存知のとおり多くのパソコンメーカーがいますし、FoxconnのようにApple製品の製造を受託されている電子機器メーカーもいます。AIはそれらの産業にとって、乗り遅れるわけにはいかない新しいトレンドになっていると思いますね。AI PCがパソコンを買い換える理由になるかもしれませんし。

そのAI PCを作るために、サプライチェーンを大幅に見直している企業もいるようです。ある人の会社では、全チームが通常の業務から離れて1ヶ月間AIについてだけ学び、どうやったらAIを使って生産性を高められるかを検討したそうです。

すべての企業がこのようなことをしているわけではないですが、一般的に言ってAIを取り入れようと熱心な人が多いですし、乗り遅れてしまうことに対しての危機感を抱いている人が多いとも感じます。

NVIDIA社CEOのジェンセン・フアン氏がいつも｢あなたの仕事を奪うのはAIではなく、AIを使いこなせる人たちだ｣と言っています。同じように、あなたの会社を潰すのはAIではなく、AIを使いこなせる他社だとも言えるのではないでしょうか。それが本当かどうか明らかになる前に、まずは自分からAIを学んでおこうと考える人は多いですね。

生成AIは創造する力を民主化している

───AIによって社会はどのように変わっていくのでしょうか？

ケビン：何よりもまず、生成AIは人間の創造性に変化をもたらしていると思います。

文章を書くことも、画像や動画を作ることも、あらゆる創造性に関わる活動が生成AIによって簡便になりました。生成AIに話しかけたり、文字を入力したりするだけで、なんでも手軽に作れるようになりましたからね。それはすなわち生成AIが新しいデジタルコンテンツを創造する力を民主化したとも言えるのではないでしょうか。

自己表現は人間の創造性の顕れでもありますから、そういう意味ではAIが自己表現の民主化に貢献しているとも言えます。

文章、あるいは画像を通じて自分を表現したい。または動画を作ってコミュニケーションしたい。これまでにも多くのYouTuberやインフルエンサーが取り組んできたことですが、コンテンツを作るハードルは高めでした。ところが今ではAIが生成してくれますし、それを自分好みに調整していくこともできます。AIはその過程であなたの好みやスタイル、しゃべり方まで学習してくれるので、さらに自己表現しやすくなります。

そのような技術を使って、これからの子どもたちはどんどん新しいものを作り出すことができるようになるでしょうし、それだけコンテンツの量も増えていくでしょう。

情報伝達の手段はテキストから動画へ

ケビン：この世界に存在している膨大な量のデジタルコンテンツを想像してみてください。すでにたくさんの動画がインターネット上にありますが、今後はさらにその10倍、100倍に増えていきます。生成AIの技術によって、それだけ簡単にコンテンツを作れるようになるからです。

今の子どもたちはNetflixやYouTube、Facebookなどで主に動画を見ています。動画のほうが文章や画像よりも興味を引きますからね。教育用の動画もたくさん作られ、視聴されるようになってきています。

たとえば歴史について学びたいとしたら、あなたは動画を見ますか？それとも本を読みますか？多くの人は動画を選択するでしょう。それが習慣化されつつもあります。さらに、動画を視聴するほうが文章を読むのに比べてより多くの情報を覚えられるという知見もあります。

ですから、情報を伝達する手段としての動画は新しいテキストだと言えるのではないでしょうか。

例えば、私たちKKCompanyの顧客でもある台北市教育局は、学級閉鎖に追い込まれたパンデミック時に1年生から12年生（日本の高校3年生に相当）のための自宅学習プラットフォームを構築し、3,000本ほどの学習動画を公開しました。

さらに、｢カエルの性別をどうやって見分けるの？｣などの質問に対して、生徒が動画の中から答えを見つけられるように工夫をしました。答えをネットでググることもできましたが、先生の授業の中からその答えを引き出したほうがソースに直結しますよね。しかも、この動画の何秒から何秒までを見れば答えを理解できるよというふうにハイライト部分を抽出することで、生徒がその動画を丸ごと視聴しなくてもいいように工夫されているんです。

AIのおかげでコンテンツブームが起こっているわけですが、どこかの時点でそのコンテンツの海から知識を抽出する技術が必要となってきます。そこでまたAIを活用するのです。当社のAIプラットフォームはその一例です。

コンテンツの海から知識を抽出する技術

───今年4月にリリースされた｢BlendVision AiM｣ですね。どのようなサービスなのでしょうか。

ケビン：マルチメディア対応のAIプラットフォームです。AIを使って動画ファイルから答えを抽出したり、コンテンツを要約したりすることができます。

企業がBlendVision AiMを活用すれば、まずコンテンツを管理できるようになり、そしてそのコンテンツから必要な情報を抽出できるようになります。チャットボットに依頼すれば、議事録も一瞬で生成してくれます。

動画を含めた情報資産から調べたい内容だけを必要に応じて抽出することができるので、議事録の作成も不要に Image: KKCompany Technologies

リモートワークが定着してオンラインミーティングが増え、会議を録画することが多くなっています。また一方で、リスキリングなど社内研修のために動画を導入する企業も増えていて、社内で共有する情報資産のうち動画が占める割合も確実に増えてきています。

でも動画は情報伝達量が多いだけに、欲しい情報を探し出すのに手間と時間がかかりますね。そこで、タスクに応じて複数のLLM（大規模言語モデル）を使い分けることで効率よく動画の内容を要約したり、見たい部分だけを抽出したり、文字起こししたり、答えを得られるのがBlendVision AiMの強みです。

知りたい内容が含まれている部分をAIが自動的に検出してくれるので、動画を丸ごと見る必要がなくなるという Image: KKCompany Technologies

今年6月には新たに自動タグ付け機能と自動クリッピング機能が追加されました。動画ファイルが投入されると、まずAIが自動的に動画の目的を検知します。これはメディアが作成したニュース番組なのか？それとも部が主催した勉強会の録画なのか？

目的が検知されたら、次にAIがその目的に沿って重要点をハイライトし、｢atomic video｣という最小単位の動画に分割し、タグ付けしていきます。これらは自動で行われますが、人間がパラメータを設定することも可能です。

クリッピングとタグづけが完了すれば、動画の中から好きなトピックを好きな時に呼び出して視聴できるようになります。短時間で学習するマイクロラーニング（bite-sized learning）に適していますし、eコマースにおいて特定の商品に関する情報だけを抽出し、マーケティングに使うショッパブル動画（shoppable video）を簡単に作成することもできるようになります。

法整備は喫緊の課題

───ここまではAIの利便性について伺ってきましたが、今後AIが社会に浸透していくなかで懸念される点はありますか？

ケビン：そうですね、真正性（authenticity）は喫緊の課題になると思っています。

たとえば、だれかが私の声に基づいてAIモデルを作ったとしましょう。私そっくりの声で話すAIが私の母親に電話をかけたら、母には声の主が私ではないことを知るよしもありませんね。

または、私そっくりのデジタル人間が作られて、私に無断で動画に出演させられていたとしたら？肖像権の問題もありますし、出演料は誰に払われるべきなのでしょうか。

このように、人の特徴に関わる真正性───そして所有権も───は大きな争点になりますし、新たな法整備が必要となってきます。スカーレット・ヨハンソン氏の件然り、これはもうすでに争われていることでもありますね。

しかし、ほとんどの場合において、AIは透明な存在として社会のあらゆるところに浸透していくでしょう。いつでも会話の相手になってくれて、寄り添ってくれるAIがいたとして、それはとてもリーズナブルなことだとも思います。

AIは自分以上に自分を理解してくれるかもしれない

───ケビンさんご自身がAIに期待していることは？

ケビン：人間の記憶には限りがありますが、AIは違います。そういう意味で、AIは自分のことを自分よりもよく知っている存在になるかもしれないと思っています。

そのうちデジタルツイン（digital twin＝デジタルな自分の分身）を作れる日も来るでしょう。自分が死んでもデジタルツインを遺していけるかもしれません。そうすればあなたの子どもたちはあなたが死してなお相談することができますし、鮮明に記憶に留めておくこともできますね。生きているうちでさえ、デジタルツインを憧れの旅行地へ派遣して、バーチャルな休暇を楽しむことができるかもしれません。または、自分が2歳だった頃の姿を復元して、自分のよちよち歩きを楽しめるようになるかも。

それと同じように、あなたの曽祖母のデジタルツインを復元することだって可能になるかもしれませんよ。

───ケビンさんは自分のデジタルツインを作ってみたいですか？

ケビン：うーん、わからないですね。やって見る価値はあるかもしれません。まあ、やるとしても顔にフィルターをかけるかもしれないですけれど（笑）。

───デジタルツインがいたら、どんなことを試してみたいですか？

ケビン：話し合ってみたいです。独り言とは違って、自分と自分とが独立している状態で会話を交わしてみたいです。

おそらく、自分と話すことで自分のことをもっと深く理解できるようになるのではないかと思っています。また、自分を客観的な存在として観察することで、ああいう歩き方をするんだとか、あんな表情をするんだなどと、いろいろ学べると思うんです。

自分のデジタルツインと対峙すれば、まったく新しい視点で自分自身について気づきを得ることができるかもしれませんね。

Source: 総務省情報通信統計データベース
Reference: KKCompany Technologies (1, 2), BlendVision, Eurasia Journal of Mathematics, Science and Technology Education
Image: KKCompany Technologies
Photo: 山田ちとら