AI技術の発達によって、入力した文字列から画像を生成したり、写真を自然に修正したり、顔を認識して個人を特定したりといったことが可能になりました。こうしたAI技術は音声編集にも応用されており、声質をAIによって変化させるボイスチェンジャーが登場しています。「Koe Recast」はAIによるリアルタイムの声質変換を目指すソフトウェアで、ブラウザで簡単に使えるデモ版が無償で公開されているので、実際に使ってみました。
Koe Recast – Recast
https://koe.ai/recast/
Koe Recastのオンラインデモは無料で公開されており、上記ページからアクセスできます。あくまでもデモ版なのでリアルタイムでのボイスチェンジはできませんが、Koe Recastでは自前で用意した5~20秒以内の音声、あるいはリアルタイムで録音した音声を10種類の声質に変換することができます。
今回はその場で録音した音声を使うため、マイクアイコンをクリック。なお、自前の音声を変換する場合は「Select file」をクリックして、変換したい音声をアップロードしてください。
波形モニターが表示されます。左下の●アイコンをクリックすると、最大20秒まで録音が可能です。
録音を止める場合は■アイコンをクリック。
録音が終わると、録音した音声の波形がモニターに表示されます。声質はASMR・David・Evan・Faith・Hannah・Julia・Karesu・Lisa・Marcus・Rubyの10種類から選択可能。声質を選択し、「Submit」をクリックします。
「Done!」と表示されたら変換終了。モニターの波形も変化しています。モニター左下の「Play」をクリックすると、変換した音声を聞くことができます。
実際に声を10種類の声質に変換するとどうなるのかは以下のムービーを見るとわかります。
ブラウザから簡単に10種類の声質に変換できるボイチェンアプリ「Koe Recast」を使ってみた – YouTube
[embedded content]
右下のダウンロードアイコンをクリックすると、MP3形式で変換した音声をダウンロードすることができます。
また、右下のループアイコンをクリックすると、変換した音声をオリジナルの録音に戻すことができます。
Koe Recastは将来的にWindows向けデスクトップアプリがリリースされる予定とのこと。記事作成時点で、アルファ版が登録ユーザーにのみ公開されています。
この記事のタイトルとURLをコピーする