先日はピンマイクを使ってiPhoneで電話したり、相手の声をPCで録音したりしてみた。そこで思ったのだが、この仕組みを使えばスマホで鳴っている音声を、自動で文字起こしできるのではないだろうか?
……この記事を書いている時点で、東京都でまん延防止等重点措置が解除されてから40日が過ぎた。
私が勤めている新宿にある中小企業では現在、各スタッフが可能な範囲でリモートによる業務を行っている。その中で、今回はスマホの音声出力を、PCのライン入力に繋ぐなどして、いろいろな音声を文字起こししてみた。
4月26日(火):YouTubeで記者発表会、これも文字起こしできるか?
今日は午後から行われる記者発表会を観ることに。このご時世のためYouTubeでのライブ配信が行われていたので、現地に行かずに、自宅からアクセスすることにした。
このようにスマホのYouTubeで再生されている動画の音声も、「Texta」なら自動で文字起こしができる。昨日と同じように、iPhoneのライン出力とPCのライン入力をケーブルで接続。あとは、iPhoneでYouTubeの動画を再生すれば、それが「Texta」で認識されるという仕組みだ。
そのまま、記者会見の様子をPCの画面で観ようとすると、スマホとPCで二重に音声が再生されてしまった。慌てて、PCのサウンド設定で「このデバイスを聴く」をオフに。これなら、スマホで再生しているYouTubeの音声を文字起こしさせながら、動画はPCの大画面で観ることができる。
4月27日(水):文字起こしの精度は、ソースとなる音声で変わる
今日は朝から取材があったので外出することに。久々にテープレコーダーで会話の様子を録音して、その後は速やかに帰宅。録音データを文字に起こすために、「Texta」を使ってみることにした。
テープレコーダーの録音データを「Texta」に認識させるためには、iPhoneで再生させる必要がある。そこで、iTunesを使って、音声データをiPhoneに転送。「ミュージック」アプリで再生させたところ、その音声を「Texta」で文字起こしできた。
ただ、テープレコーダーの録音データは、電話やYouTube配信ほどクリアではないためか、一部の単語などが正しく変換されなかった。荒起こしのたたき台として使えないこともないが……。やはり「Texta」を利用するなら、ビデオ会議などPCで鳴っている音を、リアルタイムで変換するのがよさそうだ。