テキストデータの準備必要なし!
グーグル株式会社が7月14日、動画共有サイトである「YouTube」で、動画の音声の日本語を認識し、自動的に字幕として表示することができるようになる機能を導入したことを発表した。聴覚障害をもつ方などにもうれしい機能だ。
これまで投稿した動画に字幕を表示する機能はあったが、事前に投稿者がテキストデータを用意しなければならなかった。しかし、これからはそんな必要はない。今回公開された「自動キャプション機能」で、YouTube側のシステムが自動的にデータを生成できるようになったのだ。字幕を見て視聴したい場合は、動画プレーヤー画面の右下にある「cc」アイコンのメニューから「音声を文字に変換」を選択クリック。これでどんな動画にも字幕が表示される。
完璧とはいかないまでも…かなり画期的!
自動でのキャプション、データ化のため、ヒューマン作業などを経る場合等に比べ、やはりその完成精度に関しては完璧とはいえないようだ。
だが、はっきりとした音声、とくにニュースのアナウンスなどについては、かなり高い精度で自動生成できるという。一方でアニメや時代劇など特有の言い回しがあるもの、音楽が全面に入っているものなどは、少々難しいそうだ。
それでも、字幕があれば助かる人は多いはずだ。たとえば外国語でも音声だけでは理解できなくても、文字としてテキスト字幕があればついていけるという人も多いだろう。先に述べた聴覚障害の方などはもちろんだ。
英語版は2009年11月からすでに提供されている。今回、日本語にも対応したことはうれしいことだ。より幅広いユーザーが楽しめるものとして、今後の精度の向上とともに発展を期待したい。
YouTubeYouTube Japan Blog