AIが気象ニュース原稿を自動作成
株式会社NTTデータは27日、人工知能(AI)を用い、アナウンサーが読み上げるための気象ニュース原稿を、気象電文データから自動生成する実証実験の実施結果を公開した。2016年9月から4カ月間にわたって行われた実験で、概ね正しい内容の文書を作成できることが確認されている。
昨今はAIブームともいえる状況で、ディープラーニング技術を画像や音声の認識・自動生成に適用する事例が増加している。しかし、ビジネスにおいて機能する水準の文書を自動生成することはまだ難しいとみられており、今回の実証実験はこれにあえて挑んだものとなっている。
実験においてNTTデータでは、気象庁が過去に公開した気象電文と、過去にアナウンサーが読んだ気象ニュース原稿をセットにして機械学習させる仕組みを構築、過去4年分の蓄積データから原稿生成におけるルールを、AIにディープラーニングで学ばせた。
また、NTTグループのAI「corevo」の有する高精度な日本語解析技術を組み合わせることで、より自然な日本語テキストを生成できるようにもした。こうして、新たな気象庁からの気象電文を読み込ませると、学習結果をもとに、気象ニュース原稿を一から自動生成するAIが作成されている。
わずかな修正のみで使える原稿の作成が高速かつ大量に可能
NTTデータによると、実験で自動生成された気象ニュース原稿について、「日本語文法の正しさ」と「意味の正しさ」で評価・検討を行ったところ、それぞれ同社独自の採点基準で、「日本語文法の正しさ」は4点満点中3.86点、「意味の正しさ」は4点満点中3.07点になったという。
この結果は、およそ人が読んで違和感のないレベルにある原稿が作成でき、AIの自動生成で完成したニュース原稿をわずかに修正しさえすれば、もとの気象電文と矛盾しない正確な内容となることが確認されたといえるものだ。
ディープラーニング技術を用いれば、開発者が個別の処理方法をシステムとして設計・開発することなく、膨大な学習のための蓄積データを利用して規則性を学習、原稿を自動生成できるようになる。今回は気象領域で実験されたが、データ種類を変更すれば、企業の決算発表やスポーツ記事などを作成する“AI記者”を誕生させることも、低コストで可能になるとみられている。
“AI記者”は、休むことなく、入力データから記事を高速かつ大量に自動生成することができる。とくに速報性が求められるスポーツや災害情報などの領域におけるリアルタイム記事配信、人手を割くことが難しいような地方のニュース記事配信などでは、大いに活躍する可能性が高い。
米国メディア業界では、すでに2014年からニュース記事の自動生成技術を実用化、商用利用する動きも出てきている。こちらは、あらかじめ人間が設計・用意したテンプレートに、単語や数値を埋め込み、記事化する方式となっているケースが多いが、今回のNTTデータによる実証実験で用いられたディープラーニング技術活用の方式は、柔軟に複数分野へと適用可能で、本格的な“AI記者”誕生へと大きな一歩を踏み出したものになっている。
NTTデータでは今後、さらに正確でなめらかな文章を自動生成できるよう開発を進め、気象分野におけるニュース原稿自動生成AIの商用化を目指すとともに、大量のデータを用いるその他分野においても実証実験を実施、“AI記者”の本格展開を実現させていきたいとした。
(画像はプレスリリースより)

株式会社NTTデータ ニュースリリース(プレスリリース)
http://www.nttdata.com/jp/ja/news/release/2017/012702.html