NTT DATA

DATA INSIGHT

NTT DATAの「知見」と「先見」を社会へ届けるメディア

キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
2022.3.25

リアルタイム文字認識技術

スポーツ番組で、私たちのリアルタイム文字認識技術が採用されました。
画面に映った選手名(英字)をAIで自動認識して選手名(カタカナ)に変換して上書きすることをリアルタイムで行う技術です。
まだサービス化していない私たちの技術が実用化されたことは、私たちにとっても大変貴重な機会となりました。

リアルタイム文字認識技術

スポーツ番組で、私たちのリアルタイム文字認識技術が採用されました。
外国人選手が映った際に選手名(英字)がテロップで表示されるとき、その選手名(英字)をAIで自動認識して選手名(カタカナ)に変換して上書きすることをリアルタイムで行う技術です。
テロップとして出す内容(カタカナ名称)とタイミングが事前に分かるケースでは従来通り人手で行えますが、国際映像のように事前にタイミングが分からないケースでもAIを用いることで実現できるようになりました。

選手名(カタカナ)の上書きに要する時間は1秒以内ではありますが、視聴者からみればまだ若干のタイムラグがあると思われることは否めません。
処理時間の内訳として、AIで文字を認識すること自体は瞬時に行えているのですが、AIによる誤検知や誤認識を誤報にしないためのチェック処理も加味すると、今回はこのような処理速度となりました。(もちろん、AI活用による誤報はありませんでした。)
なお、表示される可能性のある文字列候補や表示されるエリアが事前に精度高く分かるケースであれば、誤報チェック処理を簡素にすることで全体の処理速度を大幅に向上させることができると考えています。

今回はまだサービス化していない私たちの技術を用いて協力させていただきました。
ご相談いただいてから放映までの期間が短かったのですが、実用レベルまで高めることができたこと、私たちの技術が実用化されたことは、私たちにとっても大変貴重な機会となりました。
映像に関するAI活用でお悩みがございましたら、是非ご相談ください。

MediaSearch+サービストップはこちら:
https://www.nttdata.com/jp/ja/lineup/mediasearch/

お問い合わせ