別紙:NTT機械翻訳エンジン「多言語統計翻訳プラットフォーム」開発の背景・経緯

ニュースリリース/グループ会社

従来の自動翻訳では、専門家が翻訳規則を作成する"ルールベース翻訳"が主流でしたが、翻訳規則を作成する作業量が膨大であることやその作成に専門知識が必要であることから、翻訳規則作成のコストが高くなってしまうという問題がありました。これに対し、大量の対訳データ(原文とその訳文の対からなるデータの蓄積)を統計処理し、従来の翻訳規則や翻訳辞書に当たる翻訳の統計モデルを自動学習することで実現コストを低減できる"統計翻訳"が近年注目されており、欧米諸国で商用化され始めています。しかし、統計翻訳では日本語と英語のように構文構造が大きく異なる言語間では高精度な統計翻訳を実現することが難しいという課題がありました。

今回NTTでは世界最高水準の構文解析技術や文法に基づく語順変換技術を活用することで、翻訳精度を劇的に改善し、技術文書等の書き言葉文章に出現するような長文に対しても高品質な翻訳を可能とする統計的機械翻訳技術を考案しました。本サービスはこの統計的機械翻訳技術をベースに開発した高精度機械翻訳エンジン「多言語統計翻訳プラットフォーム」の外国語(英中韓)⇒日本語への翻訳機能を用いて実現しています。また、本プラットフォームでは上記機能に加え、日本語⇒外国語(英中韓)への翻訳機能も有しています。

【図】

図:技術説明図(英語→日本語翻訳の例)