次の方法で共有


{ End Bracket }

機械翻訳の出現

Vikram Dendi

言葉の壁のないコミュニケーションには歴史家も未来学者も等しく魅力を感じています。SF の大家は想像の羽を広げてバベル フィッシュやユニバーサル翻訳機を創り出し、文字が 3 種類の言語に翻訳されているという伝説のロゼッタ ストーンの存在も歴史に語り継がれています。世の中がますますフラット化していく中で、言語を意識せずに意思疎通できることの重要性はこれまで以上に高まっています。

この問題を解決するために、これまで数十年間、さまざまな方法が取り入れられてきました。機械翻訳 (MT) も数十年前から登場していますが、長年の研究投資のかいなく、いまだ普及には至っていません。1960 年代に、研究者たちは翻訳の目標として一般テキストの FAHQT (Fully Automatic High-Quality Translation: 完全自動高品質翻訳) という略語を提唱しました。その後、この機械翻訳への理想主義的なアプローチは非現実的であることが判明し、時を経て、より的確と思われる略語、FAUT (Fully Automatic Useful Translation: 完全自動の役立つ翻訳) が提起されました。その目標は、翻訳者に対抗することではなく、平均的なユーザーにとって役立つリアルタイム翻訳を提供するための十分に正確なシステムを構築することでした。

マイクロソフトでも、これを目標に 10 年以上にわたって研究が続けられてきました。マイクロソフトの研究グループは、ルールベースのロジックと統計的手法を組み合わせてハイブリッドな統計構文システムを構築する方法を採用しました。相当量の言語情報を利用可能な言語のペア (原文と訳文) の場合、統計的コア エンジンを中心にして処理前後の文法と構文の知識を利用します。十分な情報が存在しない場合には、大量の言語ペアに十分に対応可能な純粋な統計モデルを使用します。

研究グループが開発した機械翻訳テクノロジはマイクロソフトの社内では既にきわめて有用であることが実証され、このテクノロジを利用して 2003 年以降の約 14 万件のサポート技術情報記事が 9 つの主要言語に翻訳されています。社内の他チームもこのテクノロジを利用してコストを削減し、ローカリゼーションの対象範囲を広げています。2005 年には、機械翻訳チームは対象範囲を広げるように求められ、以後、このテクノロジの利用を社外にまで拡大することに重点を置いています。一般的なドメインの翻訳 Web サービスは、検索 (検索結果の翻訳機能)、Microsoft Office (スニペットやドキュメントの翻訳)、Windows Live Messenger (translation bot) などを通じて公開されています (microsofttranslator.com を参照)。

Web の一般的なドメインの翻訳サービスも本格化しています。機械翻訳の真価は、翻訳エンジンが提供する品質と、状況に応じた翻訳の提供方法および品質の問題に対する対処方法によって決まります。検索、ニュース、エンターテイメント、ゲームなどと異なり、翻訳の品質には歴史的な一貫性がないため、これまでのところ翻訳の価値に対する評価は限定的です。製品開発者は機械翻訳の潜在力を高める方法を理解することが重要です。

現在、翻訳サービスの大半はポータルや翻訳サイトで提供されていますが、今後は多様な言語の読者層を対象に基本的な重要情報を提供することが機械翻訳の最大の価値になるでしょう。私たちは、開発者、コミュニティ、およびコンテンツ作成者が翻訳をワークフローに組み込み、コミュニティの力を活用できるようにする手段を提供することが重要だと考えています。

MSDN Translation Wiki はこの原則を実践している好例です。この機能は、コミュニティの翻訳品質向上はもとより、新しいコンテンツの作成にも役立ちます。これはコア テクノロジとコミュニティの力の融合です。

機械翻訳は "不完全な" テクノロジであり、検索結果の評価とは異なって、提供された結果の妥当性をどう判断するかはユーザーしだいです。一方で、検索のように、時には驚くほど正確な結果が得られる場合があり、新しいデータによって継続的に改善されていく余地があります。マイクロソフトは翻訳品質向上のために多大な投資を行っています。

今年は機械翻訳にとって重要な年になるでしょう。ますます広がっていく Web コミュニティの膨大な力を活かして、機械翻訳はその潜在能力を開花させつつあります。今後の数か月間、世界中の異言語間の架け橋となる機械翻訳の画期的な手法に注目してください。

Vikram Dendi は、マイクロソフト翻訳チームのシニア プログラム マネージャです。事業戦略および製品計画に携わり、壁のない Web を構築するための開発者支援に力を注いでいます。彼のブログは viks.org および blogs.msdn.com/translation で公開されています。