文脈情報に基づく機械翻訳の研究

野村浩郷 CLINT H. Nomura

Cross Lingual INformation Translator


国際化時代に加えてインターネットの普及により機械翻訳は不可欠なものとなってきています。しかし、現在の自然言語処理の技術では高度な機械翻訳は達成されていません。そこで、この研究では、文脈情報を用いる高度な翻訳処理方式の研究を進めています。

文脈処理に関する技術的な問題点が顕著な言語の例として、アジア言語があげられます。本研究では、そのような問題点が極めて顕著であるタイ語、マレーシア語、および中国語を取り上げ、それらと日本語との間の機械翻訳の研究を進めています。また、比較のため、英語との間の機械翻訳の研究も進めています。

タイ語は、日本語と同じく語と語の間に区切り記号がありません。さらに、タイ語は、文と文の間の区切り記号もありません。語は活用しません。文には、過去とか未来とかの時制情報もありません。また、日本語よりももっと文要素の省略がたくさんあります。したがって、タイ語の計算機処理には高度な文脈処理が不可欠です。

現在までに、タイ語の簡易な文脈文法を構築し、簡単なタイ語文の解析システムを作成しています。また、日本語とタイ語の文における類似性に着目して、 簡単な日本語文をタイ語文に翻訳する機械翻訳システム、 CLINT-J2T 、を作成しています。

また、タイ語システムを一部活用して、簡単な日本語文をマレーシア語文に翻訳する機械翻訳システム、 CLINT-J2M 、も作成しています。

また、新しい方式による、簡単な日本語文をスペイン語文に翻訳する機械翻訳システム、 CLINT-J2S 、も作成しています。

さらに、簡単な日本語文を中国語文に翻訳する機械翻訳システム、 CLINT-J2C 、も作成しています。 同時に、簡単な中国語文を日本語文に翻訳する機械翻訳システム、 CLINT-C2J 、も作成しています。

そして、これらの言語と英語との間の機械翻訳システムも開発しています。


                
 日タイ機械翻訳    日マレー機械翻訳   日スペイン機械翻訳   日中機械翻訳   日英機械翻訳

ホームページへ