文脈処理に関する技術的な問題点が顕著な言語の例として、アジア言語があげられます。本研究では、そのような問題点が極めて顕著であるタイ語、マレーシア語、および中国語を取り上げ、それらと日本語との間の機械翻訳の研究を進めています。また、比較のため、英語との間の機械翻訳の研究も進めています。
タイ語は、日本語と同じく語と語の間に区切り記号がありません。さらに、タイ語は、文と文の間の区切り記号もありません。語は活用しません。文には、過去とか未来とかの時制情報もありません。また、日本語よりももっと文要素の省略がたくさんあります。したがって、タイ語の計算機処理には高度な文脈処理が不可欠です。
現在までに、タイ語の簡易な文脈文法を構築し、簡単なタイ語文の解析システムを作成しています。また、日本語とタイ語の文における類似性に着目して、 簡単な日本語文をタイ語文に翻訳する機械翻訳システム、 CLINT-J2T 、を作成しています。
また、タイ語システムを一部活用して、簡単な日本語文をマレーシア語文に翻訳する機械翻訳システム、 CLINT-J2M 、も作成しています。
また、新しい方式による、簡単な日本語文をスペイン語文に翻訳する機械翻訳システム、 CLINT-J2S 、も作成しています。
さらに、簡単な日本語文を中国語文に翻訳する機械翻訳システム、 CLINT-J2C 、も作成しています。 同時に、簡単な中国語文を日本語文に翻訳する機械翻訳システム、 CLINT-C2J 、も作成しています。
そして、これらの言語と英語との間の機械翻訳システムも開発しています。
![]() |
![]() |
![]() |
![]() |
![]() | ||||
日タイ機械翻訳 | 日マレー機械翻訳 | 日スペイン機械翻訳 | 日中機械翻訳 | 日英機械翻訳 |