第4部 提言 第1節 要旨  21世紀のボーダーレス・インターネット国際社会における多言語処理・機械 翻訳への新しい要請に応えるため、国家的レベルでかつ国際連携の下に重点的 に取り組むべき課題として、クロスリンガル・インフォーメーションテクノロ ジ (CLINT = Cross Lingual INformation Technology) の研究・開発を提言す る。  CLINTは、21世紀のインターナショナルな社会において、多様な情報アクセ スにおける言語バリアフリーを実現する最も重要なインフラストラクチャであ る。ここでは、特に、アジア言語のCLINTを中心課題として提言する。そして、 欧米言語とのCLINTを関連課題として提言する。 CLINTは、多言語間でのクロ スリンガルな知的情報アクセス (クロスリンガル・インフォーメーションアク セス) の技術であり、Web閲覧、情報案内、情報検索、情報発見、情報抽出、 情報要約、電子図書館、電子政府、e-commerce、e-mail、e-phone、およびそ れらのためのヒューマンインターフェースなどの基礎技術を開拓するものであ る。基礎技術には、各種言語データ、処理方式、システム化を含む。また、こ れらの基礎技術に基づき実際に役立つ各種応用システムを技術の発展の段階に 応じて実用システムとして順次提供していくものである。 第2節 背景と問題点  インターネットの急速な普及により外国語で書かれたWebにアクセスする機 会や異なる言語で情報の送受をする機会が増え、それを支援するための多言語 処理・機械翻訳の需要が従来にもまして高まってきている。インターネット社 会における多言語処理のターニングポイントにおけるこのような急務な要請に 応えるため、および技術的飛躍とサービスの向上・開発を達成するため、国家 的なレベルで国際連携の下にCLINTへ重点的に取り組まなければならない。  北米においては、米国では世界の情報収集という観点などから機械翻訳への 取り組みが行われ、カナダでは二つの公用語に対処する行政的観点などから機 械翻訳への取り組みが行われてきた。そして、インターネットが普及した現在 では、将来のインターネットの機能高度化という観点からも機械翻訳への重点 的な取り組みが行われているように伺える。  欧州においては、欧州連合が12の公用語を持つという事実から、12の言語で の行政サービスという観点などから機械翻訳への取り組みが行われてきた。そ して、現在では、北米と同じく、機械翻訳は将来のインターネットを機能高度 化するための主要事項という認識からの機械翻訳への重点的な取り組みが行わ れているように伺える。  これら北米と欧州は現在の世界の二極を形成しているように思われる。そし て、これらの二極の間では多言語処理・機械翻訳に関して部分的な連携が行わ れつつあるようである。「極」ということばは硬い印象を与えるが、柔らかい ことばでいえば「コミュニティ」と読み替えることもできる。これら二極に加 えて、第三番目の極の候補としてアジアが存在することは種々の情勢から見て 明らかであろう。すなわち、将来は世界三極構造が形成され、これらを中心に 世界的な活動が行われると予想される。その友好的な活動をささえるものの一 つがスムーズなコミュニケーションであり、そのための基盤技術が多言語処理・ 機械翻訳、特にクロスリンガル・インフォーメーションアクセスである。  世界のスムーズなコミュニケーションを可能とさせるためには、極の間での スムーズなコミュニケーションとともに、極の内部でのスムーズなコミュニケー ションが必要である。そこで、日本にとっては、他の二極などとのスムーズな コミュニケーションを確保するとともに、アジアのリーダとしての責務をはた すため、アジア言語の間の機械翻訳すなわちアジア言語のクロスリンガル・イ ンフォーメーションアクセスの技術確立をアジア各国との連携の下に推進する 必要がある。  グローバルスタンダードへの取り組みは昨今の顕著な動向であるように思え る。グローバルスタンダードは、一面では、世界のコミュニケーションをスムー ズにさせる効果があると思われる。また、機器の製造や活用を効率的にする効 果があると思われる。しかし、グローバルスタンダードが一つの方式や考え方 を押し付けるものであるとしたら、世界の友好的な連携の確立・維持を阻害す る危険性もありえるかもしれない。地域・社会・文化などに根ざしたローカル スタンダードからグローバルスタンダードが構築され、またグローバルスタン ダードを地域・社会・文化などに同化させたローカルスタンダードを構築する という考え方が必要かも知れない。  現在は産業・経済・社会の活動が世界的にボーダーレスとなりつつある。文 化や言語を尊重することは、一見これらに関してボーダーに固執するようにみ えるかも知れない。しかし、実際には、クロスリンガル・インフォーメーショ ンアクセスはインターネット上でバーチャルボーダーレスの世界を創立し、こ れが物理的な交流のリアルボーダーレスを円滑に運営させる基となる。同様に、 言語に関しては、異なる言語の間でのコミュニケーションのためのバーチャル バリアフリーを実現し、これは同時にリアルバリアフリーを実現させる。  アジアには長い歴史を持った多彩な文化がある。欧州にも歴史に根ざした多 彩な文化があるが、アジアにおけるその多彩さは欧州の比ではないように思え る。一般に、文化は言語を生み育て、言語は文化の創造に貢献するという側面 がある。したがって、文化を尊重することは言語を尊重することでもあるとい える。多彩な言語を尊重し、異なる言語の間でのコミュニケーションを可能と させる技術の確立は、多彩な文化を持った国・地域が連携を深め、友好的な連 携の極を形成するための必須な技術であるといえる。すなわち、アジア言語の クロスリンガル・インフォーメーションアクセスの技術は、アジア内での連携 のためのインフラであり、国家的な事業として国際連携の下に取り組まなけれ ばならないものであるといえるであろう。  それぞれの文化の尊重が行われなかったため、そして異なる文化の間でのス ムーズで十分なコミュニケーションが行われなかったために生じた紛争のよう なものは歴史的にいくつもみられる。その歴史は現在も作られつつあるように も思える。このような不具合を回避し、世界が友好的に連携してより良き社会 を形成するためには、世界共通語としての英語の流通性を高めることも必要で あろうが、個々の言語を尊重し個々の文化のアイデンティティを明確にしたグ ローバリゼーションのためのクロスリンガル・インフォーメーションアクセス は最も重要なインフラの一つであるといえるであろう。  アジアの言語の研究は、全般的には十分進んでいるとはいえない。日本語、 韓国語、中国語などの研究は活発に行われてきたが、他のアジア言語について はそれぞれの言語の基礎的な研究から始める必要がある。その中でも最も活発 に研究が長年行われてきた日本が音頭を取り、アジア言語全体の研究とアジア 言語間のクロスリンガル処理の研究を支援・推進・まとめていく必要がある。 そして、クロスリンガル・インフォーメーションアクセスの技術を開発してい く必用がある。  韓国や中国では、個別的な国際連携が進められているようである。その連携 は日本以外の国々の間で急速に深まりかつ広がる可能性がある。日本がアジア の一員でいるためには、日本が音頭を取り早急に連携を開始する必要があると も思われる。米国や欧州においても国際連携が推進されているようである。さ らに、欧米においても日本語処理の研究・開発が活発に取り組まれているよう である。もし日本が現状のまま行動を起こさないでいると、アジア内およびア ジアと欧米との間の連携の外におかれる懸念があると思われる。  従来、日本において、機械翻訳に関する国際連携の研究・開発プロジェクト として、通産省から(財)国際情報化協力センター (CICC) に委託されて実施さ れた「近隣諸国間の機械翻訳システムに関する研究協力 (俗称 : CICCプロジェ クト)」がある。これは1987年から8年間に数十億円規模のプロジェクトとして 実施された。日本の機械翻訳技術を移転することを目的として、日本語、中国 語、タイ語、マレーシア語、インドネシア語の五ケ国語の間の双方向の機械翻 訳システムを開発することをめざしたものである。このとき、各国に設置され た機械翻訳システムは通信回線で結ばれ、オンライン翻訳ができることを目指 していた。研究・開発は、CICC内に機械翻訳研究所を設立し、日本の関係企業 が8社参画して進められた。また各国はその受け皿としてそれぞれ研究組織を 設置して研究・開発がすすめられた。この多言語機械翻訳システムの開発には、 通産省の指導による(株)日本電子化辞書研究所で約百四十億円をかけて開発さ れたといわれている電子化辞書も活用された。このCICCプロジェクトは当時と しては大きな成果をあげたが、当初は、日本語文字のJISコードのような文字 コード規格が中国およびタイにないとか、各国の言語の研究があまり進んでい ないとかの理由で、極めて限られたプロトタイプを試作するにとどまった。こ のプロジェクトでは、将来の多言語処理の拡大性を予想し、各国の文字コード を扱うために、5ケ国語を扱うCICCコード体系として、4バイトコードを採用し てシステムを作成した。これにより、いわゆるY2Kのような問題を生じさせな い配慮がされていた。  将来のアジアの社会的連携をコミュニケーション技術の観点から支援するた めに、アジア言語のクロスリンガル・インフォーメーションアクセス技術の研 究・開発は最重要な課題の一つであろう。現在の世界情勢およびアジア情勢は 従来よりも飛躍した密な形での連携が望まれている。アジアの各国語の計算機 処理の研究も活発になりつつあり、これらを日本が支援し、密な連携のもとに 協同研究・開発を行えば、急速に普及するインターネットへのクロスリンガル・ インフォーメーションアクセスのサービスを可能な技術から段階的に提供でき るようになると思われる。  アジアの計算機・インターネットの普及は急速に進もうとしている。アジア における人口が極めて多いという事実からすると、社会的には膨大な要請があ ることを示し、ビジネス的には巨大なマーケットが控えていることになる。こ れらに応えるという観点からも、アジア言語のクロスリンガル・インフォーメー ションアクセスのインフラを国際的な連携の下に整備する必要がある。  アジアでもIT産業が急速に発展しつつある。IT技術の多くが米国から発信さ れ、米国が世界共通語の英語を使っていることなどからすると、CLINTの実現 なくして日本がIT産業の先進的な役割を担うようになることは有り得ないとも 考えられる。特に、アジアとの連携を早急に実現させないと、日本は国際連携 の蚊帳の外におかれる懸念があるとも推測される。 第3節 研究・開発の進め方  研究・開発を効率的・効果的に進め、研究者間の連携を蜜にするため、長期 的な観点に立って日本の適当な地域に「CLINTセンター」のような研究所を設 置し、各国の研究者を招聘して教育も含めて研究・開発を進める必要がある。 教育は大学などとタイアップして実施する必要がある。また、各国の研究機関 とも密な連携ネットワークを構築して研究・開発を進める必用がある。この連 携ネットワークには、世界共通語である英語の処理の研究者、および多言語処 理・機械翻訳および知的情報アクセスなどの最新技術を活用するために、欧米 の研究者も入れる必用がある。  研究の主たる内容は、21世紀に望まれる新しいCLINTの開発である。その中 核的な課題は、多言語処理・機械翻訳である。また、急速な社会の変革により、 現時点では想像もしなかった新しい応用システムへの要請が急にでてくる可能 性もある。このような事態にも対処できるように、さらに、現在の最高の技術 に基づく多言語知的情報アクセスの研究・開発をもCLINTの課題として進める 必要がある。  現在達成されている技術状況からすると、全体の研究・開発は長期的に実施 されることになる。具体的な課題には、多言語処理・機械翻訳に加えて、知的 情報アクセスとしてのWebアクセス、電子商取引、情報検索、情報発見、情報 ナビゲーション、情報抽出、情報要約、e-commerce、e-mail、e-phoneなどが ある。また、それらのための関連課題としてヒューマンインターフェースの研 究・開発がある。これらの中で、それぞれの時点の技術に基づき、実用に供さ れる技術を切り出し、完全ではなくても役に立つシステムを順次開発していく ことになる。Web情報のスキャン、Webの多言語検索、定型的な文書の送受、定 型的な情報案内などは比較的早期に実用化できそうである。  研究課題には、また、各種言語データの構築・整備も含まれなければならな い。テキストコーパス、辞書、文法、および知識ベースなどである。これらの データは電子知識として世界連携の下に万人が共有できるようにする必要があ る。このとき、世界連携をスムーズに実現するために、これらのデータの内容 とその記述様式などを標準化することも必要である。