2.4 知的な文書処理のための自然言語処理技術 文書処理技術専門委員会 委員長 野村浩郷 (九州工業大学情報工学部教授) 2.4.1 はじめに  インターネットの普及により、文書による各種情報の多様な利用が従来にも 増して重要視されるようになってきた。知りたい情報を、容易な操作で、効率 的に、適切な形で入手したいという要請がとみに高まってきている。このよう な要請に応えるためには、自然言語処理技術の一層の飛躍が望まれるところで あり、特に、知的な文書処理技術の発展が不可欠である。昨今、一部にみられ るIT産業の発展へのブレーキは、利用者からのこれらの要請に対して技術的に 十分に対応できていないことも一つの要因であると思われる。これを解決する 技術は、一言でいえば「知的」な処理技術であり、特に、インターネット利用 という観点からは「知的情報アクセス」という言葉で代表させることができる。  ほぼ半世紀前から、知的な処理技術の研究は行われてきている。しかし、残 念ながら、現在に至っても、達成された技術は、「知的」と呼ぶにはほど遠い といわざるをえない。 まず、第一の問題点は、「知的とは何か」という定量的な定義が行われていな いことである。唯一の定義らしきものは、定性的なものであり、はるか昔に提 案された「チューリングのテスト」と呼ばれているものである。これ以降に提 案された別案は現在でも存在しない。 一面では「知的」という言葉と同意義とも考えることができる「理解」、「意 味」、および「知識」についても同様である。1960年代には、弁別網やミーン ズ・エンド・アナリシスによる「理解」や「問題解決」の方式が提案された。 しかし、これらはあまりにも単純すぎるものであるか、または、あまりにも不 完全なものであったため、役立つものへとの発展はなかった。さらに、1960年 代には、「セマンティックネットワーク」による「意味表現」も提案された。 しかし、これは、説明のための表現形式であり、実際の意味処理には何の貢献 もしないものであった。1970年代中頃には、「概念依存構造」が提案され、概 念プリミティブを要素とする実際の意味処理の試みがなされた。しかし、やは り、「意味」あるいは「概念」の定義にあまりにも安直で不充分なところがあっ たため、その意図した効果を発揮することなしに終わった。同時期には、異な るアプローチとして、エキスパートシステムに代表される「知識工学」も提案 されたが、構築すべき知識の膨大さなどにより、能力の高い知的処理の実現に 貢献するまでには至っていない。 1960年代は、文法理論が初めて形式的にモデル化された時代である。これは、 英語がもついわゆる文構成構造の主要部分が、たまたま形式的モデル化に適し たものであったから生まれたものである。知的あるいは意味に関する部分は深 層構造として観念的に言及されているだけであり、理解のモデルの設定には何 も寄与しないものであった。 第二の問題点は、これらの研究の成果が必ずしも技術の段階的な蓄積とはなっ ていないことである。そこで、1980年代に入り、地に足をつけた研究・技術開 発が進められるようになってきた。自然言語処理の分野では、処理のステップ として、いわゆる形態素解析システムがフリーソフトとして提供されるように なり、また、1990年代の後半に入ると構文解析システムも同様にフリーソフト として提供されるようになった。これらは「意味」や「理解」を直接的に扱う ものではないが、その基本的な処理要素として、実際のシステム開発への取組 みを可能とさせる先導役の役割を果たすようになってきたといってもよい。  知的文書処理の課題は、これらの経験から、大量で詳細な各種「知識」の構 築・整備と、それを使う緻密な「知的な処理方式」の開発にある。このような 研究・開発には長期に渡る重点的かつ精力的な努力が必要である。  一方、限定された対象と目的に対して、結果的に「知的」な処理をしたとみ なされる実用システムの開発も要請が強い。その実現性は高く、特に、インター ネットへのアクセスにおいては、深い「意味処理」を避けて、そこから形式的 に扱える部分を切り出し、簡易で効率的な手法を開拓することも重要になって きている。大量で多種・多様なインターネット情報を、その概略でもよいから、 容易な操作で、効率的に、適切な形で入手するという需要はますます高まって くる。このような観点からの「意味処理」あるいは「意味理解」の技術を実現 可能なところから段階的に適用し、役に立つシステムを実用に提供し、その経 験により機能を段階的に高度化していくというアプローチも重要である。その 具体的な対象としては、情報検索、情報抽出、および情報要約などがあり、さ らに、情報からの新しい発見をするためのテキストマイニングがある。これら にマルチモーダル・クロスリンガルの側面も加えて研究・開発していくことは、 知的な情報技術への一つの着実なアプローチであるといえる。 2.4.2 電子化知識の構築  自然言語処理などに使うための知識を電子化された形で構築しようとした試 みはいくつかある。言語的な知識としては、電子化辞書、電子化シソーラス、 電子化オントロジー、概念定義のための素性、格構造、共起・呼応、および各 種の構文的係り受けなどがある。一般の知識としては、対象依存の概念などか らなるいわゆる知識ベースがある。 電子化知識については、処理の目的を達成できるだけの量が必要となる。そ の反面、量が多くなると、全体の整合性をとることが難しくなる。また、それ を正確にかつ効果的に使うことが難しくなる。しかし、処理に必要な知識なし に高度な処理を実現することは不可能であり、その観点からすると、時間と労 力はかかっても量と質が十分な電子化知識を構築していかなければならない。 現在の自然言語処理では、これらが十分に構築できていない事実を甘受しなけ ればならないとともに、これらを十分に使いこなす技術も確立していないこと を認識しなければならない。  電子化知識の構築は、汎用なものの構築を長期目標とし、対象と応用の範囲 を限定したものの構築を短・中期的目標として実施する必要がある。電子化知 識に対する要求条件は必ずしも明らかではない。また、電子化知識の構成につ いての方法も必ずしも明らかではない。さらに、実際に電子化知識を構築する 方策も示されているわけではない。このような状況下においては、対象と応用 の範囲をかなり限定して、明確な処理内容の要求に応え得る電子化知識を実際 に構築して使ってみる必要がある。それにより経験をフィードバックして、試 行錯誤的になるかもしれないが、電子化知識の内容と構成、および使用法をつ めていく必要がある。 対象と応用の範囲を限定した電子化知識については、昨今のインターネット・ アクセスでの需要が逼迫している。例えば、B-to-CやB-to-Bのe-commerceなど での需要はとても大きく、したがって、部分的にせよそのための電子化知識の 提供は強くせまられている。商品の提供と要求のマッチングや、売買のための 契約締結行為などへ応用できるものへの要請が強い。そのためには、電子化知 識を使った情報検索、情報抽出、情報要約などの技術の確立が必要である。こ のとき、議論の繰り返しになるが、ボーダレスのグローバル社会におけるトレー ドが国際的な行為であることを勘案すると、クロスリンガルな処理が必要であ ることも明白である。また、言語的な処理だけではなく、契約に至るまでのイ ンターネット・アクセスにおいて、利便性を増し効率的な処理を提供するため には、いわゆるマルチモーダルな処理との融合も必要である。 通常の情報検索でも、対象を限定することにより、精度の高い検索の実現が 強く望まれている。また、検索結果を可読性のよい形で提示することも強く望 まれている。大量の多様な情報を整理して提示することも強く望まれている。 これらの要請に応えるためにも、対象と目的を限定して、実用に耐えるシステ ムを実現していく必要がある。 2.4.3 理解の構造のモデル化  電子化知識は、知的処理あるいは意味理解とともに論じられるべきものであ り、それ単独で得失や効果を評価できるものではない。e-commerceにしろ、そ の他のもろもろのインターネット・アクセスにしろ、相手が人間であっても機 械であっても、そもそも人間社会におけるコミュニケーションとは何かを形式 的にモデル化できなければならない。それなしには、機械の上に知的処理とか 意味理解とかを実現する手段は明確にはならない。漠然とした情緒的な形で、 意味とか理解とかを、議論のための議論のように議論することは容易であるが、 これは茶飲み話の暇つぶしにしかならない。  一般にコミュニケーションには目的はないと言われることが多い。もし、そ うであるならば、Elizaをインストールするだけで目的なしのコミュニケーショ ンの目的の大部分は達成されるかも知れない。インターネット・アクセスには、 通常は、目的がある。知りたい情報を入手したいなどである。そのための知的 な自然言語処理の技術としては、その目的を最も経済的に完了する処理方式を 確立することが目的となる。  理解とは何かについての議論は、哲学的、認識論的、および心理学的な側面 などから歴史的に長期間に渡って議論されてきている。それらの詳細はさてお いて、工学的な側面から機械の上に実際にインプリメントするための形式的な モデルは、心理学からでてきたいわゆる記憶の三階層モデルを基本とするもの であると考えられる。記憶の三階層とは、短期記憶、中期記憶、および長期記 憶などの言葉でよく知られている。これを理解の三階層モデルに置き換えて論 ずることが行われている。しかし、これらの議論も、未だ、実際のインプリメ ントに応用されたことはない。  理解は、言語知識と一般知識あるいは専門知識があるだけでは特定されない。 抽象的な対象には触れないことにして、具象的な現象が具体的に生起し、それ に対応している言語現象が処理対象であると仮定しておこう。そのとき、言語 現象が生起したときの具象的な外部状況の知識なしには正確に意味理解はでき ない。あるいは、そのような外部状況の知識がコミュニケーションの参加者に 共有されていなければならない。よくだされる言語表現の例は、I saw a girl on the hill with telescope. である。ここでは、いわゆるPPアタッチメント の係り先の曖昧さにより、この文だけが示されたときには、この文の意味を正 確に理解することはできない。しかし、外部状況の知識が与えられるか、また は共有されているときには、極めて容易に真なる意味を同定できる。すなわち、 正しい意味理解が誰にでもできる。インターネットでの情報アクセスでは、こ のような外部状況の知識を共有できないことが多い点に高度な自然言語処理の 実現の難しさの一因がある。これは、コミュニケーションへの参加者が外部状 況の知識を共有できない他の場合でも同じである。  意味理解に必要なもう一つの困難な問題は、コミュニケーションに参加して いる人のコミュニケーションの意図あるいは心の状態が共有できないことであ る。このような状況は、日常生活のコミュニケーションにおいてもよく見られ る現象である。発話行為として知られている課題はそのような例の一つである。  外部状況の知識や心の状態が共有できない問題点は、インターネットへのア クセスの場合には、それらを相手に十分に知らしめることが面倒であるという ことにも由来している。実際に、インターネットでの情報検索においては、ほ とんどの人は極めて少数のキーワードを示すだけで目的とする情報が入手でき ることを望んでいる。そのときのキーワードの関係も、単純なAND/ORでのみ示 す。これは、現在の情報検索システムがそのような形でしか要求を受付けない ようになっているからでもある。このような方式は、極端な言い方をすると、 1960年代の方式から一歩も進歩していないということもできる。その結果、時 には、数万個にもおよぶURLが検索結果として提示されることも少なくない。 これでは、多くの人が不満を呈するのも甘受しなければならない。  現在のインターネットへのアクセスは、特別な応用を除いて、キーボード入 力により要求を発信するようになっている。これも、インターネットの利便性 を下げている要因の一つである。また、インターネットからの応答も文字を中 心とする形になっていることも利便性を下げている要因の一つである。これら は、近い将来に期待されるいわゆるマルチモーダルなコミュニケーションが実 現されれば、解決される部分もある。  理解の構造のモデル化とインプリメントは、抽象的なモデルや汎用的な機構 によりその実現を追求するのではなく、具体的な応用を対象として、さらに、 処理の目的を明確にして、知識、外部の状況、および心の状態を取り入れて具 現化すべきものであろう。 2.4.4 意味の同定  知的な自然言語処理の基本は、すでに繰り返し述べたように、意味の同定で ある。その意味の同定は、何を持って定義するのかが問題となる。「知的」と いうことの定義が、先に述べたチューリングのテストであるとするならば、例 えば、インターネットのユーザがその応答に「知的」であることを認識したと きである。しかし、インターネットでの株の売買で、インターネットの判断を 信用したために大損をしたという場合には、「知的」な応答であったがどうか の判断基準にすることはできない。それは、インターネットを通じて活用した 応用システムの責任であり、もともと不確定な要素を持つ対象への判断が結果 的に間違っていたとしても、それを機械のせいにすることはできない。しかし、 将来、インターネットが全体として知的な様相を呈することは望まれているこ とであり、このような事態への対処にはジレンマがある。  チューリングのテストは、知的な活動の現象的な側面を述べたものである。 したがって、これを形式的なモデルとして記述しなけれインプリメントはでき ない。自然言語処理の処理過程は、欧米言語に対する伝統的な構文解析が主と なっている。これは、欧米言語が持ついわゆる構文構造の構造的側面の一部が 形式的に記述できるからである。ここ十数年の研究では、それに統計的あるい は確率的な情報を組み込むことにより、構文解析の精度をかなりあげることが できた。しかし、これにより知的な自然言語処理が実現できたと考えている人 は皆無であり、また、近い将来その延長で知的な自然言語処理が実現できると 考えている人もいないであろう。  古くは、論理的な記述により意味の同定を実現しようとした試みがあった。 しかし、これも、意味の記号的な標記により意味構造を表そうとしたものであ り、現実世界との対応が機械的に記号を割り当てることにより行われていたた め、高度な自然言語処理にはむすびつかなかった。記号化は処理の簡潔化およ び厳密化をもたらすが、それは記号の世界での処理の話であり、現実世界での 意味理解の話ではない。もし、この記号化が、チューリングのテストのように、 その応答と結び付けられていたら、必ずしも成功しているとはいいきれないも のの、現在までに試みられてきた自然言語の意味処理の方式と共通するところ が大であったであろう。すなわち、現実世界の現象の処理を記号化により効率 化したものと考えることができるようになる。  いままでに何度も繰り返し述べてきたように、意味の同定の正当性は、その 応答によって評価できる。いや、それしか正当性の評価基準はないといってよ い。換言すると、意味が同定できたかどうか、同じことであるが意味が理解で きたかどうかは、その応答によってのみ判断できる。もちろん、テキストの分 類やデーベースの自動構築など、システム内で行われる処理も応答という行為 に含まれるものと解釈しなければならない。極論すると、チューリングのテス トの観点からは、応答の正当性のみが判定基準である。しかし、その応答の正 当性は、唯一の内容に限定されるものではない。偶然性や特別な意図などによ る曖昧さがある。しからば、それをどのようにして形式化し、インプリメント するのかが最も重要な課題となる。  アナログ図をディスプレイに表示するとき、現在の計算機では、ディジタル 化されて表示される。このとき、ディジタル化が人間の網膜の識別能力を超え て微細化されていると、人間はアナログであるかのように知覚する。これにな らって、意味やその応答の種類の数を十分に多くし、人間があたかもその結果 を人間の応答のように了解できるようにすれば、とりあえず意味の同定ができ たと判断できることが予想される。すなわち、チューリングのテストに合格し たと判断され得る。この考えは、まさしく、人間ディジタル機械論とでもいう べき主張に基づいたものであり、この範囲で実用上問題が生起しない応用はた くさんあると予想される。  では、これらを意味の同定として、どのようにして具体的に形式化し、かつ インプリメントするのかが問題となる。その一つの方法として、パターン化が 考えられる。パターン表現は、自然言語処理に拘わらず、多くの分野で極めて 多く使われている。論理式表現も、概念依存構造表現も、パターン表現の特殊 なものと考えられる。特殊という言葉は、フレームがチューリングマシンであ るのに対して、極論すれば、扱いやすい他のものはそれよりも単純なものであ ることを意味する。フレームはこのパターン表現の一般形であり、日本語の処 理のための言語データとして格フレームという名前で呼ばれ使われてきた。フ レームとは、その言葉の示すとおり枠組みであり、フレームといっただけでは 意味同定の処理や内容については何も言及していないことになる。 格フレームは、単純構造をした文の意味構造を表現するものである。複合構 造をした文については、従属節なども格要素の一つだと定義すると、付加構造 や埋め込み構造にはなるが、複合構造をした文の意味構造をも表現できる。そ の構造表現は、意味的・構文的な依存関係から構成される。意味的な依存関係 は構文的な依存関係と同じである。 格フレームは、チューリングマシンであるため、その格要素や述語に関する いかなる制約をも書き込むことができる。さらに、格フレームには、文の意味 構造を表現するとともに、付加情報として「応答」などに関するいかなる内容 や制約をも書き込むことができる。したがって、極めて煩雑にはなるが、チュー リングのテストに合格できるパターンを用意できることになる。ここに書き込 む内容や制約には、言語知識、一般知識、外部状況、心の状態なども含ませる ことができる。 先に例をあげたように、図形をアナログ的に知覚させるためには、網膜の解 像度のせいぜい数倍の細かさで受容器を用意すればよい。意味理解のためには、 どれくらいの詳細さで格フレームを記述すればよいのであろうか。どれくらい の多様さで応答を用意すればよいのであろうか。それらについては全く想像で きない。極めて詳細なものになり、したがって大量な記述になろうであること は疑う余地のないところである。したがって、前述したように、対象と目的を 小さく限定し、その中で実際に記述してみることが必要である。しかし、この 作業でも気の遠くなるほど労力のかかるものであることは想像にかたくない。 意味の同定は、パターンマッチにより行われる。このときの詳細な処理は、 制約が満たされているかどうかのチェックである。一般に、パターンマッチは 時間のかかる処理である。したがって、詳細に記述された格フレームについて パターンマッチ処理を行うことは、実用上非現実的なものになるかもしれない。 2.4.5 擬似的な知的処理  チューリングのテストが知的処理の根幹であるならば、その実現にはかなり の時間を要するものと思われる。しかも、正攻法で行うそのような試みが全く 行われていない現状では、チューリングのテストに基づく知的処理の実現可能 性についての検証もできない。では、知的処理の実現は、将来とも暗礁に乗り 上げたままであるのだろうか。前述したように、正攻法でインプリメントする のではなくとも、結果的にチューリングのテストにほぼ合格できれば、一見知 的な処理を実現することができる。それが、上に繰り返し述べてきた対象と目 的を限定してシステムを実用化することである。  対象と目的を限定することの応用例としては、情報スキャン、情報検索、情 報抽出、情報要約、情報インデクシング、情報データベース化など自然言語処 理の対象であるほとんどのものを含むほどたくさんある。したがって、チュー リングのテストを念頭に置きながらも、応用システムを最も効果的に作成して 実用に供するという経験が重要となる。  情報スキャンでは、現在多く使われているTf/Idf法などによる重要語の判定 などの定番的な方法に加えて、言語表現の木目の細かい特徴などを使うと、か なりの品質で目的が達成できそうである。ここでは、先に述べた詳細な概念記 述などは必ずしも必要としない。したがって、処理は、非常に軽くなる。ただ し、パターンマッチの処理は、概念記述などの詳細さが増すにつれて、処理時 間が急に大きくなる。  情報検索、情報抽出、情報要約、情報インデクシング、情報データベース化 などの他の応用でも基本的には同様な手法が援用できる。しかし、いずれの応 用でも、当然ことながら、最終的なチェックの責任はユーザにゆだねられる。  擬似的な知的処理を実現するもう一つの方法は、対象に応じた制限言語モデ ルを活用することである。文書の種類に応じて、その書き方には特徴がある。 また、文書の種類に応じて、その書き方に制限を加えても不具合が生じないこ とが多い。マニュアルとか法律などは、もともとそのような点が考慮されて書 かれていると思われるものが少なくない。段落構成のし方、用語の使い方、格 要素を書く順序、文末表現の統一化などにより意味を明確化することなどが実 際に行われている。このような特徴を言語モデルに取り込むことにより、煩雑 な言語知識を用意しなくても結果的に擬似的な知的処理を実現できる場合も多 いと考えられる。また、用語に関しても大量で込み入った形で知識を用意しな くても、表層的な処理で結果的に擬似的な知的処理を実現できるようになると 思われる。  現在の処理で最も信頼のできるものは、言語表現の表層的な処理によるもの である。構文解析が80%程度の精度を達成しているとしても、この程度の精度 では高度な知的処理を実現するにはあまりにも心もとない。形態素解析はもっ と精度がよくなっているが、高度な知的処理では唯一つの間違いが致命的な誤 処理をもたらす危険性もある。処理結果には誤りが含まれているものだという 了解の下に簡易な処理を行い、最終的なチェックはユーザの責任だとしておく ことにより、誤処理による不具合も係争も避けることが許容されることになる。 そして、情報スキャンなどで十分な実用性を発揮することにもなる。 2.4.6 人間の理解能力  最近の遺伝子情報の解読と、遺伝子操作による種の改変には驚くものがある。 危険な考えではあると思われるが、人間の知能の形式的モデル化のめどがつか ないのであるならば、これら遺伝子に拘わる技術とクローン技術などを使い、 生物学的意味理解器を作るなどいうだいそれた考えもSF的に脳裏に浮かぶこと もある。計算論的に機械が自分自身を解明することができないという考えを仮 定すると、人間が人間の知能を解明し尽くすことはできないことになるかもし れない。その中で、人間機械論の立場に立ち、部分機能ではあっても役に立つ 知的な機械を作成し利用しようとする試みには、空を飛ぶ鳥を見て飛行機を開 発するような方法と、空を飛ぶ鳥に乗るというような方法があり得る。後者は 上空では寒くて我慢できないであろうなどから好ましいとは思われないが、伝 書鳩に書簡を運ばせるのはまさしくこの方法の一つである。  機械の知能化を達成しようとするとき、その基準は、何度も述べたように、 チューリングのテスト以外に思いつかない。人間における理解とは、行動的応 答と内部的記憶であるように思われる。前者はチューリングのテストそのもの に関するものであり、後者はチューリングのテストでの応答の元となるもので ある。 応答に肉体的活動が伴うなどいうことには言及しないことにして、理解とい う現象は、先に述べたように、コミュニケーション時における知識、外部の状 況、および心の状態の下で、入力に対して合目的的に反応することであるよう に考えられる。このとき、知識は外部の状況と心の状態の下に例示化 (インス タンティエーション) され、それを入力と同化することにより、理解という現 象が生じると考えられる。意味理解とはこのような現象に他ならず、これらの お膳立ての下では、理解という現象はいわゆる諸情報の計算論的ユニフィケー ションの一つの形態にすぎないことにもなると言えそうである。 人間の理解の能力をこのように考えると、そのモデル化とインプリメンテー ションは比較的実現性をおびてくる。しかし、前述のように、知識、外部の状 況、および心の状態の記述は膨大な量と複雑な構成になると思われるので、対 象と目的をできるだけ小さいものに限定して実際のシステム構築を試みようと 主張するものである。 2.4.7 知見と技術の蓄積と共有  自然言語処理技術の研究・開発では、知見、データ、および技術の蓄積が必 ずしも明確には認識されないという好ましくない事情があるように思えるかも 知れない。鳴り物入りで大規模に推進された研究・開発プロジェクトでさえも、 そのような感じを否定し得ないような側面も感じられるように思われるかも知 れない。その内容は、成果の共有が必ずしもできていないということからでも 説明されるかも知れない。  具体的な例としては、例えば、辞書や構文規則が製品化されていない。それ ぞれの研究者・開発者は自分で他の人々と同じような作業を重複して行わなけ ればならない。その理由が商業上のストラテジーに由来するものであるならば、 このような無駄をなくするために、中立的な機関ないしは公共的な機関でそれ らを開発・管理し、共有の実施を指導するようにしなければならないとも考え られる。  標準化は知見などの共有を実現する一つの手段を確保することでもあり得る。 この標準化についても、それを定め実施する機関を開放的なものにし、構築さ れるものの将来の共有に備えなければならない。各種の知識が膨大な量となる ものと予想される現実に鑑みると、このような施策は強力な指導力の下に実現 されなければならないであろう。  研究・開発されたシステムの評価法が明確になっていないということも、知 見や技術の蓄積を認識させづらくなっている要因であると考えられる。チュー リングのテストが評価の基準であるという観点からは、すべてに適用できる客 観的な評価基準は設定不可能のようにも思える。しかし、対象と目的を限定し たシステムなどについては、かなり有効な評価基準が設定できるとも考えられ る。  当委員会の前身の委員会では、約十年前に、機械翻訳システムについての評 価基準について研究し、実際に評価基準を設定した。その結果は百ページを超 える報告書として出版し、その英語翻訳も出版した。今日、外国では、機械翻 訳評価基準についての議論や国際会議が開催されており、我々のこの報告書の コピー送付の要求がいくつかきている。我々の成果は当時から世界的に高く評 価されていたが、諸外国での関心が高まる時期に十年も先んじていたため、今 日になってはじめてその真価が再評価されるところとなつたものと思われる。 このような伝統を受け継ぎ、通常の自然言語処理および知的な自然言語処理の 評価基準の研究に取り掛かることも検討しなければならないであろう。 2.4.8 むすび  知的な文書処理のための自然言語処理技術という題目について、豊富で詳細 な知識の構築、高度な意味理解のモデル化、および簡易な処理による擬似的な 知的処理方式の実現などについて、思いつくことを散文的に述べた。これらの 説明は、古くからの研究などの蒸し返しに過ぎないとの印象を与えるものであ るかも知れない。しかし、意味とか、理解とか、知識とかの言葉が長年に渡り 安易に使いすぎられて、しかも、その実現がまったく追いついていない現状で は、古い課題をも含めて再検討するのも無意味なことではないであろう。  知的な自然言語処理の技術は、チューリングのテストに直接的に応える形で 実現することが唯一のアプローチであるように思える。そのため、言語知識お よび一般知識を電子化し、処理のためのパターンを構築し、それを使う処理方 式を確立しなければならない。これらの知識は膨大な量となり、かつ複雑な構 成となるので、まず、対象と目的を限定して、その中で知的処理の真なる実現 に挑戦するという戦術をとるべきである。  一方、インターネット時代をむかえ、知りたい情報を、容易な操作で、効率 的に、適切な形で入手するための高度な自然言語処理技術の確立への要請はま すます高まってきている。真に高度な知的な自然言語処理技術の確立までには まだ多くの時間と努力が必要である。しかし、簡易で擬似的な知的処理でも、 現在の社会的要請に部分的に応えられる応用はいくつもある。したがって、こ れらの両方を追求し、段階的に技術の向上を図ることが肝要である。  知的な自然言語処理だけではなく、現在主に研究されている構文解析などの 非知的で形式的な処理についても研究を継続する必要がある。これらは、知的 な処理の中から切り出せる形式的なモデル化が可能なものの処理を効率的に実 行するのに役立つ可能性が大であるからである。