※この記事は『インターネットマガジン2005年8月号』(2005年?月??日発売)に掲載されたものです。文中に出てくる社名、サービス名、その他の情報は当時のものです。

[INTERVIEW]
編World Wide Web Consortiumディレクター
ティム・バーナーズ-リー

現在、多くの一般家庭においても、インターネットはさまざまな情報の収集や伝達の手段として利用されている。その中でもウェブは、メールとともにインターネットが提供する機能の中心的存在になった。すでに様々な機能が盛り込まれ、多くのことがウェブ上で実現されてきたが、果たしてこの先にもさらなる進化の余地はあるのだろうか。ウェブの概念を生み出し、「ウェブの父」としてWorld Wide Web Consortium (W3C)での活動をはじめ、ウェブ技術の発展と進化に貢献してきたティム・バーナーズ-リー氏。同氏が、理想的なウェブの姿としてその実現に取り組んでいる「セマンティックWeb」の今について伺った。

聞き手:本誌編集長
Photo:渡 徳博


ウェブの理想形はコラボレイティブであること

―― ウェブの基盤となったプロジェクトを最初に発表されたとき、その目的は、「グループによる作業環境の実現」と「情報公開の場の実現」の2つであるとされていました。そして現在、情報公開のほうは非常に発展したけれども、作業環境のほうは十分ではないとおっしゃっています。これはどういう意味でしょうか。

私が最初にウェブを提案したとき、複数の人間が協調して作業をする際に活用するものと考えていました。それは、単に公開されている情報を読むだけではなく自らも作り出せるようなもので、コラボレーションを実現するにはそれが必要です。

現在、皆さんが利用しているウェブというものは、読むことができても書き込むことはできません。やはり、人々はコミュニティーの一部として自らも参加したいとか、表現したいといった気持ちを持っていると思います。今注目されているブログやWiKiなどは、そんな要求に対応するために出てきたものだと思います。

私が理想とするウェブブラウザーは、ウェブをクリエイトできるものです。しかし、多くの理由があってそれは実現されてきませんでした。ページ全体の編集が自由にできてしまうというのは、多くのコントロールを与えすぎるということになってしまうからです。

たとえば、紙の雑誌を作る場合と同じようなものだと考えてみてください。著者や編集者が、記事のテキスト部分を書きます。そして他の誰かが、スタイルシートの部分を提供して、色をどうするだとか、脚注の部分をどうするだとかを決めますよね。そうやって、複数の人間が関わって作られていくものです。ところが、ある1人がすべてをコントロールできるようになってしまうと、それはやりすぎということになってしまいます。

ブログの場合も、ユーザーはメールと同じように基本的にはテキストの部分だけを書きます。書いたテキストは、マシン(機械)がオーガナイズ(組織化)してくれます。

セマンティックWebは波のように少しずつ浸透していく

――セマンティックWebの取り組みは、どのくらい進んでいるのでしょうか。

この図(下図を参照)は、セマンティックWebの進捗状況を表しています。縦軸は、言語の特性を表していて、下はシンプルな言語で、上にいくほどパワフルで表現力に富んだ言語になります。横軸は、その言語の位置づけを表します。一番左が研究段階。次が、ウェブ技術や標準化されてはいないが、実用的なもの。次が、ウェブの標準技術となったもの。一番右が、業界などで実際に広く利用されるようになるという段階です。

図の左下から右上にかけて進んでいくわけですが、1998年の段階では青い部分まで、2003年は次の線まで進み、現在はさらに進んでいます。KIFは標準ではないけれども、広く使われました。XMLは広範囲に使われています。OWLは標準化されて、queryについてはすでに標準化が進んでおり、rulesについてもワークショップでの検討を経て、次の段階に進みつつあります。セマンティックWebは、波のように少しずつ浸透していくことになります。


The Semantic Web Wave(バーナーズ-リー氏が、2003年に行った講演「Webs of documents, data and people」の資料より)

いまのウェブでは欲しいデータは裏に隠れていて取り出せない

――セマンティックWebが実現できたときに、ユーザーや社会にどういった利便性をもたらしてくれるのでしょうか。

現在のウェブが持っている利便性と似たようなものだと思います。では、逆に質問しますが、現在のウェブの利便性というのは何でしょうか? たとえば、病気のことを調べることができるとか、ニュースが読めるといったこともそうですが、もっと一般的なことでいえば、人々が、自分にとって退屈な部分はやらずに興味のあることだけに集中できるという点ではないでしょうか。そういう意味で、非常に有用なものです。今のウェブは、そういう存在であると思います。

今はウェブの中にデータが集積しているだけの状態で、非常に扱いにくい形になっていますよね。Excelのようなスプレッドシートに簡単に移すこともできなければ、データベースの中でうまく扱うこともできません。常に、ドキュメントに応じてインターフェイスを用意する必要があります。セマンティックWebによってそれらが改善され、扱いやすくなります。

――それは、データが体系的に利用できるようになるということでしょうか。

そうですね。たとえば、国や会社を運営しているのであれば、毎日のように意思決定をする必要があります。それには、正確な情報や知識をベースにする必要があります。ところが現在、国や会社、官庁といったいろいろな組織があるわけですが、それぞれが様々なソフトウェアのシステムを使っています。欲しいデータは、その裏に隠れていて、なかなか取り出せないという状況です。今後はこういった課題も改善されていくでしょう。

情報に意味を与えるオントロジー

――サーチエンジン技術を使って、ウェブページの内容に関連した商品の広告を表示するという広告が注目されています。しかし、たとえばワインについて書かれたウェブサイトに、チーズの広告を出したいというニーズがあっても、ワインで検索するとワインについてのページしか表示されず、なかなか難しいとされています。

そういった今の検索システムでは不可能なことが、セマンティックWebの実現で可能になるという理解は正しいでしょうか。つまり、ページと意味がより組織化されるということです。

その広告の例の答えになるのかは分かりませんが、スタンフォード大学のデボラ氏という方がオントロジーについて研究しています。ワインとチーズの関係のようなものを定義付ける方法については、彼女がすでに実現しています。

たとえば、フライトを予約するようなプログラムがあるとすると、それにレンタカーが関連してくるとか、レストランが出てくるとか、それから延長してワインやチーズに結びつけるということも考えられます。

―― オントロジーや人工知能(AI)というのは、コンピューターで処理するには非常に難しいテーマだといわれています。過去にもAIは成功してきたとはいえません。セマンティックWebでのオントロジーの取り組みは、成功する可能性が高いといえるのでしょうか。

AIというものは非常に複雑なのですが、オントロジーはそれと比べるとシンプルです。オントロジーというのは定義付けです。人々にとっても扱うことはそれほど難しいものではありませんし、コンピューターにとっても同じです。

AIは、コンピューターが人間のように機能するというのが、一般的に人々が想像するものでしょう。それは非常に巨大な研究ですが、セマンティックWebはそういった研究の成功を待っているというわけではありません。セマンティックWebは、非常に実践的な試みなのです。

AIとセマンティックWebの違いですが、AIが世界をすべて記述しようとしたのに対して、セマンティックWebはボトムアップの動きであるという点です。つまり、自分たちのページに必要なオントロジーやRDFといったメタデータだけを書いて、すでに他で用意されているものがあればそれを使うというものです。

全体を記述するのではなく、自分のところだけをやり、ウェブというリンクできる世界を使って、お互いの知識を結びつけようということです。

――セマンティックWebは、実現までには膨大な作業量が必要になりますよね。

それでも、すでにここまで実現してきました(前掲の図を示しながら)。熱意を持った人々が数多くいます。ビジョンを持って取り組んでおり、ゴールも見えてきているので、関わっている人々はみな興奮しています。

―― それでは、われわれのような一般ユーザーがセマンティックWebの恩恵を受けられるようになるには、あとどれくらいの時間が必要なのでしょうか。

(一瞬考え込んで)それはよい質問(Well-Formed)とはいえませんね(笑)。セマンティックWebは、レモネードのようなものではありませんから、あとどれくらいの時間でできあがるのかという質問には答えにくいですね。セマンティックWebの恩恵や効果のようなものは、いろいろな形で出てくるものだと思います。ユーザーが特に気がつくこともなく、アプリケーションの中で実際に使われてくるということもあるでしょう。カレンダーとか財務情報とかです。もちろん、直接的に利用する人も出てくるでしょう。ただし、指数関数的にある時点から急激に普及していくことになると思います。

RSSはノーティフィケーションとして活用される

――現在、ブログの登場もあって、RSSが注目されています。RSSをどのように捉えていますか。

現在のRSSは、主にニュースの伝播といったことに利用されています。RSSのバージョン2.0はRDF互換ではないといった細かいこともありますが、セマンティックWebとの関係でいえば、RSSはデータのノーティフィケーション(通知)として活用されていくでしょう。

現在のところ、情報の伝播というものは人々の書いたものだけに限られていますが、将来もっとパワフルになってくると、イベント情報や天気情報、株価情報など、そういった変化のある情報を通知する手段として、非常に大量のデータがRSSによって伝播されるようになるでしょう。

――ありがとうございました。

ティム・バーナーズ-リー(Timothy John Berners-Lee)

1955年6月8日生まれ。CERN(ヨーロッパ素粒子物理学研究所・ジュネーブ)にて、WWWの概念の基礎となるEnquireを開発。URL、HTTP、HTMLの最初の設計は彼によるものである。現在はW3Cディレクターとして、次世代のウェブ技術「セマンティックWeb」の標準化に取り組んでいる。