WWWで使える検索機能

共通科目情報処理(実習)、国際総合学類対象、1997年01月24日

                                       電子・情報工学系
                                       新城 靖
                                       <yas@is.tsukuba.ac.jp>

このページは、次の URL にあります。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/kokusai2-enshu-1996/1997-01-24 /www-search.html
あるいは、次のページから手繰っていくこともできます。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe
http://www.hlla.is.tsukuba.ac.jp/~yas/index-j.html
http://www.ipe.tsukuba.ac.jp/~yshinjo
http://www.ipe.tsukuba.ac.jp

■WWWで使える検索機能

インターネット上にある膨大な情報から、必要な情報を見つけ出すためには、次のような方法があります。

興味のあるページに埋め込まれているリンクを次々と手繰っていく。
特定の分野についてのＦＡＱやリンク集を参照する。
雑誌やテレビなど、一般のメディアに掲載されたＵＲＬを打ち込む。
検索機能を利用する

検索には、大きく分けて次の２種類があります。

キーワードを打ち込んで検索する。AltaVista など。
よく整理されたメニューを次々に選択していく。Yahoo など。

ＷＷＷでは、検索結果は、利用者が直接使っているコンピュータで動いているブラウザに現われます。実際の検索プログラムは、インターネット上の別のコンピュータで動いています。この検索プログラムのことを、検索エンジン (search engine)と呼びます。

日本国内、あるいは、世界中にどのようなサーチエンジンがあるかの一覧が、次のページにあります。

検索を行う時、利用者はキーワードを与えます。検索対象のデータ（今の場合、ＷＷＷページ）にも、キーワードが与えられています。検索とは、利用者から与えられたキーワードを持つ対象データを利用者に返すことです。

検索対象のデータにキーワードを与える方法としては、次の２種類があります。

特定のキーワードを与える。
内容すべてをキーワードと考える（全文検索）。

特定のキーワードを与える場合、キーワードの設定方法には、次のような方法があります。

データ（ＷＷＷページ）を作った人がキーワードを与える
検索エンジンの管理者がキーワードを与える
キーワードを自動抽出する

ＷＷＷ上のページで、キーワードを自動的に抽出する方法として、「インターネット・ロボット」と呼ばれている仕掛けが使われることがあります。インターネット・ロボットは、ＵＲＬが与えられると、そのページを訪れます（そのページの内容を得ます）。ＷＷＷブラウザの場合、得たページを画面に表示しますが、ロボットの場合は画面には表示しません。その代わりに、ロボットは、ページの内容を解析して、キーワードを抽出します。さらに、そのページに含まれている他のＵＲＬを、次々と訪れては、同じようにキーワードを抽出します。そのページにＵＲＬが含まれていたら、またさらにそのページについて、同じ処理を繰り返します。このような繰り返しの方法を、「再帰（recursion）」といいます。こうして、ロボットは、世界中のＷＷＷページを歩き回り、キーワードを抽出していきます。

抽出されたキーワードは、普通、索引（index）作るために使われます。索引というのは、キーワードの検索を高速化するために、 /**/

■NetscapeのAuto Load Images

ＷＷＷの特徴は、テキスト（文字）だけでなく、絵も画面に表示されることです。しかし、絵のデータは、大きいので、回線が遅い時や混雑している時には、絵を表示させると遅くなってしまいます。そんな場合でも快適にＷＷＷを使うために、ブラウザには、絵を表示しない機能があります。

Netscape では、絵の表示は、「Option」メニューの「YHM_Item(Auto Load Images)」という項目で制御できます。この項目が選択されていた場合（チェックされていた場合）、Netscape は、絵（images）を、自動的に（auto）、絵のデータを転送します（load）。ここで絵とは、HTMLの <IMG>タグでしていされたものです。

図1 Netscape の Option メニュー (Auto Load Images)

[Netscape] [HTML] [HTML Ref] [Netscapeしおり] [WWW検索] [WWW/links]
[Mule(1)] [Mule(2)] [Mule/egg] [cwd-home] [file-dir]

↑[国際２班] ←[1月17日] ・[1月24日] →[1月31日] [課題一覧]

Last updated: 1997/01/23 21:55:09

Yasushi Shinjo / <yas@is.tsukuba.ac.jp>