共通科目情報処理(実習)、国際総合学類対象、1997年01月24日 電子・情報工学系 新城 靖 <yas@is.tsukuba.ac.jp>
このページは、次の URL にあります。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/kokusai2-enshu-1996/1997-01-24
/www-search.html
あるいは、次のページから手繰っていくこともできます。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe
http://www.hlla.is.tsukuba.ac.jp/~yas/index-j.html
http://www.ipe.tsukuba.ac.jp/~yshinjo
http://www.ipe.tsukuba.ac.jp
インターネット上にある膨大な情報から、必要な情報を見つけ出すためには、 次のような方法があります。
WWWでは、検索結果は、利用者が直接使っているコンピュータで動いている ブラウザに現われます。実際の検索プログラムは、インターネット上の別のコ ンピュータで動いています。この検索プログラムのことを、検索エンジン (search engine)と呼びます。
日本国内、あるいは、世界中にどのようなサーチエンジンがあるかの一覧が、 次のページにあります。
http://www.softlab.is.tsukuba.ac.jp/OS/naofumi/se.html
http://www.yahoo.co.jp/Computers_and_Internet/Internet/Searching_the_Net/
http://www.yahoo.com/Computers_and_Internet/Internet/Searching_the_Net/
検索を行う時、利用者はキーワードを与えます。検索対象のデータ(今の場合、 WWWページ)にも、キーワードが与えられています。検索とは、利用者から 与えられたキーワードを持つ対象データを利用者に返すことです。
検索対象のデータにキーワードを与える方法としては、次の2種類があります。
WWW上のページで、キーワードを自動的に抽出する方法として、「インター ネット・ロボット」と呼ばれている仕掛けが使われることがあります。インター ネット・ロボットは、URLが与えられると、そのページを訪れます(そのペー ジの内容を得ます)。WWWブラウザの場合、得たページを画面に表示します が、ロボットの場合は画面には表示しません。その代わりに、ロボットは、ペー ジの内容を解析して、キーワードを抽出します。さらに、そのページに含まれ ている他のURLを、次々と訪れては、同じようにキーワードを抽出します。 そのページにURLが含まれていたら、またさらにそのページについて、同じ 処理を繰り返します。このような繰り返しの方法を、「再帰(recursion)」 といいます。こうして、ロボットは、世界中のWWWページを歩き回り、キー ワードを抽出していきます。
抽出されたキーワードは、普通、索引(index) 作るために使われます。索引というのは、キーワードの検索を高速化するため に、 /**/
WWWの特徴は、テキスト(文字)だけでなく、絵も画面に表示されることで す。しかし、絵のデータは、大きいので、回線が遅い時や混雑している時には、 絵を表示させると遅くなってしまいます。そんな場合でも快適にWWWを使う ために、ブラウザには、絵を表示しない機能があります。
Netscape では、絵の表示は、「Option
」メニューの
「YHM_Item(Auto Load Images)」という項目で制御できます。この項目が選択
されていた場合(チェックされていた場合)、Netscape は、絵(images)を、
自動的に(auto)、絵のデータを転送します(load)。ここで絵とは、HTMLの
<IMG>タグでしていされたものです。
図1 Netscape の Option メニュー (Auto Load Images)