符合化(数、静止画像、文字)

共通科目情報処理(講義)、生物資源学類対象、2000年09月12日

                                       電子・情報工学系
                                       新城 靖
                                       <yas@is.tsukuba.ac.jp>

このページは、次の URL にあります。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/shigen-kougi-2000/2000-09-12
あるいは、次のページから手繰っていくこともできます。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/
http://www.hlla.is.tsukuba.ac.jp/~yas/index-j.html
http://www.ipe.tsukuba.ac.jp/~yshinjo/

■復習

情報扱い方の種類(広義の情報処理) 情報処理を学ぶ意義

コンピュータのモデル

■今日の重要な話

■大学の授業の方法

授業を、情報処理の観点から見ると、教官が持っている情報を 学生が受け取るということである。
教官
自分が持っている知識、書籍、インターネット上の情報の中から材料を選 りすぐる(教官によるフィルタリング)
学生
教官の話のうち、自分にとって大事なものを選りすぐりながら受け取る (学生によるフィルタリング)。
自分にとって大事な部分がどこかを判断しながら聞くことが大事になる。 いくつかの戦略がある。 高校までの勉強の方法、授業の利用方法を切り替える必要がある。ノートを取 るのは、フィルタリングを行って大事な部分や紙媒体に記憶させた方がいいも のだけを書く。

■符号化

コンピュータで扱えるように、情報をビット列(符合、コード)に対応さ せる。

■数の符号化

1ビットで表せるのは、2種類。 0と1を表現できればよい時には、 1ビットでもよい。

もっと大きい数を扱う時には、複数ビットをまとめてあつかう。 ビットごとに、 20 21 22 23 ... と 重みを変える(2進法)。たとえば、101 だと 22 + 20 == 4 + 1 == 5 を意味する。

◆数の表現方法の

浮動小数点(floating point)。

m × R e

指数部 e と小数部 m の組で、少数を表す。e, m は整数。R は、2 が使われ ることが多い。(10 が使われることも、16 が使われることもある。)

負の数が必要な時には、プラスかマイナスかを表すために1ビット必要になる。 たとえば、8ビットなら0-255 ではなくて、-128 から +128 まで表すことが できる。

コンピュータは、間違えることがある。

(その前に、そもそもプログラムは人間が作ったものである。)

◆2進数、16進数、10進数

----------------------------------------------------------------------
2進	 16進	10進
----------------------------------------------------------------------
    0	 0	0
    1	 1	1
   10	 2	2
   11	 3	3
  100	 4	4
  101	 5	5
  110	 6	6
  111	 6	7
 1000	 8	8
 1001	 9	9
 1010	 A	10
 1011	 B	11
 1100	 C	12
 1101	 D	13
 1110	 E	14
 1111	 F	15
10000	10	16
----------------------------------------------------------------------
16進数(16進法)では、10進で 10 から 15 の代わりに、アルファベッ トのA から F を使う。16進数の計算ができる必要はないが、 転記する必要がでてくることがある。

■静止画像の符号化

細かい点(画素、ピクセル、pixel)の集合として扱う。次の2つの数で決まる。

ビットマップ 1つの点を、1ビット(白か黒)で表す。

「漢」のビットマップによる表現

「漢」のビットマップによる表現。 この場合、16×16で256ビット必要になる。

画素数の感覚

単位面積あたりの画素数を、解像度という。面積が決まっている場合には、画 素数と解像度が混同されて使われることがある。

色と階調には、次のような種類がある。

カラーでも、1ピクセルに使うビット数で、いろいろな種類がある。

色の名前の付け方には、いろいろある。

コンピュータ1画面のデータ量。

1000 ドット x 1000 ドット x 8 ビット == 8,000,000 ビット。

(フロッピ・ディスク1枚分くらい。)

画像は、大きいので、「圧縮」したい。つまり、同じ画像をより小さなデータ 量で表現したい。

画像の表現形式にも、何種類もある。自分が使えるコンピュータで全ての種類 の画像が扱えるわけではない。操作する時には、自分が扱えるかどうかを調べ る必要がある。場合によっては、形式の「変換」をする必要がある。

よく使えれている画像の形式には、次のようなものがある。

■文字の符号化

文字の符号化とは、文字とビット列(または整数)を対応させることであ る。対応のさせかたには何種類もある。
A	1
B	2
C	3
...
Z	26
モールス符合。

ポケットベル・コード。

コンピュータでよく使われる文字集合と文字の符号化の方法

◆ISO Standard ISO8859-1 Latin-1

Latin-1コード表

8ビット符号。 20(16進)から7F(16進)までは、ASCII と同じ。 西ヨーロッパでよく使われている。

参考:

http://www.sandia.gov/sci_compute/iso_symbol.html
ISO Latin 1 Character HTML Entity Names)

◆JIS X 201

JIS X 201 コード表

◆漢字コード

JIS漢字コード表の一部

漢字1文字を、16ビットで表す。16進で2121から747Eまでの範囲にある。た だし、ただし、半分は空いている。16ビットを、8ビットずつに分ける時に、 それぞれ 21〜7E に入るようになっている。

参考:

http://www.hlla.is.tsukuba.ac.jp/~yas/classes/ipe/nitiniti2-enshu-1996/1996-11-18/kanji-code.html
漢字コードに関する解説

◆漢和辞典

漢和辞典では、JIS漢字コードを目にすることがある。

漢和辞典

旺文社漢和辞典より。1986年。ISBN 4-01-077522-X。

残念ながら、漢字コードから漢字が引けない。

◆漢字をコンピュータへ打ち込む

現在、かな漢字変換が主流だが、読み方がわからない時、かな漢字変換用辞書 に載っていないときには漢字コードで指定することもできる。

◆文字の符号化の意義

文字を符号化することには、いくつかの意義がある。 比較できることは、検索の時に便利。画像では検索できない。

逆に文字を符号化してしまうと、個人の性質を出したい時には、問題がある。 たとえば、署名やラブレター。

文字の符号化には、何種類もある。符号化の方法を知らないと「文字化け」を 起こす。

日本語の符号化には次の3つがよく使われる。

文字化けを起こした時には、これらを切り替えてみる必要が出てくることがあ る。

■コンピュータで0、1以外のものが扱える理由

人間が言葉で主張することは、次のような方法で数学的に記述することができる。

チューリング機械:コンピュータの単純なモデル。無限のテープ、読み書きす るヘッド、制御部からなる。

記号論理学上の表現は、すべて2値論理のブール代数に置き換えることができる。 ( 言葉で記述されたものは、全て数の並びで表すことができる。 数の並びは、ブール代数に置き換えることができる。 )

ブール代数は、すべて電子回路で置き換えることができる。

人間は計算可能か。知能は定義できるのか。言葉で定義してしまうと、計算可 能になる。


↑[もどる] ←[9月15日] ・[9月12日] →[9月15日]
Last updated: 2000/09/12 02:06:58
Yasushi Shinjo / <yas@is.tsukuba.ac.jp>