共通科目情報処理(講義)、生物資源学類対象、2000年09月12日
電子・情報工学系
新城 靖
<yas@is.tsukuba.ac.jp>
このページは、次の URL にあります。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/shigen-kougi-2000/2000-09-12
あるいは、次のページから手繰っていくこともできます。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/
http://www.hlla.is.tsukuba.ac.jp/~yas/index-j.html
http://www.ipe.tsukuba.ac.jp/~yshinjo/
情報扱い方の種類(広義の情報処理)
- 計算(computation)
- 通信(communication)
- 記憶(storage)
情報処理を学ぶ意義
- 教養。人生を豊かにする。
- 現世利益。通信装置。
- 考える道具。新しい発想方法。
コンピュータのモデル
- ビットは、ディジタルコンピュータで扱える情報の最小単位。0か1か。
- コンピュータは、ビット列になった情報を処理する。
- 何をやらせるかと手順(プログラム)もまたビット列として与える。
- コンピュータに何かやらせるには、情報をビット列として表現しなけれ
ばならない。
- ビット列での表現方法(符合化の方法)には、何種類もある。
使うときに意識しないといけないことがある。
- 文字は、符合化すると少量で済む。画像は大きい。
授業を、情報処理の観点から見ると、教官が持っている情報を
学生が受け取るということである。
- 教官
- 自分が持っている知識、書籍、インターネット上の情報の中から材料を選
りすぐる(教官によるフィルタリング)
- 学生
- 教官の話のうち、自分にとって大事なものを選りすぐりながら受け取る
(学生によるフィルタリング)。
自分にとって大事な部分がどこかを判断しながら聞くことが大事になる。
いくつかの戦略がある。
- 教官が大事だと強調している部分を大事にして試験の点数を上げる
- 自分が大事だと思うものを教官から引き出すために質問する。
高校までの勉強の方法、授業の利用方法を切り替える必要がある。ノートを取
るのは、フィルタリングを行って大事な部分や紙媒体に記憶させた方がいいも
のだけを書く。
コンピュータで扱えるように、情報をビット列(符合、コード)に対応さ
せる。
1ビットで表せるのは、2種類。
0と1を表現できればよい時には、
1ビットでもよい。
もっと大きい数を扱う時には、複数ビットをまとめてあつかう。
ビットごとに、
20
21
22
23
... と
重みを変える(2進法)。たとえば、101 だと
22
+
20
== 4 + 1 == 5 を意味する。
- 整数
- 4ビット (0-15)
- 8ビット (0-255)
- 16ビット (0-65535)
- 32ビット (0-4294967295)
- 64ビット (0-18446744073709551616)
- 小数(実数)
- 固定小数点(fixed point)。
- 浮動小数点(floating point)。
- 分数(有理数)
- 複素数
浮動小数点(floating point)。
m × R e
指数部 e と小数部 m の組で、少数を表す。e, m は整数。R は、2 が使われ
ることが多い。(10 が使われることも、16 が使われることもある。)
負の数が必要な時には、プラスかマイナスかを表すために1ビット必要になる。
たとえば、8ビットなら0-255 ではなくて、-128 から +128 まで表すことが
できる。
コンピュータは、間違えることがある。
- 整数や固定小数点では、表せる範囲に注意する。たとえば、
32ビットだと、40億ちょっとまでしか表せないので、
国家予算の計算には使えない。
- 浮動少数では、計算の誤差に注意する。表せる範囲内(指数部mで決まる)
でも、計算の途中に誤差が生じる(少数部mの桁が溢れる)。特に、加減算で精
度が落ちる。
(その前に、そもそもプログラムは人間が作ったものである。)
----------------------------------------------------------------------
2進 16進 10進
----------------------------------------------------------------------
0 0 0
1 1 1
10 2 2
11 3 3
100 4 4
101 5 5
110 6 6
111 6 7
1000 8 8
1001 9 9
1010 A 10
1011 B 11
1100 C 12
1101 D 13
1110 E 14
1111 F 15
10000 10 16
----------------------------------------------------------------------
16進数(16進法)では、10進で 10 から 15 の代わりに、アルファベッ
トのA から F を使う。16進数の計算ができる必要はないが、
転記する必要がでてくることがある。
- 漢字コード。漢字の打ち込み。漢和辞典との対応。
- WWW での色の指定。
細かい点(画素、ピクセル、pixel)の集合として扱う。次の2つの数で決まる。
- 画素の数。
- 1つの画素での色の数。色の深み。階調。
ビットマップ
1つの点を、1ビット(白か黒)で表す。
「漢」のビットマップによる表現。
この場合、16×16で256ビット必要になる。
画素数の感覚
- コンピュータのモニタの画素数は、1000x1000==100万くらい。
- プリンタの画素数は、A4で 3万x4万==12億くらい。
- 印刷物は、コンピュータのプリンタよりもずっと多い。
単位面積あたりの画素数を、解像度という。面積が決まっている場合には、画
素数と解像度が混同されて使われることがある。
色と階調には、次のような種類がある。
- 白黒。2階調。Fax。
- グレースケール。明るさだけ。
- カラー。
カラーでも、1ピクセルに使うビット数で、いろいろな種類がある。
- 3ビット(Red, Gree, Blue で1ビット)。8色(2の3乗)。
- 8ビット。256色(2の8乗)。
- 16ビット。6万色(2の16乗)。
- 24ビット。1677万色(2の24乗)。
色の名前の付け方には、いろいろある。
- RGB, Red Green Blue。
- CMYK (シアン、マゼンダ、黄色、黒)。
コンピュータ1画面のデータ量。
1000 ドット x 1000 ドット x 8 ビット == 8,000,000 ビット。
(フロッピ・ディスク1枚分くらい。)
画像は、大きいので、「圧縮」したい。つまり、同じ画像をより小さなデータ
量で表現したい。
- Run-length圧縮。連続する白や黒を、何個続くかで表す。Faxで使われている。
- 周辺を予想する。
- 劣化式圧縮。劣化圧縮。人間の目に気がつかない所で
データの一部を捨てる。JPEGで, MPEG使われている。
画像の表現形式にも、何種類もある。自分が使えるコンピュータで全ての種類
の画像が扱えるわけではない。操作する時には、自分が扱えるかどうかを調べ
る必要がある。場合によっては、形式の「変換」をする必要がある。
よく使えれている画像の形式には、次のようなものがある。
- ビットマップ。1つの点が白か黒。圧縮なし。
- ピクセルマップ。1つの点が色つき。圧縮なし。
- CompuServe GIF。256色。
- Microsoft BMP (名前は bitmap だがピクセルマップの一種)
- Apple PICT
- JPEG
文字の符号化とは、文字とビット列(または整数)を対応させることであ
る。対応のさせかたには何種類もある。
A 1
B 2
C 3
...
Z 26
モールス符合。
ポケットベル・コード。
コンピュータでよく使われる文字集合と文字の符号化の方法
- ASCII (アスキー)。英語アルファベット、数字、記号。
- Latin-1 (ラテンワン)。西ヨーロッパで使われている。
- JIS X 0201-1976符号。ASCII + カタカナ。
- JIS X 0208-1983符号。漢字。
- EUC
- Microsoft 漢字コード(Shift-JIS)
8ビット符号。
20(16進)から7F(16進)までは、ASCII と同じ。
西ヨーロッパでよく使われている。
参考:
http://www.sandia.gov/sci_compute/iso_symbol.html
- ISO Latin 1 Character HTML Entity Names)
漢字1文字を、16ビットで表す。16進で2121から747Eまでの範囲にある。た
だし、ただし、半分は空いている。16ビットを、8ビットずつに分ける時に、
それぞれ 21〜7E に入るようになっている。
参考:
http://www.hlla.is.tsukuba.ac.jp/~yas/classes/ipe/nitiniti2-enshu-1996/1996-11-18/kanji-code.html
- 漢字コードに関する解説
漢和辞典では、JIS漢字コードを目にすることがある。
旺文社漢和辞典より。1986年。ISBN 4-01-077522-X。
残念ながら、漢字コードから漢字が引けない。
現在、かな漢字変換が主流だが、読み方がわからない時、かな漢字変換用辞書
に載っていないときには漢字コードで指定することもできる。
文字を符号化することには、いくつかの意義がある。
- 記憶に要する場所の節約になる(画像で表す方法と比較して)。
- 表示の書体(フォント)、字の大きさを自由に変えることができる。
- 誰が作っても同じ文字は同じ文字として比較することができる。
比較できることは、検索の時に便利。画像では検索できない。
逆に文字を符号化してしまうと、個人の性質を出したい時には、問題がある。
たとえば、署名やラブレター。
文字の符号化には、何種類もある。符号化の方法を知らないと「文字化け」を
起こす。
日本語の符号化には次の3つがよく使われる。
文字化けを起こした時には、これらを切り替えてみる必要が出てくることがあ
る。
人間が言葉で主張することは、次のような方法で数学的に記述することができる。
- ブールの記号論理学(命題論理、述語論理、ブール代数)
- チャーチのラムダ計算
- ゲーデルの帰納的関数
- チューリングのチューリング機械
チューリング機械:コンピュータの単純なモデル。無限のテープ、読み書きす
るヘッド、制御部からなる。
記号論理学上の表現は、すべて2値論理のブール代数に置き換えることができる。
(
言葉で記述されたものは、全て数の並びで表すことができる。
数の並びは、ブール代数に置き換えることができる。
)
ブール代数は、すべて電子回路で置き換えることができる。
人間は計算可能か。知能は定義できるのか。言葉で定義してしまうと、計算可
能になる。
↑[もどる]
←[9月15日]
・[9月12日]
→[9月15日]
Last updated: 2000/09/12 02:06:58
Yasushi Shinjo / <yas@is.tsukuba.ac.jp>