符合化(数、静止画像、文字)

共通科目情報処理(講義)、体育専門学群対象、2001年04月26日

                                       電子・情報工学系
                                       新城 靖
                                       <yas@is.tsukuba.ac.jp>

このページは、次の URL にあります。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/taiiku-kougi-2001/2001-04-26
あるいは、次のページから手繰っていくこともできます。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/
http://www.hlla.is.tsukuba.ac.jp/~yas/index-j.html
http://www.ipe.tsukuba.ac.jp/~yshinjo/

■復習

情報扱い方の種類(広義の情報処理) 情報処理を学ぶ意義

コンピュータのモデル

■今日の重要な話

■ビット、ビット列と符号化

◆ビット

ディジタルコンピュータで扱える情報の最小単位。

単位としては、時間ではないものに対応させると分かりやすいかもしれない。

ビットは、離散的。正の整数しかつかない。0.5ビットとか-10ビットというこ とはない。

1ビットで表せること。

1ビットの情報では、2つの状態のどちらかを表すひとができる。2つの状態 を、数に対応させる時には、0と1で表す。

◆ビット列(ビットの並び、ビット・パタン)

1ビットで表せる情報では足りないので、複数のビットをまとめて考える。

1ビットでは、0か1の2つのことしか区別できない。2つだけでは、日常的 に扱いたい情報(数、文字、画像、音声など)を表現するのに不足するので、普 通は、複数のビットをまとめて使うことになる。

◆符号化

コンピュータで扱えるように、情報をビット列(符合、コード)に対応さ せる。

■数の符号化

1ビットで表せるのは、2種類。0と1を表現できればよい時には、1ビット でもよい。

もっと大きい数を扱う時には、複数ビットをまとめてあつかう。 ビットごとに、 20 21 22 23 ... と 重みを変える(2進法)。 たとえば、

101 (2進法)
だと
22+20== 4 + 1 == 5 (10進法)
を意味する。

◆2進数、16進数、10進数

----------------------------------------------------------------------
2進	 16進	10進
----------------------------------------------------------------------
    0	 0	 0
    1	 1	 1
   10	 2	 2
   11	 3	 3
  100	 4	 4
  101	 5	 5
  110	 6	 6
  111	 6	 7
 1000	 8	 8
 1001	 9	 9
 1010	 A	10
 1011	 B	11
 1100	 C	12
 1101	 D	13
 1110	 E	14
 1111	 F	15
10000	10	16
----------------------------------------------------------------------
16進数(16進法)では、10進で 10 から 15 の代わりに、アルファベッ トのA から F を使う。16進数の計算ができる必要はないが、 転記する必要がでてくることがある。

◆コンピュータで扱える数の種類

整数と小数に分けられる。

◆整数

ビット数によって、扱える範囲が違う。 正の数だけでなくて負の数も扱う時には、正か負かを表すために1ビット使う。 普通は、2の補数という方式を使うので、負の部分が1つ大きい。

2の補数は、算盤で負の数を扱う時と同じ方法。 −nを、nを加えると、0(桁溢れ)になるよう。

◆小数

固定小数点は、ドルを考えるとわかる。整数 100 を、1 と思う。

◆浮動小数点(floating point)

m × R e

指数部 e と小数部 m の組で、少数を表す。e, m は整数。R は、2 が使われ ることが多い。(10 が使われることも、16 が使われることもある。)

◆その他

  • 分数(有理数)
  • 複素数 あまり使われない。

    ◆誤差とオーバーフロー

    数の計算でも、コンピュータは、間違えることがある。

    その前に、そもそもプログラム(コンピュータを制御するための手順)は人間 が作ったものである。

    ■静止画像の符号化

    画像は、細かい細かい点(画素、ピクセル、pixel)の集合として扱える。

    画像の品質は、次の2つの数で決まる。

    ◆ビットマップ

    1つの画素を、1ビット(白か黒)で表す。

    フォークとナイフの絵のビットマップによる表現(小さいもの)

    フォークとナイフの絵のビットマップによる表現(拡大)

    ◆色と階調

    色と階調には、次のような種類がある。

    カラーでも、1ピクセルに使うビット数で、いろいろな種類がある。

    色の名前の付け方には、いろいろある。

    ◆画素数の感覚

    ◆解像度

    単位面積あたりの画素数を、解像度という。

    面積が決まっている場合には、画素数と解像度が混同されて使われることがあ る。

    ◆画像のデータ量の計算

    画素数 ×1画素あたりのビット数
    縦のドット数 ×横のドット数 ×1画素あたりのビット数
    コンピュータ1画面の

    1000 ドット x 1000 ドット x 24 ビット == 24,000,000 ビット。

    (フロッピ・ディスク3枚分くらい。)

    ◆圧縮

    画像は、大きいので、「圧縮」したい。つまり、同じ画像をより小さなデータ 量で表現したい。

    ◆画像の形式

    画像の表現形式にも、何種類もある。自分が使えるコンピュータで全ての種類 の画像が扱えるわけではない。操作する時には、自分が扱えるかどうかを調べ る必要がある。場合によっては、形式の「変換」をする必要がある。

    よく使えれている画像の形式には、次のようなものがある。

    ◆JPEGと劣化式圧縮

    JPEG は、写真のディジタル・イメージ(カラー静止画像)を圧縮 する方法の1つであり、現在 WWW でも広く利用されている。ディ ジタル・カメラでは、写真を保存するために JPEG 形式を使ってい るものがある。

    JPEG は、ITU (International Telecommunications Union, 旧 CCITT) と ISO の共同作業グループ(Joint Photographic Experts Group) により作成された規格である。正式には、JFIF (JPEG File Interchange Format) という。

    JPEG は、劣化式圧縮の1つである。JPEG では、人間の目で見た時 にあまり気が付かない部分のデータを取り除く。その結果、写真の 見た目の質を落とすことなく、高い圧縮率を実現している。JPEG で圧縮時に捨てられたデータは、展開時に回復させることはできな い。

    このような性質から、JPEG は、写真のようなイメージを圧縮する ために向いている。逆に、図形やイラストなどの保存には、適さな い。このようなものは、劣化式ではない圧縮アルゴリズムを使って いる GIF 形式の方が適している。

    JPEG では、写真を保存する時に、品質を指定することができる。 高い品質を指定すれば、劣化が少なくなるが、データ量は多くなる。 低い品質を指定すれば、逆になる。

    ■文字の符号化

    文字の符号化とは、文字とビット列(または整数)を対応させることであ る。対応のさせかたには何種類もある。
    A	1
    B	2
    C	3
    ...
    Z	26
    
    モールス符合。

    ポケットベル符合。

    コンピュータでよく使われる文字集合と文字の符号化の方法

    ◆ISO Standard ISO8859-1 Latin-1

    Latin-1コード表

    8ビット符号。 20(16進)から7F(16進)までは、ASCII と同じ。 西ヨーロッパでよく使われている。

    参考:

    http://www.sandia.gov/sci_compute/iso_symbol.html
    ISO Latin 1 Character HTML Entity Names)

    ◆JIS X 201

    JIS X 201 コード表

    ◆漢字コード

    JIS漢字コード表の一部

    漢字1文字を、16ビットで表す。16進で2121から747Eまでの範囲にある。た だし、ただし、半分は空いている。16ビットを、8ビットずつに分ける時に、 それぞれ 21〜7E に入るようになっている。

    参考:

    http://www.hlla.is.tsukuba.ac.jp/~yas/classes/ipe/nitiniti2-enshu-1996/1996-11-18/kanji-code.html
    漢字コードに関する解説

    ◆漢和辞典

    漢和辞典では、JIS漢字コードを目にすることがある。

    漢和辞典

    旺文社漢和辞典より。1986年。ISBN 4-01-077522-X。

    残念ながら、漢字コードから漢字が引けない。

    ◆漢字をコンピュータへ打ち込む

    現在、かな漢字変換が主流だが、読み方がわからない時、かな漢字変換用辞書 に載っていないときには漢字コードで指定することもできる。

    ◆文字の符号化の意義

    文字を符号化することには、いくつかの意義がある。 比較できることは、検索の時に便利。画像では検索できない。

    漢字の「漢」のビットマップによる表現

    逆に文字を符号化してしまうと、個人の性質を出したい時には、問題がある。 たとえば、署名やラブレター。

    文字の符号化には、何種類もある。符号化の方法を知らないと「文字化け」を 起こす。

    日本語の符号化には次の3つがよく使われる。

    文字化けを起こした時には、これらを切り替えてみる必要が出てくることがあ る。
    ↑[もどる] ←[4月19日] ・[4月26日] →[5月10日]
    Last updated: 2001/04/25 23:13:18
    Yasushi Shinjo / <yas@is.tsukuba.ac.jp>