符合化(音声、動画像)とコンピュータのハードウェア構成要素

共通科目情報処理(講義)、生物資源学類対象、2000年09月19日

                                       電子・情報工学系
                                       新城 靖
                                       <yas@is.tsukuba.ac.jp>

このページは、次の URL にあります。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/shigen-kougi-2000/2000-09-19
あるいは、次のページから手繰っていくこともできます。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/
http://www.hlla.is.tsukuba.ac.jp/~yas/index-j.html
http://www.ipe.tsukuba.ac.jp/~yshinjo/

■正誤表

2000年09月19日の段階では、次のような間違いがあった。

ハードディスクは、永続的(電源を切っても残っている)。

G は、ギガと読む。メガでない。

標本化は、「空間量子化」ともいう。時間量子化ではない。

■復習

■今日の重要な話

コンピュータの内部にある重要な部品
CPU
計算を行う。計算の速度を決める。クロックの周波数(単位はHz(へルツ)) が速度の目安になる。
メモリ(RAM(Random Access Memory))
実行中のプログラムを保持する。加工するデータを一時的に保持する。 揮発的(電源を切ると消えてしまう)。非常に速い。容量は、ハードディスクよ りは小さい。
ハード・ディスク (HD(Hard Disk), HDD(Hard Disk Drive))
プログラムやデータをデータを保持する。永続的(電源を切っても 残っている)。容量は、メモリより大きい。
2種類の記憶のための部品の使い分け

■情報量の単位

ビット(bit,b)
コンピュータで扱う情報の最小単位。 通信速度を表現する時によく使われる。
1ビットの情報で扱えるものには次のようなものがある。
バイト(byte,B)
(アメリカなら)1文字を扱える程度の情報量。 記憶容量を表す時によく使われる。

1バイト==8ビット

1バイトでは、256種類(28)のものが区別できる。文字を ASCII や Laten-1 で符号化した時には、1文字を表すのに1バイトで足りる。 ただし、 JIS漢字コード を使うと、1文字を表すのに2バイト必要になる。

次のような記号が使われることがある。

b (小文字)
bit
B (大文字)
Byte

情報量の単位、ビットやバイトには、次のような係数とともに使われる。

K (キロ(kilo-)、ケイ)
1 K == 1000 または 1024
M (メガ(Mega-))
1 M == 1000 K または 1024 K または 1,000,000 (100万)
G (ギガ(Giga-))
1 G == 1000 M または 1024 M または 1,000,000,000 (10億)
T (テラ(Tera-))
1 T == 1000 G または 1024 G または 1,000,000,000,000 (1兆)
情報量や記憶容量の感覚を持ちたい。

■符号化

■数の符号化

■静止画像の符号化

■文字の符号化

■音の符号化

音をコンピュータで扱うには、次のような手順になる。

  1. 音を電気信号に変える(マイクロホン)
  2. 電気信号を数に変える(A/Dコンバータ(analog-to-digital converter))
  3. コンピュータで計算/通信/蓄積する
  4. 数を電気信号に変える(D/Aコンバータ(digital-to-analog converter))
  5. 電気信号を音に変える(スピーカ)
ディジタルになった音データの品質は、次の数で決まる。
標本化(サンプリング・レート、空間量子化)。
電気信号を数に変える頻度。1秒辺り回数(Hz (ヘルツ))で表す。
量子化数(サンプリング・サイズ、時間量子化)。
数に変える時に何ビットで表わすか。ビットで表す。
チャネル数(チャンネル数(channel))。
ステレオなら2。(単位なし)

アナログ信号のディジタル化、棒グラフとアナログ信号

アナログ信号のディジタル化

CD品質の音(Compact Disc)

  • サンプリング・レート:44,100 Hz
  • サンプリング・サイズ:16ビット
  • チャネル数:2

CDに含まれているデータ量。

44100 [回/秒] *16 [ビット] * 2 ==1,411,200 [ビット/秒]
1,411,200 [ビット/秒] * 60 [秒/分] *70 [分/枚] == 5,927,040,000 [ビット/枚]
5,927,040,000 [ビット/枚] / 8 [ビット/バイト] == 740,880,000 [バイト/枚]
〜740 M [バイト/枚]

電話品質

  • サンプリング・レート:8000Hzくらい
  • サンプリング・サイズ:8ビットくらい
  • チャネル数:1
1秒当たりのデータ量
8000 [回/秒] * 8 [ビット] * 1 == 64000 (64k) [bit]
1時間当たりのデータ量
64k [bit/秒] * 60 [秒/分] * 60 [分/時間] == 230,400 k [ビット]== 230,400,000 [ビット]
電話も、CD より音質は悪いが長電話すると、相当なデータ量になる。

「*」は、コンピュータで掛け算を表す。割り算は、「/」。

音の符号化の方法(圧縮方法):

  • PCM(Pulse Code Modulation)
  • DPCM(Differential PCM)。差分を使う。
  • ADPCM(Adaptive Differential PCM)。差分を特別なコードで表わす。
  • 無音エンコーディング。無音部分を長さで置き換える。
  • 対数を使う。(μ法則、A法則)
  • MP3

◆MP3

MP3が社会的に与えた影響については、後半の講義で。

◆エラー訂正

CD の音質がよいことの理由のひとつ。

チェックサムによる誤り検出

保存(通信)するデータに、ビット列を数の並びと思った時の合計(sum)を 付加する。合計が在っていれば、データが正しい、そうでない場合、 どこかでデータが壊れた(誤りが含まれた、エラーが生じた)とと判断する。 その場合、もう一度、正しいデータを得ることを試みる。

実際には、検出して再び試みる(再転送)ではなくて、冗長(redundant)なデー タをうまくつかって、回復させる方法がある。その1つで良く使われるのが、 CRC (Cyclic Redundancy Check) と呼ばれる方法である。

◆CD (digital)は、音がいいか

アナログのレコードより、ディジタルの CD の方が音がよいか。

CD では、ディジタルで記録された情報は、ディジタルの範囲では正確に再現 できる。

音がよいかは、ディジタル以外の部分に大きく依存する。

  • ミキシング
  • A/Dコンバータの性能
  • D/Aコンバータの性能

■動画像の符号化

コンピュータで動画像を扱うには、基本的には、テレビ、映画、アニメーショ ンと同じで、静止画像を次々と切り替えることをする。 次の2つの数で決まる。
  • 画素数。
  • 階調。
  • 1秒当たりの画像の数(フレーム数)。

VHS ビデオ品質のデータ。

  • 画素数: 235ドット×240ドット
  • 階調: 16ビットくらい?
  • 1秒当たりのフレーム数: 30
1秒あたりのデータ量: 235*240*16*30 == 27,072,000 ビット。

HDTV (高精細テレビ) High Definition TeleVision

  • 画素数: 720ドット×480ドット、または、1280×720ドット
  • 階調: 24ビット
  • 1秒当たりのフレーム数: 60

1秒あたりのデータ量: 720*480*24*60 == 497,664,000 ビット。

DVD (片面2単層)には、約4.7Gバイト(37.6ビット)のデータを保存することが できる。圧縮しないで動画像だけを保存した場合、

37.6 [G bit] / 497,664,000 [ビット/秒] == 約 80 [秒]。

とにかく圧縮したい。

  • MPEG-1
  • MPEG-2。DVD (Digital Versatile Disc)で使われている。
  MPEG-2 は、DVD に使われており、2時間程度の映画(動 画像+音声)を数Gバイト(数1,000,000,000*8ビット)に圧縮することができ る。基本的な技術は、次の2つである。
  • 差分をつかう。前の画像との差分だけを記録する。
  • 劣化圧縮。人間の目では気が付かない部分のデータを復元できない形で 落している。

DVD は、画質がよいか。

CD (圧縮されていない)と同じように、A/D変換、D/A変換の問題がある。

さらに、MPEG-2 で圧縮する時に、品質を調整できる。 品質を落とせば、長時間録音・録画できる。

平均的な DVD で想定されているデータ量

画像
3.5 M [ビット/秒] (1秒間に 3,500,000,000ビット)
音声
384 K [ビット/秒] (1秒間に 384,000ビット) × 3 言語
字幕
10 K [ビット/秒] (1秒間に 10,000ビット) × 4 言語

音質は、PCM (Linear PCM) なら、CD よりもよくできる。サンプリング・レー トやサンプリング・サイズが高くすることで。

Dolby Digital, MPEG Audio (MP3), DTS (Digian Theater Systems) では、CD よりも悪いこともある。ただし、サラウンド(チャネル数が2以上)は、DVD でないと規格がない。

■コンピュータのハードウェアの話

ハードウェアの話は、この授業では、これだけである。

大事なことは、2種類のメモリが使われている所。

コンピュータのハードウェアの要素。CPU。メモリ。バス。I/O

コンピュータのハードウェアの要素

  • CPU(Central Processing Unit)。
  • メモリ(主記憶)
  • 入出力装置(I/O)。コントローラと呼ばれる部品を 経由して接続されている。
    • ハードディスク(2次記憶)
    • キーボード
    • マウス
    • ディスプレー(CRT、)
    • ネットワーク

部品は、「バス」と呼ばれる配線の束で結ばれている。 部品間は、バスを通じてデータを交換する。

コンピュータの内部の部品

  • 計算のための部品
  • 記憶のための部品
  • 通信のための部品

◆記憶のための部品:メモリ

コンピュータの中では、いろいろな種類の記憶のための部品、すなわち、メモ リが使われている。もっとも重要なものは、メインメモリ(主記憶)と呼ばれ ているもので、単にメモリといった時には、メインメモリを差す。

メインメモリは、IC(Integrated Circuit、シリコンという元素による半導 体で作られた電気回路)でできている。その他に、ハードディスクやフロッピ・ ディスクも重要な記憶のための部品である。

メモリ(RAM(Random Access Memory))
実行中のプログラムを保持する。加工するデータを一時的に保持する。 揮発的(電源を切ると消えてしまう)。非常に速い。容量は、ハードディスクよ りは小さい。
ハード・ディスク (HD(Hard Disk), HDD(Hard Disk Drive))
プログラムやデータをデータを保持する。永続的(電源を切っても 残っている)。容量は、メモリより大きい。

メモリには、数字で番地(アドレス)が付いている。番地を指定して、データ を保存する。番地を指定すると、データが取り出せる。

◆メモリの分類

記憶のための部品は、いろいろな分類方法がある。

メモリの分類(その1)。

  • 揮発的(volatile)。電源を切ると消えてしまう。
  • 永続的(persistent,stable)。電源を切っても残っている。
メモリの分類(その2)。
  • 読み込み専用。
  • 読み書き可能。
  • 読み書き可能。ただし、追加しかできず、1度書込んだものは 消せない。
メモリの分類(その3)。
  • 逐次アクセス。先頭から順にしかデータを読み書きできない。 テープのようなもの。
  • ランダムアクセス。どんな順番でもデータを読み書きできる。
メモリの分類(その4)。
  • 固定されている。取り外し不可能。ハードディスク。
  • 取り外し可能(removable)。 フロッピ・ディスク。光磁気ディスク(MO)。メモリ・カード。 MD。CD。DVD。

メモリの分類(その5)。

  • 細かい番地付け(バイト単位)
  • 荒い番地付け(512バイト、1024バイト、8192バイト)
メモリの分類(その6)。
  • 速い。
  • 遅い。
メモリの分類(その7)。
  • 値段が高い。
  • 値段が安い。
コンピュータで使われているメモリ。
RAM (Random Access Memory)。IC。
揮発的。読み書き可能。ランダム・アクセス。固定。細かい番地付け。 速い。高い。
ROM (Random Access Memory)。IC。
揮発的。読み込み専用。ランダム・アクセス。固定。細かい番地付け。 速い。高い。
フロッピ・ディスク。光磁気ディスク。DVD-RAM。DVD-RW。CD-RW。
永続的。読み書き可能。ランダム・アクセス。取り外し可能。荒い番地付け。 遅い。安い。
ハードディスク。
永続的。読み書き可能。ランダム・アクセス。固定。荒い番地付け。 遅い。安い。
CD-ROM。
永続的。読み込み専用。ランダム・アクセス。取り外し可能。荒い番地付け。 遅い。安い。
CD-R (CD Recordable)。
永続的。1度だけ書き込み可能。ランダム・アクセス。取り外し可能。 荒い番地付け。遅い。安い。

◆メモリの値段と速度

速度は、欲しいと思ってから手に入るまでの時間。
1997/04/24 ごろの話
----------------------------------------------------------------------
媒体		値段	容量	1MB当りの値段	速度
----------------------------------------------------------------------
フロッピ	40円	1.4MB	30円		
光磁気ディスク	1000円	230MB	4.3円		30x10^-3
ハードディスク	4万円	2000MB	20円		10x10^-3
CPU		数万円	数100B	1億円		5x10^-9
D-RAM		1万円	16MB	625円		50x10^9
CD-ROM		数100円	640MB	1円		
----------------------------------------------------------------------

2000/04/27 ごろの話
----------------------------------------------------------------------
媒体		値段	容量	1MB当りの値段	速度
----------------------------------------------------------------------
フロッピ	40円	1.4MB	30円		-
光磁気ディスク	500円	230MB	2.3円		30x10^-3
ハードディスク	2万円	2500MB	0.8円		10x10^-3
CPU		数万円	数100B	1億円		0.5x10^-9
SD-RAM		1万円	128MB	78円		30x10^9
CD-R		150円	640MB	0.2円
DVD-RAM		3500円	5200MB	0.6円	
----------------------------------------------------------------------

◆CPU (Central Processing Unit)

CPU (Central Processing Unit、中央処理装置、中央演算装置)は、コンピュー タの計算を行う部品である。MPU (Micro Processing Unit) と言われることも ある。

CPU には、数が少ないが、計算の中間結果を置くための高速なメモリ(レジス タ)が入っている。

CPU は、メモリ(主記憶)に入っいているプログラムに従って、やはりメモリ (主記憶)に入っいているデータを操作する。CPU が実行できるプログラムは、 機械語と呼ばれる。

CPU の種類によって、プログラム(機械語)が違う。 プログラム(ソフトウェア)を買う時には、CPU の種類に気をつける。

  • Pentium
  • PowerPC
  • SPARC
CPU は、コンピュータの速度を決める重要な要素となる。 (CPUだけ速くても他の部品が遅いと、全体として遅くなることがある。)

CPUが速いほど、計算は速い。CPUの速さは、クロックの周波数(単位は、Hz)を 目安にできる。たとえば、500MHz の CPU は、250MHz の CPU の2倍の速度が 出ると期待できる。ただし、CPU の種類が違うと直接的な比較はできない。

しかし、コンピュータの処理には、CPU による加工だけでなく、加工を伴わな いコピーもかなり多い。コンピュータの性能を決めるのは、CPU の計算だけで はない。特にハードディスクからメインメモリに対するコピーの速度や、ネッ トワークを経由したコピーの速度も大きな影響を与える。

メインメモリをたくさん積むと、ハードディスクからメインメモリへのコピー の回数が減らせる。前にメインメモリにコピーしたデータを、それだけたくさ ん残しておけるからである。(キャッシング)。

クロックとは、コンピュータの内部でタイミングをとるために使われている、 一定時間ごとに0と1が交代するようになっている電気信号。

◆利用者インタフェース

人間の意思を符号に変えてコンピュータ送る機器。 (コンピュータにとっては、入力装置(I/O装置(input/output)))
  • キーボード
  • マウス
  • マイクロホン&A/Dコンバータ
  • イメージ・スキャナ
  • ディジタル・カメラ
  • 手書き文字認識と音声認識
コンピュータの中のビットパタンを人間が理解するための道具。 (コンピュータにとっては、出力装置。)
  • CRT(cathode-ray tube,ブラウン管)
  • 液晶ディスプレー
  • ブザー
  • D/Aコンバータ&スピーカ
  • 音声合成

↑[もどる] ←[9月12日] ・[9月19日] →[9月26日]
Last updated: 2000/09/26 00:05:29
Yasushi Shinjo / <yas@is.tsukuba.ac.jp>