符合化(音声、動画像)とコンピュータのハードウェア構成要素

共通科目情報処理(講義)、体育専門学群対象、2001年05月10日

                                       電子・情報工学系
                                       新城 靖
                                       <yas@is.tsukuba.ac.jp>

このページは、次の URL にあります。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/taiiku-kougi-2001/2001-05-10
あるいは、次のページから手繰っていくこともできます。
http://www.hlla.is.tsukuba.ac.jp/~yas/ipe/
http://www.hlla.is.tsukuba.ac.jp/~yas/index-j.html
http://www.ipe.tsukuba.ac.jp/~yshinjo/

■正誤表

2001/05/10 の時点では、いくつか間違いがありました。

メモリの値段と速度の表で、単位が「ナノ秒」と すべき所、「マイクロ秒」となっていた場所がありました。10の指数にマイ ナスが抜けている場所がありました。

37.6Gビット」の「G」が抜けていました。

■復習

情報量の単位:ビット。

■今日の重要な話

コンピュータの内部にある重要な部品
CPU
計算を行う部品。
メモリ(RAM(Random Access Memory))
記憶のための部品。
ハード・ディスク (HD(Hard Disk), HDD(Hard Disk Drive))
記憶のための部品。
2種類の記憶のための部品の使い分け

情報量の感覚。

■情報量の単位

ビット(bit,b)
コンピュータで扱う情報の最小単位。 通信速度を表現する時によく使われる。
1ビットの情報で扱えるものには次のようなものがある。
バイト(byte,B)
(アメリカなら)1文字を扱える程度の情報量。 記憶容量を表す時によく使われる。

1バイト==8ビット

1バイトでは、256種類(28)のものが区別できる。文字を ASCII や Laten-1 で符号化した時には、1文字を表すのに1バイトで足りる。 ただし、 JIS漢字コード を使うと、1文字を表すのに2バイト必要になる。

次のような記号が使われることがある。

b (小文字)
bit
B (大文字)
Byte

情報量の単位、ビットやバイトには、次のような係数とともに使われる。

K (キロ(kilo-)、ケイ)
1 K == 1000 または 1024
M (メガ(Mega-))
1 M == 1000 K または 1024 K または 1,000,000 (100万)
G (ギガ(Giga-))
1 G == 1000 M または 1024 M または 1,000,000,000 (10億)
T (テラ(Tera-))
1 T == 1000 G または 1024 G または 1,000,000,000,000 (1兆)
情報量、記憶容量(通信速度)の感覚を持ちたい。

■符号化

■数の符号化

■静止画像の符号化

■文字の符号化

■音の符号化

音をコンピュータで扱うには、次のような手順になる。

  1. 音を電気信号に変える(マイクロホン)
  2. 電気信号を数に変える(A/Dコンバータ(analog-to-digital converter))
  3. コンピュータで計算/通信/蓄積する
  4. 数を電気信号に変える(D/Aコンバータ(digital-to-analog converter))
  5. 電気信号を音に変える(スピーカ)
ディジタルになった音データの品質は、次の数で決まる。
標本化(サンプリング・レート、空間量子化)。
電気信号を数に変える頻度。1秒辺り回数(Hz (ヘルツ))で表す。
量子化数(サンプリング・サイズ、時間量子化)。
数に変える時に何ビットで表わすか。ビットで表す。
チャネル数(チャンネル数(channel))。
ステレオなら2。(単位なし)

アナログ信号のディジタル化、棒グラフとアナログ信号

アナログ信号のディジタル化

CD品質の音(Compact Disc)

  • サンプリング・レート:44,100 Hz
  • サンプリング・サイズ:16ビット
  • チャネル数:2

CDに含まれているデータ量。

44100 [回/秒] *16 [ビット] * 2 ==1,411,200 [ビット/秒]
1,411,200 [ビット/秒] * 60 [秒/分] *70 [分/枚] == 5,927,040,000 [ビット/枚]
5,927,040,000 [ビット/枚] / 8 [ビット/バイト] == 740,880,000 [バイト/枚]
〜740 M [バイト/枚]

電話品質

  • サンプリング・レート:8000Hzくらい
  • サンプリング・サイズ:8ビットくらい
  • チャネル数:1
1秒当たりのデータ量
8000 [回/秒] * 8 [ビット] * 1 == 64000 (64k) [bit]
1時間当たりのデータ量
64k [bit/秒] * 60 [秒/分] * 60 [分/時間] == 230,400 k [ビット]== 230,400,000 [ビット]
電話も、CD より音質は悪いが長電話すると、相当なデータ量になる。

「*」は、コンピュータで掛け算を表す。割り算は、「/」。

音の符号化の方法(圧縮方法):

  • PCM(Pulse Code Modulation)
  • DPCM(Differential PCM)。差分を使う。
  • ADPCM(Adaptive Differential PCM)。差分を特別なコードで表わす。
  • 無音エンコーディング。無音部分を長さで置き換える。
  • 対数を使う。(μ法則、A法則)
  • MP3

◆MP3

MP3 は、MPEG-1 や MPEG-2 で使われている音声圧縮方式の一つで ある。Layer-3 の他に Layer-1 と Layer-2 が定められている。数 字が大きくなるほど圧縮率がよく、Layer-1 で1/4, Layer-2 で 1/6から1/8, Layer-3 で 1/12から 1/14 の圧縮が可能になってい る。これらの圧縮方式は、互換性が保たれるようになっており、 Layer-3 で圧縮されたデータをデコードできるシステムは、より低 い Layer-1, Layer-2 のデータもデコード可能になっている。これ らの圧縮方式では、ある種の劣化圧縮の技術を用いており、人間の 耳では気が付かない部分のデータを復元できない形で落とすことで 高い圧縮率を実現している。

MP3 で圧縮された音声データは、小さいので、インターネットで簡 単に転送することができる。たとえば、60分の音楽CD(600MB程度) ならば、人間の耳では品質を保ったまま50Mバイトに圧縮される。 あるいは、サンプリングレートやビット数を落すことで、さらにデー タ量を小さくすることができる。このことは、現在のCDという物理 的な媒体を使った音楽の配信システムを大きく変える可能性を示し ている。一方、著作権を無視して市販のCDをMP3方式で圧縮し World Wide Web で提供する行為が世界中で横行し、問題になって いる。

MPEG-2 や MPEG-4では、AAC (Advanced Audio Coding)と呼ばれる 音声圧縮方式も利用可能になっている。これは、MP3 よりも 1.4 倍程度圧縮効率がよいと言われている。

◆エラー訂正

CD の音質がよいことの理由のひとつ。

チェックサムによる誤り検出

保存(通信)するデータに、ビット列を数の並びと思った時の合計(sum)を 付加する。合計が在っていれば、データが正しい、そうでない場合、 どこかでデータが壊れた(誤りが含まれた、エラーが生じた)とと判断する。 その場合、もう一度、正しいデータを得ることを試みる。

実際には、検出して再び試みる(再転送)ではなくて、冗長(redundant)なデー タをうまくつかって、回復させる方法がある。その1つで良く使われるのが、 CRC (Cyclic Redundancy Check) と呼ばれる方法である。

◆CD (digital)は、音がいいか

アナログのレコードより、ディジタルの CD の方が音がよいか。

CD では、ディジタルで記録された情報は、ディジタルの範囲では正確に再現 できる。

音がよいかは、ディジタル以外の部分に大きく依存する。

  • ミキシング
  • A/Dコンバータの性能
  • D/Aコンバータの性能

■動画像の符号化

コンピュータで動画像を扱うには、基本的には、テレビ、映画、アニメーショ ンと同じで、静止画像を次々と切り替えることをする。 次の2つの数で決まる。
  • 画素数。
  • 階調。
  • 1秒当たりの画像の数(フレーム数)。

VHS ビデオ品質のデータ。

  • 画素数: 235ドット×240ドット
  • 階調: 16ビットくらい?
  • 1秒当たりのフレーム数: 30
1秒あたりのデータ量: 235*240*16*30 == 27,072,000 ビット。

HDTV (高精細テレビ) High Definition TeleVision

  • 画素数: 720ドット×480ドット、または、1280×720ドット
  • 階調: 24ビット
  • 1秒当たりのフレーム数: 60

1秒あたりのデータ量: 720*480*24*60 == 497,664,000 ビット。

DVD (片面2単層)には、約4.7Gバイト(37.6Gビット)のデータを保存することが できる。圧縮しないで動画像だけを保存した場合、

37.6 [G bit] / 497,664,000 [ビット/秒] == 約 80 [秒]。

とにかく圧縮したい。

  • MPEG-1
  • MPEG-2。DVD (Digital Versatile Disc)で使われている。
  MPEG-2 は、DVD に使われており、2時間程度の映画(動 画像+音声)を数Gバイト(数1,000,000,000*8ビット)に圧縮することができ る。基本的な技術は、次の2つである。
  • 差分をつかう。前の画像との差分だけを記録する。
  • 劣化圧縮。人間の目では気が付かない部分のデータを復元できない形で 落している。

DVD は、画質がよいか。

CD (圧縮されていない)と同じように、A/D変換、D/A変換の問題がある。

さらに、MPEG-2 で圧縮する時に、品質を調整できる。 品質を落とせば、長時間録音・録画できる。

平均的な DVD で想定されているデータ量

画像
3.5 M [ビット/秒] (1秒間に 3,500,000,000ビット)
音声
384 K [ビット/秒] (1秒間に 384,000ビット) × 3 言語
字幕
10 K [ビット/秒] (1秒間に 10,000ビット) × 4 言語

音質は、PCM (Linear PCM) なら、CD よりもよくできる。サンプリング・レー トやサンプリング・サイズが高くすることで。

Dolby Digital, MPEG Audio (MP3), DTS (Digian Theater Systems) では、CD よりも悪いこともある。ただし、サラウンド(チャネル数が2以上)は、DVD でないと規格がない。

◆MPEG Moving Picture Experts Group

MPEG (エムペグ) は、動画像と音声を圧縮するための規格の一つで ある。MPEG という名前は、ISOに設置された専門委員会の名前に由 来する。類似の専門委員会には、静止画像の圧縮圧縮方式を定めた JPEG (Joint Photographic Experts Group) がある。

現在、MPEG-1 と MPEG-2 の2つの規格が広く使われている。 MPEG-1は、ビデオテープ程度の画質で、352ドットx240ドットの画 像を毎秒30フレームで演奏することができる。Video CD 等で使わ れている。MPEG-2は、ハイビジョン程度の画質のもので、720ドッ ト×480ドット、または、1280×720ドットで、毎秒60フレームの演 奏が可能である。MPEG-2 は、DVD に使われており、2時間のビデ オを数Gバイトに圧縮することができる。現在、MPEG-4と呼ばれる 規格が審議されている。これは、Apple社が開発したQuickTimeがベー スになっており、64kbpsというISDN程度の転送速度で動画像と音声 を再生するための規格を目指している。

MPEG-2 形式のデータを再生は、専用のハードウェア、または、一 般の CPU で実行されるソフトウェアで行われる。再生時にはそれ ほど高い計算能力は必要としていないが、作成するためには高い計 算能力を必要とする。

MPEG では、動画像の各フレーム間の差分のみを保存することで高 い圧縮比率を実現している。さらに JPEG と同様に、ある種の劣化 圧縮の技術を用いており、人間の目では気が付かない部分のデータ を復元できない形で落している。

■コンピュータのハードウェアの話

ハードウェアの話は、この授業では、これだけである。

ハードウェアの基本的な考え方は、30年、あまり変っていない。

広告、カタログが読めるようになりたい。

大事なことは、2種類のメモリ(電気回路のメモリとハードディスク)が使わ れている所である。

コンピュータのハードウェアの要素。CPU。メモリ。バス。I/O

コンピュータのハードウェアの要素

  • CPU(Central Processing Unit)。
  • メモリ(主記憶)
  • 入出力装置(I/O)。コントローラと呼ばれる部品を 経由して接続されている。
    • ハードディスク(2次記憶)
    • キーボード
    • マウス
    • ディスプレー(CRT、)
    • ネットワーク

部品は、「バス」と呼ばれる配線の束で結ばれている。 部品間は、バスを通じてデータを交換する。

コンピュータの内部の部品

  • 計算のための部品
  • 記憶のための部品
  • 通信のための部品

◆記憶のための部品:メモリ

コンピュータの中では、いろいろな種類の記憶のための部品、すなわち、メモ リが使われている。もっとも重要なものは、メインメモリ(主記憶)と呼ばれ ているもので、単にメモリといった時には、メインメモリを差す。

メインメモリは、IC(Integrated Circuit、シリコンという元素による半導 体で作られた電気回路)でできている。その他に、ハードディスクやフロッピ・ ディスクも重要な記憶のための部品である。

メモリ(RAM(Random Access Memory))
実行中のプログラムを保持する。加工するデータを一時的に保持する。 揮発的(電源を切ると消えてしまう)。非常に速い。容量は、ハードディスクよ りは小さい。
ハード・ディスク (HD(Hard Disk), HDD(Hard Disk Drive))
プログラムやデータをデータを保持する。永続的(電源を切っても 残っている)。容量は、メモリより大きい。

メモリには、数字で番地(アドレス)が付いている。番地を指定して、データ を保存する。番地を指定すると、データが取り出せる。

◆メモリの分類

記憶のための部品は、いろいろな分類方法がある。

メモリの分類(その1)。

  • 揮発的(volatile)。電源を切ると消えてしまう。
  • 永続的(persistent,stable)。電源を切っても残っている。
メモリの分類(その2)。
  • 読み書き可能。
  • 読み込み専用。(工場などで)記録された後、書き絵得られない。
  • 追加可能。書き込みはでかるが、追加しかできない。1度書込んだものは 消せない。
メモリの分類(その3)。
  • 逐次アクセス専用。先頭から順にしかデータを読み書きできない。 テープのようなもの。
  • ランダムアクセス可能。どんな順番でもデータを読み書きできる。
メモリの分類(その4)。
  • 固定されている。取り外し不可能。ハードディスク。
  • 取り外し可能(removable)。 フロッピ・ディスク。光磁気ディスク(MO)。メモリ・カード。 MD。CD。DVD。

メモリの分類(その5)。

  • 細かい番地付け(バイト単位)
  • 荒い番地付け(512バイト、1024バイト、8192バイト)
メモリの分類(その6)。
  • 速い。
  • 遅い。
メモリの分類(その7)。
  • 値段が高い。
  • 値段が安い。
コンピュータで使われているメモリ。
RAM (Random Access Memory)。IC。
揮発的。読み書き可能。ランダム・アクセス。固定。細かい番地付け。 速い。高い。
ROM (Random Access Memory)。IC。
揮発的。読み込み専用。ランダム・アクセス。固定。細かい番地付け。 速い。高い。
フロッピ・ディスク。光磁気ディスク。DVD-RAM。DVD-RW。CD-RW。
永続的。読み書き可能。ランダム・アクセス。取り外し可能。荒い番地付け。 遅い。安い。
ハードディスク。
永続的。読み書き可能。ランダム・アクセス。固定。荒い番地付け。 遅い。安い。
CD-ROM。
永続的。読み込み専用。ランダム・アクセス。取り外し可能。荒い番地付け。 遅い。安い。
CD-R (CD Recordable)。
永続的。1度だけ書き込み可能。ランダム・アクセス。取り外し可能。 荒い番地付け。遅い。安い。

◆メモリの値段と速度

速度は、内容が欲しいと思ってから手に入るまでの時間 (遅延、レイテンシ(latency))。
2001/05/10 ごろの話
----------------------------------------------------------------------
媒体		値段	容量	1MB当りの値段	速度
----------------------------------------------------------------------
ハードディスク	1.5万円	3000MB	5円		10ミリ秒(1x10^-3)
CPU		数万円	数100B	1億円		1マイクロ秒(1x10^-9)
SD-RAM		1.2万円	256MB	50円		20マイクロ秒(20x10^-9)
フロッピ	40円	1.4MB	30円		-
CD-RW		120円	640MB	0.18円		ハードドィスクより遅い
CD-R		90円	640MB	0.14円
MO		500円	230MB	2.3円
DVD-RAM		3800円	9400MB	0.4円	
----------------------------------------------------------------------

1997/04/24 ごろの話
----------------------------------------------------------------------
媒体		値段	容量	1MB当りの値段	速度
----------------------------------------------------------------------
ハードディスク	4万円	2000MB	20円		10ミリ秒(1x10^-3)
CPU		数万円	数100B	1億円		5ナノ秒(5x10^-9)
D-RAM		1万円	16MB	625円		50ナノ秒(50x10^-9)
フロッピ	40円	1.4MB	30円		
MO		1000円	230MB	4.3円		30ミリ秒(30x10^-3)
----------------------------------------------------------------------

速度には、(最大)転送速度もある。データをコピーする時の 単位時間あたりのバイト数。

◆CPU (Central Processing Unit)

CPU (Central Processing Unit、中央処理装置、中央演算装置)は、コンピュー タの計算を行う部品である。MPU (Micro Processing Unit) と言われることも ある。

CPU には、数が少ないが、計算の中間結果を置くための高速なメモリ(レジス タ)が入っている。

CPU は、メモリ(主記憶)に入っいているプログラムに従って、やはりメモリ (主記憶)に入っいているデータを操作する。CPU が実行できるプログラムは、 機械語と呼ばれる。

CPU の種類によって、プログラム(機械語)が違う。 プログラム(ソフトウェア)を買う時には、CPU の種類に気をつける。

  • Pentium
  • PowerPC
  • SPARC
CPU は、コンピュータの速度を決める重要な要素となる。 (CPUだけ速くても他の部品が遅いと、全体として遅くなることがある。)

CPUが速いほど、計算は速い。CPUの速さは、クロックの周波数(単位は、Hz)を 目安にできる。たとえば、500MHz の CPU は、250MHz の CPU の2倍の速度が 出ると期待できる。ただし、CPU の種類が違うと直接的な比較はできない。

1つの機械語は、単純なことしかできない。

  • 足し算、引き算、掛け算、割り算
  • データのコピー
  • 条件判定、繰り返しのための命令(ジャンプ命令)
複雑な仕事も、全て単純な命令の組合わせで実現できる。 1秒間に、クロックの数と同じ程度の数の機械語が実行できる。

コンピュータの処理には、CPU による加工だけでなく、加工を伴わな いコピーもかなり多い。コンピュータの性能を決めるのは、CPU の計算だけで はない。特にハードディスクからメインメモリに対するコピーの速度や、ネッ トワークを経由したコピーの速度も大きな影響を与える。

メインメモリをたくさん積むと、ハードディスクからメインメモリへのコピー の回数が減らせる。前にメインメモリにコピーしたデータを、それだけたくさ ん残しておけるからである。(キャッシング)。

クロックとは、コンピュータの内部でタイミングをとるために使われている、 一定時間ごとに0と1が交代するようになっている電気信号。

◆利用者インタフェース

人間の意思を符号に変えてコンピュータ送る機器。 (コンピュータにとっては、入力装置(I/O装置(input/output)))
  • キーボード
  • マウス
  • マイクロホン&A/Dコンバータ
  • イメージ・スキャナ
  • ディジタル・カメラ
  • 手書き文字認識と音声認識
コンピュータの中のビットパタンを人間が理解するための道具。 (コンピュータにとっては、出力装置。)
  • CRT(cathode-ray tube,ブラウン管)
  • 液晶ディスプレー
  • ブザー
  • D/Aコンバータ&スピーカ
  • 音声合成

■情報量の感覚

<−>時間間隔、空間間隔
1 ビット
白と黒の区別
1 バイト (8ビット)
ヨーロッパ系文字 1 文字。256色。
2 バイト (16ビット)
日本語の漢字 1 文字。60000色。
3 バイト (24ビット)
1677万色(2の24乗)。コンピュータのモニタの画素の色数。
4 バイト (32 ビット)
現在広く使われているコンピュータが 一度に計算できる情報量。整数なら40臆程度まで。
256 ビット (32バイト)
16ドット×16ドットの白黒の画像(ビットマップ)で 漢字 1 文字を表現した時の情報量。
数 k バイト
典型的な電子メール1通の大きさ。数千文字。
8k バイト (8000 バイト、64 k ビット, 64,000 ビット)
1秒間に電話の品質で音声を記録した時の情報量。
1 M バイト (1,000,000 バイト, 8,000,000 ビット)
フロッピディスク1枚に保存できる情報量。
230M バイト
光磁気ディスク(MO)1枚に保存できる情報量。 (230M バイト以外にも、128MB/640MB/1.2GBのMOもある)
64M バイト〜512M バイト
一度にメインメモリに入る量(構成によって違う)
640M バイト (640,000,000 バイト)
CD 1 枚に保存できる情報量。
4.7G バイト (5,000,000,000 バイト)
DVD 1 枚(片面2層)に保存できる情報量。
10 G バイト〜50G バイト
ハードディスクの容量(構成によって違う)

↑[もどる] ←[4月26日] ・[5月10日] →[5月17日]
Last updated: 2001/05/16 23:13:57
Yasushi Shinjo / <yas@is.tsukuba.ac.jp>