女性目閉じる

そもそもなんですが、
音声の符号化とはどういう意味ですか?
会話や通話はアナログの波である。これを、TCP/IP上で通信をするには、0と1で表されるデジタル化をする必要がある。なので、アナログ(Analog)からデジタル(Digital)に変換するA/D変換と考えればよい。また、同時に圧縮技術を使って圧縮もしている。
ここでは、音声の符号化(A/D変換)の流れについて解説する。

過去問(H23秋FE問1)では、次のように述べられている。
A/D変換とは,アナログ信号をディジタル信号に変換することであり,標本化,量子化,符号化の3段階で処理する。

音声信号の符号化の流れは次である。
「標本化→量子化→符号化」

(1)標本化(サンプリング)
アナログ信号において、値をとる、つまり数値化することを標本化という。アナログからデジタルに変換する場合、アナログ周波数の少なくとも2倍で標本化する必要がある。 
サンプリング
左の図で、■部分でサンプリングするのですが、アナログ周波数と同じ回数だと、明らかに標本回数が少ないですよね。
波の大きさがほとんど分かりません。
【例題:H20NW午前 問36】
帯域が4kHzの音声信号を8ビットでディジタル符号化して伝送する場合、標本化定理に従うと最低限必要とされる伝送速度は何kビット/秒か。

【解説】
標本化定理により、アナログ周波数(4kHz)の少なくとも2倍で標本化する必要がある。4kHzというのは、1秒間に4k(=4000)回振動するとい言う意味である。よって、2倍の1秒間に8k(=8000)回標本化する。1回の標本化につき、音声信号が8ビットで符号化されるので8kx8=64kビット/秒が答えである。

(2)量子化
データの値を決める。アナログは明確な数値ではない。
3.89333・・・ → 3.9 に

(3)符号化(Code Modulation)
量子化によって決めた値を、デジタルデータにする。
単にそのままデータ化するとデータ量が多くなるので、最近では圧縮することが多い。
i)PCM(Pulse Code Modulation) :G.711 、64kbps
ii)ADPCM(Adaptive Differential PCM): 適応差分PCM、G.726、 主に32kbps
iii)CS-ACELP:G.729、8kbps ※CELP(セルプ)には色々な方式がある。携帯電話などでよく利用されている。私が感動した賢い圧縮方式だ。
H20NW午前 問38にCS-ACELPに関する出題がある。
・・・
【例題:H19NW午前問 41】
CS-ACELP(G.729)による8kビット/秒の音声符号化を行うVoIPゲートウェイ装置において、パケットを生成する周期が20ミリ秒のとき、1パケットに含まれる音声ペイロードは何バイトか。

【解説】
・8kビット/秒ということは、1秒間に8000ビット=1000バイトのデータを流す。
・パケットを生成する周期が20ミリ秒ということは、1秒間に50回パケットを出す。1秒(=1000ミリ秒)÷20=50なので。
・1秒間にデータ量○○バイトのパケットを50回出すと、1秒間に1000バイトになる。○○を求めると、1000÷50で20になる。

※慣れてくると、G.729で周期が20ミリだからペイロードが20バイトだなあと思えてくる。また、実際のパケットは20〜60くらいなので、知識による確認もできる。

◆音声符号化のポイント
・符号化の流れ「標本化→量子化→符号化」とそれぞれの意味
・標本化定理
・符号化の計算問題