ネットワークスペシャリスト - SE娘の剣 -

ネットワークスペシャリストの試験対策サイトです。
ネスペ試験の合格体験談、合格のコツ、過去問解説、基礎知識などの情報を掲載します。

カテゴリ:10.アプリケーション層(L5〜L7) > 10.4 音声

携帯電話で活用されている圧縮方式。これによって、圧縮率はかなり高くなった。

文字を送るだけだったら数バイトで送れる。でも人によって音質が違うので、それをコード情報を付けて送る。
例えば、Aさんの音質情報を受信側で事前に登録しおく。Aさんが「こんにちは」と言ったら、送信側は「こんにちは」というわずか10バイトの文字+Aさんのコード情報のみを送る。
受信側は、コード情報を見てAさんということが分かり、「こんにちは」という文字をAさんの音声にする。実際には、AさんBさんという個人ごとの音声情報は持っていない。似ている音声ということになる。よって、携帯で聴いている声は、本人の声ではなく、本人に限りなく近い音質ということになる。

すばらしい。

主に携帯電話で利用される通信方式。

この考えを聞いて、結構感動した。「賢いな」と。

携帯電話は複数人が同時に利用するので、混線しない工夫がいる。有線であれば、通信相手間で物理的に線が分けられているので混線しない。ところが、携帯は電波を利用するので物理的に分離されていない。狭い部屋で100人が同時にしゃべってたら、聞きたい人の声が聞きにくくなることを想定してもらえばよい。
多重化方式には、TDM、FDM、SDM、WDMなど色々ある。
普通思いつくのはTDMだろう。TDMA(Time Division Multiple Access)として、携帯電話で良く利用されている多重化方式である。

100人がしゃべる場合に、時間を区切ってしゃべるのだ。Aさん、Bさん、Cさんと順番にただ、この間隔は短くしないと通話にならない。そこはTDMAがうまくやっている。
CDMAがすごいのは、逆転の発想である。
どうせなら混線させて、同時に通信させちゃえと。
その代り、それぞれに異なるCode(符号)をつけて送ろうと。例えば、Aさんの会話には1番の符号をBさんの会話には2番の符号をつける。聴く側(受信側)は、Aさんの会話だけ聴きたい場合は、1番の符号がついているものだけ取得し、符号をはずす。
(※例えで書いているので、現実とは多少違う面もある。実際にはもっと複雑な処理をしている。)

どうです?すごいと思ったのは私だけですか?

インターネットで利用されるIPプロトコルを使った電話である。

■家庭編
同じキャリアのIP電話サービスを利用している場合は、料金が定額であったり無料であったりとコスト面のメリットが多い。特に遠距離通話に関してはメリットが多い。

■企業編
・企業内のIP電話に関しては、LANケーブルを利用するため、既存のネットワークを有効活用できる。
・また、プレゼンス機能などの付加価値が利用できる。ただ、あくまでも付加価値的なものである。
・既存のWAN回線でデータ通信していると思うが、そこに音声データも載せてしまえば、WANの通信費を安くすることができる。

■問題
・音声品質の問題
・企業においては、電源の問題。PoE対応が必要。
・電話番号の問題・・・原則は050の番号であった。が、最近は0ABJの番号も利用されている。

■IPセントレックス
企業内に設置していたPBXを利用せずに、通信キャリアのPBXをサービスとして利用するものである。いわゆるSaaSである。
メリットは、新規にPBXを構築するに比べて初期費用を抑えることができる。また、運用保守する人材が不足していてもそれを補うことができる。

女性ハテナ
第三世代携帯ってなにが第三世代?
3.9Gも良く分からないけど

そもそも、3Gって?
3Gといっても、「ゴルフ、銀座、ゴマすり」ではない。それは、東野 圭吾さんの「歪笑小説 (集英社文庫)」で述べられている「編集者に必要なのは三つのG」のこと。
IMT2000(W-CDMAまたはCDMA2000)という規格に準拠した携帯のこと。GはGenerationの意味で、周波数が3GHzというわけではない。日本では、FOMAをはじめ、ほとんどが第三世代携帯である。


そもそも世代とは?

・第1世代 アナログ電話
・第2世代 電話のデジタル化 
・第3〜3.5世代 IMT2000(International Mobile Telecommunication 2000)の規格に準じた高速データ通信と高品質の通話。※インターネット、カメラ、音楽、TVなど電話以外の機能が付与は付属としてついているだけ。
・第3.9世代 LTE 2011年ごろ実用化か。TVのハイビジョンが見れる??
第4世代 超高速通信 ※概念のみで、詳しくは調整中の様子。
参考までに、ITUが世代を決めている

Docomoで言うと、ムーバが第二、フォーマが三、Xi(クロッシィ)が4。・・・バツイチではないと山田隆持社長が語られていた。
漫才でいうと、三枝さんやドリフが第一世代、漫才ブームのたけし、さんまなどが第二世代、ダウンタウンやウッチャンナンチャンらが第三世代です。

また、LTE(Long Term Evolution)とは単なる呼び方だけで、携帯の3.9世代の規格である。呼び方だけなので、LTEという言葉そのものにはそれほど深い意味は無い。直訳すると「長い期間の発展」ということだろうか。
以前ドコモはスーパー3Gと呼んでいたらしい。
WiMAXも3.9Gの規格としてITUに認定された。

第三世代と第四世代を結ぶ規格であるため、第3.9世代携帯と呼ばれる。3.5世代ではなく、3.9世代と呼ばれるのは、第4世代に近いという意味からであろう。

女性直立音声が得意な人はとても少ない。
音声をメインで担当しているSE以外は、本質的なところまでは理解していない人が多いであろう。
 かといって、試験では問われるので避けて通ることはできない。
午後胸邯海任蓮∪潴笋6つほどある。その中の1つの設問が音声であったりする。この時、基本的なことを理解していれば十分に戦える。または、だれも解けないのどちらかである。作戦として、基礎の基礎だけはしっかり押さえておきたい。がっつり理解することはやめたほうが効率的と考える。

PBX(Private Branch eXchange)
音声の符号化
IP-PBXのメリット
VoIPとは
音声VoIP化の流れ
IP電話の音声品質を表す指標
音声品質の乱れ
RTP(Real time Transport Protocol)
SIP(Session Initiation Protocol)のシーケンス

PBXはネスペの試験の構成図で、よく登場する。
PBXは構内交換機と訳すことが多い。
1 

そもそも交換機とは何ですか?
何を交換するのでしょう。
たとえば、100人と100人が電話しようと思うと、1対1での電話線を準備すると4950もの電話線が必要になる。
そこで、電話局に電話交換機を設け、線を集約するのである。交換機を設けることによって、一人に1本の電話線があれば、100人で通話をすることができる。その代わり、100人と同時に通信をすることはできなくなる。が、二人以上と同時に通話するニーズはほとんどないので、交換機を使った仕組みは最適だと思う。また、コストメリットがある。
 交換機では、接続先によって、線を振り返る作業がいる。昔はこれらを手作業で行っていた。現在の電話交換機は当然ながら自動で行っている。

 電話交換機はこれまでは電話局内に設置されていたが、企業では独自の交換機を持つようになった。これがPrivateな交換機であるPBXである。
PBXを用いることで、上記の100人の例で述べたと同じようなメリットが得られる。他には、内線通話などのメリットもある。

女性目閉じる

そもそもなんですが、
音声の符号化とはどういう意味ですか?
会話や通話はアナログの波である。これを、TCP/IP上で通信をするには、0と1で表されるデジタル化をする必要がある。なので、アナログ(Analog)からデジタル(Digital)に変換するA/D変換と考えればよい。また、同時に圧縮技術を使って圧縮もしている。
ここでは、音声の符号化(A/D変換)の流れについて解説する。

過去問(H23秋FE問1)では、次のように述べられている。
A/D変換とは,アナログ信号をディジタル信号に変換することであり,標本化,量子化,符号化の3段階で処理する。

音声信号の符号化の流れは次である。
「標本化→量子化→符号化」

(1)標本化(サンプリング)
アナログ信号において、値をとる、つまり数値化することを標本化という。アナログからデジタルに変換する場合、アナログ周波数の少なくとも2倍で標本化する必要がある。 
サンプリング
左の図で、■部分でサンプリングするのですが、アナログ周波数と同じ回数だと、明らかに標本回数が少ないですよね。
波の大きさがほとんど分かりません。
【例題:H20NW午前 問36】
帯域が4kHzの音声信号を8ビットでディジタル符号化して伝送する場合、標本化定理に従うと最低限必要とされる伝送速度は何kビット/秒か。

【解説】
標本化定理により、アナログ周波数(4kHz)の少なくとも2倍で標本化する必要がある。4kHzというのは、1秒間に4k(=4000)回振動するとい言う意味である。よって、2倍の1秒間に8k(=8000)回標本化する。1回の標本化につき、音声信号が8ビットで符号化されるので8kx8=64kビット/秒が答えである。

(2)量子化
データの値を決める。アナログは明確な数値ではない。
3.89333・・・ → 3.9 に

(3)符号化(Code Modulation)
量子化によって決めた値を、デジタルデータにする。
単にそのままデータ化するとデータ量が多くなるので、最近では圧縮することが多い。
i)PCM(Pulse Code Modulation) :G.711 、64kbps
ii)ADPCM(Adaptive Differential PCM): 適応差分PCM、G.726、 主に32kbps
iii)CS-ACELP:G.729、8kbps ※CELP(セルプ)には色々な方式がある。携帯電話などでよく利用されている。私が感動した賢い圧縮方式だ。
H20NW午前 問38にCS-ACELPに関する出題がある。
・・・
【例題:H19NW午前問 41】
CS-ACELP(G.729)による8kビット/秒の音声符号化を行うVoIPゲートウェイ装置において、パケットを生成する周期が20ミリ秒のとき、1パケットに含まれる音声ペイロードは何バイトか。

【解説】
・8kビット/秒ということは、1秒間に8000ビット=1000バイトのデータを流す。
・パケットを生成する周期が20ミリ秒ということは、1秒間に50回パケットを出す。1秒(=1000ミリ秒)÷20=50なので。
・1秒間にデータ量○○バイトのパケットを50回出すと、1秒間に1000バイトになる。○○を求めると、1000÷50で20になる。

※慣れてくると、G.729で周期が20ミリだからペイロードが20バイトだなあと思えてくる。また、実際のパケットは20〜60くらいなので、知識による確認もできる。

◆音声符号化のポイント
・符号化の流れ「標本化→量子化→符号化」とそれぞれの意味
・標本化定理
・符号化の計算問題

IP-PBXのメリット
‘鷭吐枩が不要。・・・配線コストと移設コストの削減
電話とLANが同じ配線なので、共通化できる。また、電話線はPBXから1本ずつ直接接続する必要があるが、IP化するとHUBにつなげばいい。移転のときの費用が安くなる。
※ただし、スイッチに優先制御とPoEが必要になることが多い。

通信コストの削減
時と場合によるが、コスト削減になる。拠点間をIPで接続されているのであれば、その上に音声を乗せることで、音声通話が無料になる。
※ただ、初期コストがかかるので、TCOという観点ではそれほど下がらないことが多い。

アプリケーション連携
ブラウザで設定変更や保守をしたり、ユニファイドメッセージ、プレゼンス(席にいるのか)などの機能連携が期待できる。

(ぞ豺腓砲茲辰討禄藉コスト)
通常PBXは、拠点ごとに必要であるが、IP化すれば、拠点にはルータでいい。拠点からの通話は、拠点ルータを経由してセンタのIP-PBXから発信することが可能。
某銀行は、25店舗にあったPBXをたった3台のIP-PBXに集約した。(雑誌か何かで見た)

(1)VoIPとは
 VoIP(Voice over Internet Protocol)とは、音声をパケット化してIP網で通信する技術である。
 従来のアナログ電話は、RJ11と呼ばれる形状の規格から2wの線で接続していた。
VoIPでは、インターネットやLANで利用するRJ45という形状の8wの線で接続する。※VoIPは、LANケーブルに限っているわけではない。

(2)2種類のデータ
VoIPのデータには、以下の2種類がある。
1)音声データ
 実際の通話をする音声データである。IPパケットで音声を運ぶ。プロトコルはRTPを使う。
4
RTPって聞きなれないですね。
なぜそれを使うのですか?
 TCPはUDPに比べて遅い。音声はリアルタイム性がいるからUDPでおこなう。しかしUDPには順番制御ができない。
 これでは、「こんにちは」が「こんちはに」になってしまう。そこで、順序制御が可能なRTPを使う。RTPはタイムスタンプ情報をもっており、受信側ではそのタイムスタンプによって順番を制御することができる。

2)呼制御
 通話をするには、まずは相手と接続しなければならない。そのための仕組みが呼制御である。H.323やSIPがあるが、最近はSIPが主軸。
 電話は電話番号を利用する。そこで、電話番号とIPアドレスの管理が必要になる。、また、「プルルル」「プ・プ・プ(話し中)」、通話開始と切断、などと、電話ならではの制御が必要。これが呼制御

■参考
試験には関係がない情報
・PBXの機能がCisco Call Manager
・電話機はCisco IP Phone

呼制御プロトコルには、SIPとH.323がある。SIP (Session Initiation Protocol) を直訳すると、「セッションを開始するプロトコル」。セッションを制御する「呼制御」が目的で、実際の通信は別のプロトコルになる。

 試験で問われるのはほとんどがSIPである。
SIPはテキスト形式で記述をするなど、わかりやすいシンプルな仕組みである。一方、SIPはH.323はバイナリ形式で記述するなど、複雑である。ただ、旧来から使われてきた技術である。
過去問(H17年NW午後1問3)にSIPに関する記述があるので紹介する。
〔呼制御プロトコルに関する検討〕
 IETF (Internet Engineering Task Force)は,IPネットワーク上で電話の呼制御を実現するプロトコルとして, SIP (Session Initiation Protocol)の標準化を進めている。  
 図1は,電話端末Xが電話端末Yに発呼してから電話端末Xが呼を切断するまでの,SIPによる呼制御シーケンスを示したものである。
  (中略)
 電話端末がVoIPによる通信を行うためには,通信相手の電話番号から電話端末のIPアドレスを知る必要がある。このアドレス解決手段を提供するのが, SIPサーバである。
 アドレス解決が完了レ通話が開始された状態では,音声ストリームの経路は[ ア ]ので,電話端末とSIPサーバ間は広い帯域を必要としない。したがって,SIPサーバの設置場所に関しては自由度が高い。
 また,SIPは単に通話機能を実現するセションだけでなく,テレビ電話やパソコン(以下,PCという)画面の共有などの機能を実現するセションと組み合わせて利用できるなど,拡張性をもっだプロトコルとなっている。この拡張性は, SIPが通信相手とのセション確立開始時に,[ a ]リクエストのセション記述で,「 イ ]を通知することによって実現している。
 以上のような特長から,今回のコールセンタシステムの呼制御プロトコルとしては,将来のサービス拡張を考え、SIPを採用した。
■正解は以下である。
a INVITE
ア 
・SIPサーバを経由しない。
・電話端末聞で直接送受信される。


・確立を希望するセションの種類
・セションで使用したいメデイア機能
・セションで使用したいプロトコル
1

では、SIPサーバではどんな情報を管理していますか?
ユーザ、電話番号、URI(Uniform Resource Identifier)例としてuser1@XXXX.com、呼の状態(話中なのか) などである。

また、通信においては、電話番号→URI→IPアドレスへの変換が必要となり、SIPがDNSの仕組みを使って、これらを実現する。

このページのトップヘ