Professional Documents
Culture Documents
多地点における高品質な遠隔合唱の実現
多地点における高品質な遠隔合唱の実現
高品質な遠隔合唱の実現
広島市立大学大学院
情報科学研究科
岸田 崇志 河野 英太郎 前田
香織
1
はじめに
ブロードバンドネットワークの普
及
遠隔合唱、遠隔レコーディングを行うことも可能な
環境
Mbone の音声会議システ
ム RAT(Robust Audio
Tool)
•品質の悪いネットワークでも高品質な
音声
•多地点同時に複数の人数で会議に参加
で きる
2
RAT の問題点
音声会議用ツールであり、遠隔合唱を行うと
いった事は考慮されていない
音声会議には困らないのだが遅延が大きい
RAT の遅延(片側 200ms )
遠隔合唱を行うには、遅延が小さくなければなら
ない
オーディオデータ
出力バッファに渡
す
遅延が生じる
経過時間 5
RAT での処理
RAT では、マシンの負荷状況に応じてオーディオデバイ
スのバッファリング時間を調節するスケジューリングを
行っている
一定期間オーディオデータを保持し、それをもとに出
力バッファで遅延が生じないようバッファリング時間
を設定する
調節されたバッファリング時間を Cushion と呼ぶ
6
Cushion を決定するパラメー
タ
Cushion のとりうる範囲(固定値)
― 大きくとりぎると遅延が大きくなり、小さ
すぎると音質を損なう可能性がある
History サイズ(固定値)
― オーディオデータの保持数、この数をもと
に負荷計算を行う
できる限り cushion のサイズを安定させ、
小さい値であるものが望ましい
7
各パラメータの概略
入力バッファ
データ量 History サイズ
Cushion
8
各パラメータの概略
入力バッファ
データ量 History サイズ
Cushion
過剰な入力バッファのデータ量を制限
9
Cushion の最適化
Cushion のパラメータが現在の CPU で
は適切なものではない
Cushion のパラメータは、 RAT 開発時
(1997 )の SUN Sparc 10 ワークステ
ーション( 30MHz ~ 80MHz )から算
出
現在の CPU に適応するように見直す必
要がある
10
オーディオデバイスのバッファ時間の推
移
オーディオデバイスのバッファ時間
140
120
100
80
(ms)
120m
60
s
40
20
0
0 20 40 60 80 100 120
経過時間 (sec)
11
オーディオデバイスのバッファ時間の推
移
オーディオデバイスのバッファ時間
140
120
100
80
(ms)
60
40
20
2
0 5ms
0 20 40 60 80 100 120
経過時間 (sec)
12
オーディオデバイスのバッファ時間の分
布
1.E+08
1.E+07
1.E+06
1.E+05
出現頻度
1.E+04
1.E+03
1.E+02
1.E+01
1.E+00
0 5 10 15 20 25 30 35 40
オーディオデバイスのバッファ時間 (ms)
13
パラメータの変更
以下のようにパラメータの変更を行った
RAT RAT-SD
Cushion の範 40ms ~ 0ms ~ 40ms
囲 500ms
History サイ 250 25
ズ
14
History サイズ
60
バッファリング時間の平均値 (ms)
RAT- SD
50
RAT
40
30
20
10
0
0 20 40 60 80 100 120
経過時間 (sec)
15
Cushion の変化
100
90
(b)
80
Cushion (ms)
70 (a)RAT- SD
60 (b)RAT
50
40
30
20
(a)
10
0
0 20 40 60 80 100 120
経過時間 (sec)
16
RAT-SD の評価
遅延時間の測定
主観評価
パケットロスに対してのノイズ
遅延時間
RAT-SD の音質
17
測定の実験環境
RAT-SD の設定
エンコード方式 Linear-16 (無圧
サンプリングレー 縮)
32kHz
ト
チャンネル モノラル
ホスト ホスト
A 送信 B
Ethernet
10Mbps
録音
受信
CPU PentiumⅢ CPU PentiumⅡ
1GHz 300MHz
OS Vine Linux2.1 OS Vine Linux2.1
18
遅延測定結果
往復の遅延時間
RAT [ms] 440
RAT-SD 141
RAT-SD では片側 70.5ms となる
。 343.5m/s とすると、 70.5ms という遅延
音速
は音が 24m 進む距離
大きな舞台で合唱を行うのとほぼ同じ
合唱に十分な遅延時間
19
パケットロスによる
ノイズの主観評価結果
全く気にならな 4
い RAT
3 RAT- SD
評価値
非常に気になる
1
0 1 3 5
パケットロス (%)
RAT と RAT-SD の評価値はほぼ同じ
RAT-SD の改訂による音質の劣化はみられな
い
20
遅延の主観評価結果
全く気にならな
4
い
3
評価値
非常に気になる
1
RAT RAT- SD
21
RAT-SD の音質
15
12
9
人数
6
3
0
アナログ電話 AM放送 FM放送 音楽CD
音質
FM 放送程度といった回答が多い
合唱に十分な音質は確保できている
22
実証実験
広島市立南観音小学校と広島市立白島
小学校で「マメ de がんすプロジェクト
」の実証実験ネットワーク( 10Mbps
広域 LAN) を用いて行った
各地点間はマルチキャストで伝送し、
RAT-SD で使用した帯域は各地点1
Mbps
両校の映像は MPEG2 伝送システムの
MPEG2TS を用いた
23
実験構成図
白島小学校(ソプラノ)
伴奏
伴奏+アル
広島市立大学
ト
ソプラ マメ de がんす 伴奏
ノ ネットワーク
70 ~ 10Mbps Multicast
75ms アルト+ソプ
アル ラノ
ト エンコード方式 Linear-16 (無圧
伴奏
伴奏+ソプラ サンプリングレー 縮)
32kHz
ト
ノ チャンネル モノラル
転送遅延 2.1 ms
南観音小学校 ( アルト)
ジッター 6 ms 24
おわりに
遠隔合唱を行うための音声伝送システ
ムの条件についての検討
音声会議システム RAT の遅延が小さく
なるよう最適化した RAT-SD の作成、
評価
RAT-SD を用いて 2 小学校間で遠隔合
唱を行った
25
今後の課題
CPU 、ネットワークの状況に応じて
Cushion を決定する固定値のパラメータ
を動的に変える
遅延を維持したままでの音質の向上
26
参考資料
27
History サイズと Cushion
入力バッファレベル
History
Cushion
経過時間
28
History サイズと Cushion
入力バッファレベル
History
Cushion
経過時間
29
Cushion について
Cushion は、 (1) 式のように定義される
x
∑ bi > t
i =1
(1)
i バッファ時間
bi バッファ時間 i[ms] かかるブロック数
t 単位時間内に処理するブロックの個数
Cushion は、 (1) 式をみたす最小となる x[ms] と
なる
30
Cushion について
t は History サイズを 25 とすると、 23 となる
バッファ時間が小さいほうから
出現頻度の個数を 23 個カバーする範囲で Cushion を設定する
6
5 23 個
出現頻度
0
26ms
0 5 10 15 20 25 30 35 40
オーディオデバイスのバッファ時間 (ms)
31
Byte - ms 換算
サンプリング周波数32k Hz
→ 一秒間 32000 回標本化
→1ms で 32 回標本化
16bit で量子化
1 サンプル2 byte
1 ブロックでバッファリングに必要な時間
(ms) は
ブロック (byte)÷2÷32 となる
32
転送遅延
18
16
14
12
10
RTT(ms)
0
0 200 400 600 800 1000 1200 1400 1600
パケットサイズ(byte)
33