You are on page 1of 33

多地点における

高品質な遠隔合唱の実現

広島市立大学大学院
情報科学研究科
岸田 崇志   河野 英太郎  前田 
香織
1
はじめに

ブロードバンドネットワークの普

遠隔合唱、遠隔レコーディングを行うことも可能な
環境
Mbone の音声会議システ
ム RAT(Robust Audio
Tool)
•品質の悪いネットワークでも高品質な
音声
•多地点同時に複数の人数で会議に参加
で きる
2
RAT の問題点
 音声会議用ツールであり、遠隔合唱を行うと
いった事は考慮されていない
 音声会議には困らないのだが遅延が大きい
RAT の遅延(片側 200ms )
遠隔合唱を行うには、遅延が小さくなければなら
ない

Robust Audio Tool with Short Delay


scheduling ( RAT-SD) への改訂
3
遅延について
 元の音と反射して返ってきた音の時間差が
50ms 以上になるとエコーと感じる
 会話で許容できる遅延は 150ms ~ 200ms
以内

合唱では 100ms が許容範囲


遅延 転送遅延
処理遅延 ネットワークバッ
ファ
オーディオデバイスバ
ッファ 4
オーディオバッファの処理の問題
入力バッファ 他のプロセスに処
理を奪われる
データ量

オーディオデータ

読み込み 読み込みに時間がかかる 経過時間


出力バッファ
データ量

出力バッファに渡

遅延が生じる
経過時間 5
RAT での処理

RAT では、マシンの負荷状況に応じてオーディオデバイ
スのバッファリング時間を調節するスケジューリングを
行っている

一定期間オーディオデータを保持し、それをもとに出
力バッファで遅延が生じないようバッファリング時間
を設定する
調節されたバッファリング時間を Cushion と呼ぶ

6
Cushion を決定するパラメー

 Cushion のとりうる範囲(固定値)
― 大きくとりぎると遅延が大きくなり、小さ
すぎると音質を損なう可能性がある
 History サイズ(固定値)
― オーディオデータの保持数、この数をもと
に負荷計算を行う
 できる限り cushion のサイズを安定させ、
小さい値であるものが望ましい

7
各パラメータの概略
入力バッファ
データ量 History サイズ

Cushion

Cushion の範囲 経過時間

8
各パラメータの概略
入力バッファ
データ量 History サイズ

Cushion

Cushion の範囲 経過時間

過剰な入力バッファのデータ量を制限
9
Cushion の最適化
 Cushion のパラメータが現在の CPU で
は適切なものではない
 Cushion のパラメータは、 RAT 開発時
(1997 )の SUN Sparc 10 ワークステ
ーション( 30MHz ~ 80MHz )から算

 現在の CPU に適応するように見直す必
要がある

10
オーディオデバイスのバッファ時間の推

オーディオデバイスのバッファ時間

140
120

100
80
(ms)

120m
60
s
40
20
0
0 20 40 60 80 100 120
経過時間 (sec)
11
オーディオデバイスのバッファ時間の推

オーディオデバイスのバッファ時間

140
120

100
80
(ms)

60
40
20
2
0 5ms
0 20 40 60 80 100 120
経過時間 (sec)
12
オーディオデバイスのバッファ時間の分

1.E+08
1.E+07
1.E+06
1.E+05
出現頻度

1.E+04
1.E+03
1.E+02
1.E+01
1.E+00
0 5 10 15 20 25 30 35 40
オーディオデバイスのバッファ時間 (ms)
13
パラメータの変更

以下のようにパラメータの変更を行った

RAT RAT-SD
Cushion の範 40ms ~ 0ms ~ 40ms
囲 500ms
History サイ 250 25

14
History サイズ
60
バッファリング時間の平均値 (ms)

RAT- SD
50
RAT
40

30

20

10

0
0 20 40 60 80 100 120
経過時間 (sec)

15
Cushion の変化
100
90
(b)
80
Cushion (ms)

70 (a)RAT- SD
60 (b)RAT
50
40
30
20
(a)
10
0
0 20 40 60 80 100 120
経過時間 (sec)
16
RAT-SD の評価
 遅延時間の測定
 主観評価
 パケットロスに対してのノイズ

 遅延時間

 RAT-SD の音質

17
測定の実験環境
RAT-SD の設定
エンコード方式 Linear-16 (無圧
サンプリングレー 縮)
32kHz

チャンネル モノラル

ホスト ホスト
A 送信 B

Ethernet
10Mbps
録音
受信
CPU PentiumⅢ   CPU PentiumⅡ  
1GHz 300MHz
OS Vine Linux2.1 OS Vine Linux2.1
18
遅延測定結果

往復の遅延時間
RAT [ms] 440
RAT-SD 141
RAT-SD では片側 70.5ms となる
。 343.5m/s とすると、 70.5ms という遅延
音速
は音が 24m 進む距離

大きな舞台で合唱を行うのとほぼ同じ
合唱に十分な遅延時間
19
パケットロスによる
ノイズの主観評価結果
全く気にならな 4
い RAT
3 RAT- SD
評価値

非常に気になる
1
0 1 3 5
パケットロス (%)
RAT と RAT-SD の評価値はほぼ同じ

RAT-SD の改訂による音質の劣化はみられな

20
遅延の主観評価結果
全く気にならな
4

3
評価値

非常に気になる
1
RAT RAT- SD

RAT-SD では評価値 3.3 と気にならないといった回答が


多い
遅延は十分に減らすことができている

21
RAT-SD の音質
15
12
9
人数

6
3
0
アナログ電話 AM放送 FM放送 音楽CD

音質
FM 放送程度といった回答が多い

合唱に十分な音質は確保できている
22
実証実験
 広島市立南観音小学校と広島市立白島
小学校で「マメ de がんすプロジェクト
」の実証実験ネットワーク( 10Mbps
広域 LAN) を用いて行った
 各地点間はマルチキャストで伝送し、
RAT-SD で使用した帯域は各地点1
Mbps
 両校の映像は MPEG2 伝送システムの
MPEG2TS を用いた
23
実験構成図
白島小学校(ソプラノ)

伴奏
伴奏+アル
広島市立大学

ソプラ マメ de がんす 伴奏
ノ ネットワーク
70 ~ 10Mbps Multicast
75ms アルト+ソプ
アル ラノ
ト エンコード方式 Linear-16 (無圧
伴奏
伴奏+ソプラ サンプリングレー 縮)
32kHz

ノ チャンネル モノラル
転送遅延 2.1 ms
南観音小学校 ( アルト)
ジッター 6 ms 24
おわりに
 遠隔合唱を行うための音声伝送システ
ムの条件についての検討
 音声会議システム RAT の遅延が小さく
なるよう最適化した RAT-SD の作成、
評価
 RAT-SD を用いて 2 小学校間で遠隔合
唱を行った

25
今後の課題

 CPU 、ネットワークの状況に応じて
Cushion を決定する固定値のパラメータ
を動的に変える
 遅延を維持したままでの音質の向上

26
参考資料

27
History サイズと Cushion

入力バッファレベル
History

Cushion

経過時間

28
History サイズと Cushion

入力バッファレベル
History

Cushion

経過時間

29
Cushion について
Cushion は、 (1) 式のように定義される
x

∑ bi > t
i =1
(1)

i  バッファ時間
bi  バッファ時間 i[ms] かかるブロック数
t 単位時間内に処理するブロックの個数
Cushion は、 (1) 式をみたす最小となる x[ms] と
なる
30
Cushion について
t は History サイズを 25 とすると、 23 となる
バッファ時間が小さいほうから
出現頻度の個数を 23 個カバーする範囲で Cushion を設定する
6

5 23 個
出現頻度

0
26ms
0 5 10 15 20 25 30 35 40

オーディオデバイスのバッファ時間 (ms)
31
Byte - ms 換算
 サンプリング周波数32k Hz
→ 一秒間 32000 回標本化
→1ms で 32 回標本化
 16bit で量子化
1 サンプル2 byte
1 ブロックでバッファリングに必要な時間
(ms) は
ブロック (byte)÷2÷32  となる

32
転送遅延
18

16

14

12

10
RTT(ms)

0
0 200 400 600 800 1000 1200 1400 1600
パケットサイズ(byte)

33

You might also like