8 音像定位に関する研究


  音像定位とは?

    人間には,2つの耳への入力に基づいて,音を聞いた時に,その音の大きさ,高さ,音色だけでなく, その方向や距離などの空間的な情報も得ることができる音像定位能力があります. これは,聴覚が,音源から両耳に届く音の変化や差異を知覚していることによるものと考えられています. 音像定位の物理的要因を解明し制御できれば,より厳密に音場を再現することができます.




  音像定位の手がかり

音像定位

音像定位の手がかりには以下のものが挙げられます.

  • 両耳に到達した信号間の時間差(両耳間時間差),強度差,(両耳間スペクトル差)
  • 頭や耳たぶなどによる回折で生ずる音波の周波数特性の変化
  • 部屋の壁などによる反射

これらの変化や差異を総合的に含む,頭部伝達関数という物理特性を再現し,音波を模擬すれば, 両耳に到来する2チャネルの音信号によって音場を再現することが可能になります.



     頭部伝達関数
       (Head Related Transfer Function,HRTF)

      反射波が全くない空間(自由空間)における,頭部や耳たぶの影響を含めた, 音源から聴取者の鼓膜までの音の伝達特性を表しています. この頭部伝達関数は,音源と聴取者の相対位置が変化すると特性は異なります. また頭部,耳,肩などの形状により異なるため,個人性があります. そのため,厳密に音場を再現するためには,聴取者本人が音場に行き, (理論的には)聴取者本人を取り巻く無数の方向からの伝達特性を測定する必要があります.

    頭部伝達関数のデータベースへ


           図.頭部伝達関数(HRTF)


     室内伝達関数
       (Room Transfer Function,RTF)

      音波は,音源から放射されたのち,壁に反射したり,障害物を回折したりすることによって変化します. このように,音源の場所や環境の変化によって音波が変化するときの, 音源から受音点までの伝達特性を室内伝達関数(RTF)といいます.


      この2つの伝達関数「HRTF」と「RTF」を合成すれば,様々な環境での音像定位を操ることができ, より高度な臨場感を得ることができます.そうすることで,音を通じて, あたかも自分がその音場にいるような感覚を与えることができるシステムを構築し, より高度なバーチャルリアリティを実現することが可能になります.



  頭部伝達関数の個人化

    上記のように,頭部伝達関数は頭部や耳介の形状の影響を受けるため,大きな個人性があります.

    聴取者本人の頭部伝達関数を用いれば,本人があたかもその音場にいるかのような, より臨場感のあるシステムが実現できます. 一方,他人の頭部伝達関数を用いた場合, 音像方向の誤りが起きる問題点があり,高度な臨場感は得られません.

    しかしながら,3次元全てに渡って頭部伝達関数を測定することは, 測定系の規模や被測定者への負担を考えると非現実的です. また,汎用システムを実現するためには,他人の頭部伝達関数を用いなければならない場合も起こり得ます.

    もし,測定を行わずに他人の頭部伝達関数から合成したり,推定により模擬することができれば, 高精度で汎用的なシステム実現への貢献が期待できます.



     身体特徴量に基づいた個人化


           図.測定した身体特徴量部位

    頭部伝達関数は,聴取者の頭部や耳たぶなどの身体的な大きさや 形状に大きく依存すると考えられることから, 身体的形状から頭部伝達関数を予測することが可能であると考え,検討を行いました.

    そこで,音像の方向定位の手がかりとして重要である 両耳間時間差に着目しました.

    我々は実際のシステムでの応用を考え, 容易に測定可能な,図のような11箇所の身体特徴量を測定し, それらのパラメータを用いて両耳間時間差を予測しました.

    身体特徴量から予測した両耳間時間差を 他人の頭部伝達関数に対して合わせこみ,そのままの他人の頭部伝達関数と比較すると, 他人の頭部伝達関数をそのまま用いるより,本人の頭部伝達関数に近くなる結果が得られました.

    このことから,身体特徴量を用いて両耳間時間差を予測し, 合わせこむことによって,他人の頭部伝達関数を用いても方向定位が改善される可能性があることがわかりました.

    表:本人のHRTF使用時との定位方向角度差
    (全方向についての平均値,単位:度)
    聴取者 他人の両耳間時間差 予測した両耳間時間差
    1 8.8 6.9
    2 11.9 9.9
    3 11.3 9.0


     定位感に基づく個人化


           図.条件ごとの前後誤判断率

    あらかじめ用意した複数人のHRTFを用いて仮想音像を作成し, その中から聴感上最も定位感の良い音像をトーナメント方式によって選択する方法を検討しました. この方法は測定の制約なく短時間で優れた定位感を持つHRTFを取得することができます.

    ‐個人化の方法‐
    複数のHRTFからそれぞれ合成した仮想音像を聴取者に2つずつ提示し,あらかじめ指定された 音像の軌道に近いものを選択させます.この選択をトーナメント方式で行い,最も定位感が良かった音像が残るまで 繰り返します.最も成績が良かった音像のHRTFが本手法によって個人化されたHRTFとなります.

    本手法によって個人化されたHRTFを使った際に, どの程度の定位精度を持つかを以下の3つの条件で定位実験によって検討しました.

    • 本人のHRTFを用いた条件(Own条件)
    • トーナメント方式で個人化されたHRTFを用いた条件(Individualized条件)
    • トーナメントで一度も勝ち抜けなかったHRTFを用いた条件(Away条件)

    それぞれの条件で前後誤判断率(提示した音像と知覚した音像の前後が逆になっている割合)を左図に示しました. この実験結果から,定位感の良い音像をトーナメント方式によって選択することで前後誤判断率は改善し,利用者本人の HRTFと同程度の定位精度を持つHRTFを特定することができました.



  移動音源の定位


       図.訓練群と非訓練群のずれ

音源が移動すると, 音像定位の手がかりとなる両耳間時間差やレベル差は刻々と変化し, 音源と聴取者の相対位置が変化することにより,到来する音の周波数が変化します. 日常で音源が移動するような状況下では,特に視覚障害者にとって, 移動する音源の速度を推定することが重要になります.

そこで,移動する音源の速度を推定する能力の訓練可能性を調べるため,速度見越し検査と呼ばれる検査を行いました. 実験では,音源が右側から聴取者の正面に向かって直線的に接近してきます. そして,正面に来る手前のある位置で音は停止します. 聴取者は,音が停止した後の音源の動きを推測し,正面に来たと感じたときを回答します. 実験では,聴取者の回答と実際の音源位置とのずれを測定しました.この検査を繰り返し行うことにより,速度推定能力を訓練しました.

すると,訓練を行った人の回答の方が, 訓練を行わなかったよりもずれが小さくなるという結果が得られました.


Last update: 2005.11.8