8 音信号用電子透かしに関する研究



  電子透かしとは?

    映像や音には冗長性があるため,一部を変形しても人間にはその違いが分かりません.これを利用することで,利用者には知覚できない形でコンテンツ自身 に付加的なディジタル情報を埋め込むことができます.この埋め込まれたディジタル情報を 電子透かし と言います.



     なぜ電子透かしが必要なのか?

      急速なディジタル化とインターネットの普及により, ディジタル化されたコンテンツ(画像・音など)の複写,保存,加工が簡単に行えるようになりました. そのため,コンテンツ製作者の著作権保護やコピー制御等の技術の必要性が増しています.この場合,コンテンツのディジタルデータと不可分な形でこれらの 情報を埋め込まなければ,容易に不正を働くことができます.電子透かしを用いることで,ディジタルコンテンツに著作権情報やコピー制御情報を埋め込むこ とが可能となり,これによりディジタルコンテンツが安全にネットワーク上を往来することが可能となります.




 人間の聴覚特性

    電子透かしを埋め込んだことによる歪を知覚させないようにするためには,人間の聴覚特性を利用します.



     位相変調の検知に関する特性

      人間の聴覚は,音信号を周波数解析して知覚していますが,主に利用されるのはレベルであり, 位相に対しては鈍感であることが知られています.実際,周期的に位相を変化させた音楽信号に対して, 原信号との差が知覚できるのかを判定させる実験を行うと,検知限に関して変調周波数(周期)と 群遅延(最大位相変化量)の間に図のような関係を観測することができます.



      人間の周期的位相変調の検知限 (日本音響学会講演論文集)



     継時マスキングに関する特性

      やかましいところで会話をすると,会話音が周囲の騒音に妨害されて聞き取れなくなります. このように,ある音が他の音の存在によって聞こえ難くなる現象をマスキングと言います. マスキングには,主に2つのタイプがあり,同時に2つの音が与えられた場合に片方が聞こえ難くなる同時マスキングと, 2つの音が継時的に与えられた場合にマスキングが発生する継時マスキングです.さらに継時マスキングには, 先行音が後続音をマスクする順向性マスキングと後続音が先行音をマスクする 逆向性マスキングの2種類が存在します.


      継時マスキング.70dB, 50msの白色雑音による1000Hz, 5msの音のマスキング(Elliotによる)
      [引用:基礎音響工学 城戸健一編著 コロナ社]



 ディジタル音信号用電子透かし埋め込み手法

    これまでに開発した手法を幾つか紹介します.


     周期的位相変調法(2001年8月 応用音響研究会にて発表)

      時>変全域通過フィルタを用いて音楽信号の位相に周期的変調を加えることで,電子透かし情報を埋め込みます. この変調の周期性をキャリアと見立て,さらに変調することで通信の分野で開発された様々な変調通信方式を用いて電子透かし情報を埋め込むことができます.



      【埋め込み処理と検出処理(ノンブラインド検出)のブロック図】


     エコー拡散法

    (2002年5月 ICASSP'2002 で発表,2005年4月 IEEE Trans. on Multimedia に掲載)

      同じ音がわずかな時間差で提示されても1つの音に聞こえることを利用(継時マスキング)し, 人工的にエコーを付加して,エコーまでの時間差を透かし情報とします.これを更に発展し, 1つのエコーではなく複数のエコーにしたのが本手法です. 1つのエコーを生成するには,2つのインパルスからなる信号を原信号に畳み込めばよいのですが, 2つ目のインパルスに代えてPN系列を用いて時間領域で拡散することで,複数のエコーを模擬しています. こうすることで,元のPN系列がないと検出できない(頑健性)各エコー成分のエネルギーを小さくできる(秘匿性)という2つの特性を同時に実現しています.


      【エコー拡散法の概念図】

      青線は直接音を表し,これは原信号そのものに対応します.赤線は単一のエコーであり,青線の音と赤線の音の時間差が小さく, かつ赤線の音がある程度小さければ,赤線の音は聞こえません.そこで,人工的に赤線の音を付加し,青線と赤線の音の時間差を透かし情報に応じて変化させます. 点線は多重エコーを表しており,四方が囲まれた部屋環境を模擬するのであれば,このほうがより自然です.




      【2値の透かしを埋め込むためのエコーカーネル】

      多重エコーの生成は,図の信号を原信号に畳み込むことで実現されます.電子透かし情報を検出する際には, どちらのカーネルと畳み込まれているかを同定する必要があります.原信号が未知の状態では, これらのカーネルを完全な形で取り出すことができないため,近似的な信号を抽出した後, それぞれの遅れ時間に対応する信号と PN 系列との相関を計算することで電子透かし情報が検出されます.




      【多値の透かしを埋め込むために】

      透かしを埋め込む信号を幾つもの時間フレームに区切り,それぞれに2値の電子透かしを埋め込むことで, より多くの情報量を音信号に埋め込むことができます.






     位相多重化
     (2005年2月 IEEE Trans. on Signal Processing に掲載)

      マ>ルチメディアコンテンツにおいては,著作権情報やコピー管理情報などの複数の透かし情報を一緒に埋め込めることが望まれます. 音楽メディアにおける透かしの代表的な用途として,「著作権管理情報」,「コピー管理情報」,「個人ID」の3種類が考えられるため, これらの透かし情報を多重化して埋め込む方式を提案しました. 本手法では,透かしの埋め込み方式に周期的位相変調法を用いています. コピー管理情報は,ユーザーの使用する装置で必要になる情報ですので,ブラインド検出(原信号を必要としない検出)が可能である必要があります. 一方,その他の二つは管理者が必要とする情報ですので,ノンブラインド検出を想定することも可能です.これらの要件を考慮して, それぞれの変調方式として,FSK と PSK を採用するとともに,PSK と相性の良いトレリス符号で電子透かしを符号化することで, データ圧縮処理などへの高い耐性も実現しました.

      【透かし情報の割り当て】
        変調周波数 変調方式
      著作権管理情報
      21.5 Hz
      PSK
      コピー管理情報
      43.1, 60.9, 86.1 Hz
      FSK
      個人ID
      10.8 Hz
      PSK


 今後の発展


     新しい透かし埋め込みアルゴリズムの開発

      位相や継時マスキング以外の聴覚特性を利用した,新たな埋め込み手法の開発や,同じ位相やマスキング現象を利用するにしても, 従来とは違った方法を用いて埋め込むことで,新たな特性を持たせられる手法の開発を目指しています.


     電子透かしの新たな応用分野の開拓

      ディジタルコンテンツ保護以外の電子透かしの利用法を模索しています.例えば,公共空間における非常放送において,聴覚障害者にも放送内容が伝えられるような, 情報シームレス社会実現のための基礎技術のひとつになり得ます.ただし,この場合の音信号はアナログ信号のうえ,空気伝搬する間に様々な歪を受けるため, ディジタル信号の時とは違った様々な厳しい条件を満足することが求められます.


     セキュアなVoIPの実現

      近年,急速に普及し始めた VoIP は,誰もが自由にアクセスできるインターネットを通信路に使用するため,盗聴や改竄の危険性をはらんでいます. この問題に対し,暗号理論ではなく音響信号処理の立場から,高信頼かつ高秘匿性な通信の実現へ向けた研究を進めています.



Last update: 2005.8.12