アルス・ポエティカ～音と言葉を縫いつける: 35.データの圧縮

2010年8月1日日曜日

35.データの圧縮

同じように音声データを聴けるのなら、データ量は少ない方がダウンロードの時間も少なくても済むし、パソコンでコピーの時間も少なくて済むし、メモリの容量も食わなくて済みます。
特に動画、音声のデータは大きくなりがちなので、一般的にはこれらのデータは圧縮されることが多いのです。

これまで説明してきた音のデジタル化は全く圧縮されていない方法です。CDはこの方法です。これをそのままコンピュータのファイルにすると、WAVという形式になります。
圧縮したデータのファイルとしては、MP3、AAC、WMV等があります。これらは非可逆変換といって、一度圧縮されたデータを元に戻すことは出来ません。
元に戻せない圧縮なんてアリなの、と驚く方もいるでしょう。音声の場合、人間の耳の特性を利用すると、元に戻せなくても（つまり情報を削っても）ほとんど違いが分からないくらいに音を再生することが出来ます。そうすることによって、データのサイズは1/10程度まで減らすことが可能なのです。

では、どうやって音声データを圧縮しているのでしょうか？
一つは、ラウドネスカーブを利用しています。「22.音の大きさ」でも書いたように、周波数の低いところと高いところではレベルが低いと人の耳には聞こえなくなります。この辺のデータを間引きます。聞こえないなら消しちゃえ、ということ。
もう一つは、マスキング効果を利用します。人間は同じ周波数くらいで鳴っている複数の音のうち、音量の大きいほうを聞くという特性があります。これを利用すると、大きな音の周波数周辺のデータを少しくらい削っても、人間は気付くことが出来ません。
とはいえ、圧縮の比率を大きくしていくと、やはり音はだんだん悪くなっていきます。WAVのままが一番良い状態です。自分で録音したデータを後で加工するつもりなら、保存用には非圧縮の状態で取っておくことをお勧めします。

アルス・ポエティカ～音と言葉を縫いつける

2010年8月1日日曜日

35.データの圧縮

0 件のコメント:

コメントを投稿