データを圧縮するとはどういうことか?
【海上忍のAV注目キーワード辞典】第11回:可逆圧縮(ロスレス) − オーディオコーデックの基礎を改めて知る
【第11回:可逆圧縮(ロスレス)】
iPhoneやiPod、および各社DAPの普及もあり、データで音楽を聴くことが当たり前になった現代。そこで重要になるポイントのひとつがMP3やWAVなどのオーディオコーデックだ。
オーディオコーデックはいちど圧縮するとデータが損なわれる「非可逆圧縮」と、圧縮してもオリジナルの状態を保つことができる「可逆圧縮」の2種類に大別できる。今回は、そのうち可逆圧縮について、基本的な考え方と種類について説明しよう。
■「コーデック」が登場した背景
一般的に“音”は、ある物体が空気中で振動することによって発生する。その振動が人間の耳に届き鼓膜を震えさせ、最終的に人間の脳がそれを感知することが“音”の復元過程といえる。
デジタルオーディオにおける“音”も、本来空気中の振動である音を変質させるという点では共通している。現実の音はさまざまな周波数成分が合成された複雑なものだが、デジタル化の過程において標本化(サンプリング)と量子化を伴うため、その時点でわずかとはいえ音が“丸められて”しまう。
しかし、そうしてデジタル化された音データは、0・1/有・無という曖昧さが排除された状態なため、情報としては劣化しない。完全な状態で保管され、0と1の読み取りにエラーが発生しないかぎりは、デジタル化された時点の状態であり続ける。
そのように、一度デジタル化されたデータは半永久的に作成当初の状態を保てるが、そのまま(波形データ/PCM音源)ではデータ量が膨大なため、一般消費者へ配信するには適さない。ハードディスクやメモリカードの容量にも限界があるうえ、インターネットをデジタルデータの流通経路として利用するには、データ量を小さくする必要がある。そこで考え出されたのが「データ圧縮」という概念だ。
■非可逆圧縮の功罪
データ圧縮(符号化/エンコード)は一定の規約に従い処理され、同じ規約に従い復元(復号化/デコード)される。そのエンコードとデコードを担うプログラムが「コーデック」だ。
映像もデジタル化の時代を迎えているが、音楽とはデータ構造が大きく異なるため、それぞれに専用のコーデックが存在する。それも1つや2つではなく、圧縮/展開にまつわる各種の理論、それを規約として制定した企業・団体によって、多数のコーデックが出現するに至った。音楽でいえば、MP3やAAC、Windows Media Audio(WMA)、AC3、ATRAC3など、数え上げればキリがないほどだ。
ここで注意しておきたいのは、上に挙げたコーデックはいずれも「非可逆圧縮」であること。非可逆圧縮とは、多少オリジナルデータを損ねても圧縮効率を重視する方式で、圧縮されたデータを復元しても完全に元どおりにはならない。圧縮時にオリジナルデータの一部が失われてしまうので、音楽の場合は音質の劣化につながることが多い。
ただし、失われるデータの多くは16kHz以上の高音域など人間の聴覚上気付かれにくい部分であり、40Hz〜10kHzあたりの音楽において中核となる周波数帯域はほぼそのまま圧縮されることが多い。どの音域を削るか/削らないかといった音質に大きく影響する部分は、そのまま各コーデックの特徴となっている。
非可逆圧縮は、一部とはいえ圧縮時にデータを永久に失うことから「ロッシー(lossy)」と呼ばれることがある。それに対し以下に説明する可逆圧縮は「ロスレス(lossless)」であり、圧縮/展開に伴うデータの損失がないクオリティ重視のコーデックだ。
■今後は可逆圧縮に注目
可逆圧縮は、まったくデータを損なうことなく圧縮を行う。そのぶん圧縮効率は低下するが、展開すれば完全にオリジナルデータを復元できるため、音楽のコーデックに使えば音質が劣化することがない。その意味では音質重視、クオリティ最優先のコーデックといえる。
現在代表的な可逆圧縮コーデックには、FLAC(Free Lossless Audio Codec)とALAC(Apple Lossless Audio Codec)の2つが挙げられる。FLACは誕生当初から自由に商業利用できるオープンソースソフトウェアとして公開されたため、いち早くオーディオファイル向けに普及し、ネットワークオーディオ機器にも採用が進んだ。
そしてALACは当初Apple製品向けだったが、2011年にオープンソース化、iPhoneなどiOSデバイスとの親和性の高さもあり、現在ではオーディオ機器にも続々と採用が進んでいる。
独立したオーディオデータとして利用されることが多いFLACとALAC以外にも、可逆圧縮コーデックはいくつか存在する。著作権保護付きの高品質オーディオ配信サービスなどで利用されている「WMA Lossless」、Blu-rayタイトルで採用例がある「Dolby TrueHD」や「DTS-HD Master Audio」などがそれだ。
主要な可逆圧縮(ロスレス)コーデック | |
FLAC | 最大192kHz/24bit/8chに対応。エンコード/デコードが比較的高速 |
ALAC | 最大192kHz/24bit/8chに対応。iPhoneなどiOSデバイスが標準で対応する |
WMA Lossless | Windowsで標準対応する「Windows Media Audio」の可逆圧縮コーデック |
Dolby TrueHD | 96kHz/24bit/7.1chまたは192kHz/24bit/5.1ch(※いずれもブルーレイディスクの場合)に対応。Blu-rayタイトルで利用される |
DTS-HD Master Audio |
ブロードバンド化の進行と記録メディアの単価下落が著しい昨今、かつてほどデータ量の小ささが求められなくなり、PCM音源と同じ音質を保ちながらデータ量は約半分という可逆圧縮コーデックが注目を集めるのは、むしろ自然の成り行きといえる。今後、ますます可逆圧縮コーデックが利用される場面が増えるだろう。