【特別企画】ワッツ氏&フランクス氏に聞く
<開発者インタビュー> CHORD「DAVE」が“オーディオ再生の最先端”である理由
そしてDAVEでジッターを測定すると、測定器上は皆無である(【図3】)。ワッツ氏は「DAVEのジッターは1ピコ秒の1/1000レベルに抑えられていて、これは『ジッターがない』と言ってよいレベルです」と語っていた。
24bit/-90.3dBという極めて低いレベルの信号を再生した際のグラフ(【図4】)では、左右chがほぼ均一に信号を再現していることがわかる。雑音もほとんどない。「通常は信号レベルが下がっていくと歪みの割合は増えていくのですが、DAVEでは信号レベルと共に歪みも相対的に下がっていきます」(ワッツ氏)。
■164,000というタップ数を実現するWTAフィルターの実力
もうひとつ、DAVEのサウンドの核として両氏が挙げたのが、独自のFIRフィルターである「WTAフィルター」だ。HugoのWTAフィルターは、26,000というタップ数(演算数)による処理を行っていた。しかしDAVEでは、それを大幅に上回る164,000タップという莫大な処理を行うWTAフィルターが実装された。そして処理アルゴリズムは、膨大なタップ数に最適化するための改善が施されている。開発には9ヶ月を要し、書かれたコードは10万行を超える。一般的なDACにおけるタップ数が100タップ程度と聞くと、DAVEの処理能力がいかに巨大か実感できるはずだ。
WTAフィルターの重要性を語る上で、まずは従来の汎用DACの問題点を説明する必要があるとワッツ氏。「DACの目的は、デジタル信号をアナログ信号に変換することではありません。“デジタル信号を、A/Dコンバーターに入力された元のアナログ信号に復元する”ことが重要なのです。従来型のDACが生成するアナログ信号は、その意味においてかなり大ざっぱなものです。それが音質にも現れます」。
それでは、どうすれば元のアナログ信号により近似するデジタル信号を生成できるのだろうか。「WTAフィルターのタップ数(演算数)を増やすことで、時間領域の精度を上げていけば、音質を向上させることができるのです」(ワッツ氏)。
Hugoの開発時には、音楽再現における時間精度はマイクロ秒の領域で十分だと考えていた。しかし実際には人間の脳は非常に鋭敏で、ナノ秒の領域での時間精度が重要になることが、DAVEの開発過程で明らかになった。
Hugoではサンプリング周波数を16倍にしてFIRフィルターで処理を行い、結果として1.5マイクロ秒という頻度でサンプルを生成できた。DAVEのWTAフィルターでは、サンプリング周波数を合計256倍にしてFIRフィルターを用いることで、88ナノ秒の頻度でのサンプル生成が可能になったという。
この後段では、さらに8倍(合計2,048倍)のオーバーサンプリング処理が行われるため、最終的には9.6ナノ秒ごとのサンプルが生成される。この莫大な処理を実現するために、FPGAにおいて166個のDSPコアを並列駆動しているのだ。
こうしたWTAフィルターの働きにより、アナログ波形に相当する密度を持ち、かつノイズのない、正確な時間精度を持つデジタルデータ生成が可能になる。結果、音のトランジェント、立ち上がりや立ち下がりの精度は大きく向上し、音の生々しさをさらに踏み込んで再現できるようになったという。
■チャンネルあたり20のエレメントで構成されたパルスアレイDAC
WTAフィルターで生成されたデジタルデータを受けとってアナログに変換するのが、パルスアレイDACである。HugoのパルスアレイDACはチャンネルあたり4個のエレメント(フリップフロップ抵抗)で構成されるのに対して、DAVEのパルスアレイDACはチャンネルあたり20個のエレメントで構成されている。
エレメントが4個から20個に増えることで、ジッターやマスタークロックの変動に対する耐性はより強くなるという。ただし、それは単なるエレメント数の問題ではなく、それぞれ最適な設計手法が用いられているとワッツ氏は話す。
ちなみにHugoにおいては「第5世代パルスアレイDAC」と呼称されていたが、となると、DAVEのパルスアレイDACは「第6世代」ということになるのだろうか。
「Hugoで第5世代と言っていたことを忘れていましたね(笑)。エレメントの数が増えただけでなく、様々な最適化も行っていますから、“第6世代”と呼ぶことには問題ないでしょうね」(ワッツ氏)。
24bit/-90.3dBという極めて低いレベルの信号を再生した際のグラフ(【図4】)では、左右chがほぼ均一に信号を再現していることがわかる。雑音もほとんどない。「通常は信号レベルが下がっていくと歪みの割合は増えていくのですが、DAVEでは信号レベルと共に歪みも相対的に下がっていきます」(ワッツ氏)。
■164,000というタップ数を実現するWTAフィルターの実力
もうひとつ、DAVEのサウンドの核として両氏が挙げたのが、独自のFIRフィルターである「WTAフィルター」だ。HugoのWTAフィルターは、26,000というタップ数(演算数)による処理を行っていた。しかしDAVEでは、それを大幅に上回る164,000タップという莫大な処理を行うWTAフィルターが実装された。そして処理アルゴリズムは、膨大なタップ数に最適化するための改善が施されている。開発には9ヶ月を要し、書かれたコードは10万行を超える。一般的なDACにおけるタップ数が100タップ程度と聞くと、DAVEの処理能力がいかに巨大か実感できるはずだ。
WTAフィルターの重要性を語る上で、まずは従来の汎用DACの問題点を説明する必要があるとワッツ氏。「DACの目的は、デジタル信号をアナログ信号に変換することではありません。“デジタル信号を、A/Dコンバーターに入力された元のアナログ信号に復元する”ことが重要なのです。従来型のDACが生成するアナログ信号は、その意味においてかなり大ざっぱなものです。それが音質にも現れます」。
それでは、どうすれば元のアナログ信号により近似するデジタル信号を生成できるのだろうか。「WTAフィルターのタップ数(演算数)を増やすことで、時間領域の精度を上げていけば、音質を向上させることができるのです」(ワッツ氏)。
Hugoの開発時には、音楽再現における時間精度はマイクロ秒の領域で十分だと考えていた。しかし実際には人間の脳は非常に鋭敏で、ナノ秒の領域での時間精度が重要になることが、DAVEの開発過程で明らかになった。
Hugoではサンプリング周波数を16倍にしてFIRフィルターで処理を行い、結果として1.5マイクロ秒という頻度でサンプルを生成できた。DAVEのWTAフィルターでは、サンプリング周波数を合計256倍にしてFIRフィルターを用いることで、88ナノ秒の頻度でのサンプル生成が可能になったという。
この後段では、さらに8倍(合計2,048倍)のオーバーサンプリング処理が行われるため、最終的には9.6ナノ秒ごとのサンプルが生成される。この莫大な処理を実現するために、FPGAにおいて166個のDSPコアを並列駆動しているのだ。
こうしたWTAフィルターの働きにより、アナログ波形に相当する密度を持ち、かつノイズのない、正確な時間精度を持つデジタルデータ生成が可能になる。結果、音のトランジェント、立ち上がりや立ち下がりの精度は大きく向上し、音の生々しさをさらに踏み込んで再現できるようになったという。
■チャンネルあたり20のエレメントで構成されたパルスアレイDAC
WTAフィルターで生成されたデジタルデータを受けとってアナログに変換するのが、パルスアレイDACである。HugoのパルスアレイDACはチャンネルあたり4個のエレメント(フリップフロップ抵抗)で構成されるのに対して、DAVEのパルスアレイDACはチャンネルあたり20個のエレメントで構成されている。
エレメントが4個から20個に増えることで、ジッターやマスタークロックの変動に対する耐性はより強くなるという。ただし、それは単なるエレメント数の問題ではなく、それぞれ最適な設計手法が用いられているとワッツ氏は話す。
ちなみにHugoにおいては「第5世代パルスアレイDAC」と呼称されていたが、となると、DAVEのパルスアレイDACは「第6世代」ということになるのだろうか。
「Hugoで第5世代と言っていたことを忘れていましたね(笑)。エレメントの数が増えただけでなく、様々な最適化も行っていますから、“第6世代”と呼ぶことには問題ないでしょうね」(ワッツ氏)。