foobar2000のSoX Resamplerの設定

SoX Resamplerが高性能なので、これでCDを24bit/96kHzに変換して聴いてみる事にした。
…CDをリサンプリングせずに聴いた時と比べると、24bt/96kHz音源の音に随分近い音になった。
くぐもった感じや音像のピントが合いきらない感じ、PCオーディオにしてから高域に感じていたシーシーといった安っぽい付帯音等が払拭され、艶のあるキレイな高域が出る。
つまり私が感じていたCDでの付帯音は、DACの性能上取りきれなかった折り返しノイズや量子化ノイズの音だったのだ。
それが非常に高性能で高負荷のアップサンプリング処理をされる事で、可聴帯域外にノイズが持ってかれ、聞こえなくなった訳だ。
しかしやはり、今までもアップサンプリングを試す度に感じた、音が高域寄りになる感じや、音が鈍って迫力が減る感じは出る。
SoXは設定が色々出来るからそれで改善出来るか試してみよう。

以下の3枚のCDをテストに使った。
・(Reference Recordings) Eiji Oue - Respighi Belkis, Queen of Sheba
・(Meister Music) 荒井英治 - パガニーニアーナ
・(claves) Traditional Swiss Musical Instruments
高域が伸びているCD2枚と高トランジェントCD1枚の組み合わせ。
SoXの設定はQuorityはBest(旧VerのVeryHighQuarity)に固定。
まず、Passbandを変化させると、90%に近づける程高域が減退して、99%に近づける程高域が伸びた。
バイオリンの音で顕著だ。
ただし高域が伸びると同時に線が細くなり、「Traditional Swiss Musical Instruments」のカスタネットの音は迫力が無くなっていく。
神経質な音という言い方がピッタリ。
90%は音が暗く感じるが、癖が無く万能感がある。
次はPhase Respose、これは聴感上は0%に近づける程迫力が出た。
上の3枚のCDから離れて普通のRockを聴いた方が判り易かった。
Allow aliasingはチェックを入れた方が音にエッジが出て迫力が増すのだが、ざらざらした感じになる。
どういう効果のある物なのか判断しずらい。
結果は、軟調な音にしたくないという事を重視すると、Passband 90%、Phase Response 0%、Allow aliasingチェック有りが良いと感じた。
この設定だと「Traditional Swiss Musical Instruments」のカスタネットの音もカチカチと歯切れ良く鳴る。
しかし各設定項目の理解が足りなくて、特にAllow aliasingがよく判らないので、これを中心に理屈をもっと調べた方が良いと思った。

とりあえずスペクトラムを取る。
ホワイトノイズ 0dB PB90% 2496
ホワイトノイズ 0dB PB90 2496

ホワイトノイズ 0dB PB90% AA 2496
ホワイトノイズ 0dB PB90 AA 2496

ホワイトノイズ 0dB PPHS
ホワイトノイズ 0dB PPHS

重い荷を背負っては遠くへ行けない」の説明をお借りすると、Allow aliasingは阻止帯域での音圧の抑制が緩くなってナイキスト周波数(CDだと22.1kHz)以上の音声成分が出力に漏れるようになる。
スペクトラムで見ると確かにその通り、ついでにPPHSのノーマルモードはAllow aliasingをチェックした時と同等の処理だという事も判る。
Allow aliasingには処理が軽くなり、リンギングが短くなるという利点がある。
リンギングとは何だろうか?
視覚で解る画像を見つけた。
SoX - Sound eXchange | Resampling (SoXの本家サイトのページ)の最下段、from 44.1kHz to 96kHzから、
rate-44k1-96k.png

こっちの方が解り易いかもしれないので、SRC COMPARISONS(96kHz to 44.1kHz)から、
SOX 14.2.0 VHQ Linear Phase (上の画像の-vsと同じ設定)
SoX14_VHQ_LP.png

SOX 14.2.0 High Quality (上の画像の-vと同じ設定)
SoX14_HQ.png

真ん中のピークを抜いた、両側のビロビロしてる波がリンギング。
時間軸上でピークよりも前がプリエコーで、後はポストエコー。
リサンプルの為には補間関数が必要で、その為に使われるSinc関数は対象位置の前後のサンプルを利用して計算する。
前後のサンプルをたくさん使う程高精度になる。
そしてその対価として処理負荷は増大して、リンギングが長くなる(理屈ではリンギングは無限に続く、ただし収束が速い遅いといった違いは出せる)。
このリンギングが大きく長くなると聴こえてきて、音質的なダメージになる。
SoXでPassbandの数値を上げるデメリットはリンギングの増加で、画像の -vb 99・7(品質 High Quarity、Passband 99.7%と思われる)の凄く長いリンギングは音質的に問題になるだろう。
エコーが掛かった分離の悪い音になると思われる。
逆に -m と -mb 90 (品質 Middle、Passband 95%と90%と思われる)の比較からも見てとれるように、SoXでPassbandを下げるとリンギングが短くなり、音のキレが良くなる訳だ。
ぶっちゃけ、リンギングがアップサンプリングで音が高域寄りになったり、音が鈍って柔らかくなったりする原因だと思う。
エコーを掛けてるのと同じ事だからだ。
(インパルスのような特殊な音波じゃないと、上の画像のようにたくさん出ないので気にならない人は気にしなくて良いです)

そして自分の聴感ではプリエコーが特に音を鈍らせる原因に感じる。
トランジェントの高い音というのは波形が壁のように急に立ち上がるからこその物であって、プリエコーが落差を埋めてしまっては鈍って当然。
SoXでPhase Responseを0%にした時の波形は、画像の-vsM。
立ち上がりは急だが、ポストエコーが2倍の長さになる。
そしてデジタルLPFの特徴の位相が回転しない(群遅延歪みがない)という利点も失われる。
SOX 14.2.0 VHQ Linear Phase
SoX14_VHQ_LP.png

SOX 14.2.0 VHQ Minimum PhaseHigh Quality
SoX14_VHQ_MP.png
ただし人間は高域の位相を感知できないので、これは問題無いと思う。
だいたいスピーカーの高域位相が無茶苦茶だ。

最後にAllow aliasing、画像の -vM と -vMa の比較からリンギングが短くなるのが確認出来る。
Allow aliasingの問題点のダウンサンプリング時に遮断が甘くて漏れた音声成分が下の周波数のノイズになってしまう問題は、アップサンプリングでは起きない。
ただし漏れた音声成分というのは量子化ノイズや折り返しノイズが大部分と思われるので、これが高域を汚す原因になると思う。
音のキレとキレイさのどちらを取るかという2択だ。

という事で理屈と聴感が一致。
各設定項目の効果も十分理解したので、さらに幾つかのCDを聴きこんで決めた設定が、Passband 93.3%、Phase Response 0%、Allow aliasingチェック有り。
ホワイトノイズ 0dB PB93.3 AA PR0 2496
Phase Response 0%にすると50%の時よりも高域が減るように感じる。
Passband 90%と組み合わせるとかなり暗めの音なので、Passbandの数値を上げて好みの明るさに調整したら93.3%になった。
この辺は嗜好やシステムとの相性による調整だ。

最終的に出た音はかなりの物だと感じられた。
CDの高域がこれだけ好みに合った方向で、質が良くなるとは思ってもみなかった。
桁違いの演算性能を持つPCと、細かな調整の出来るアプリの賜物だ。
高度なデジタル処理で最少劣化でアップサンプリング出来るから、後段の11年前の中級DACが生きてくる。
アナログ部に金が掛かってるから、デジタル部だけカバーしてやれば、今でも十分な力を発揮する。
今の音は、ほぼ全ての面で、前に使っていたEsoteric P-70での音を凌駕してると思う。
CDを見限ろうとした途端に過去最高の音でCDが鳴るとは皮肉な物だ。
24bit/96kHz音源漁りの手を止めて思わず昔のCDの音を聴き返してばかりいる。

コメントの投稿

非公開コメント

最新記事
最新コメント
最新トラックバック
カテゴリ
月別アーカイブ
FC2カウンター
リンク
検索フォーム
RSSリンクの表示
ブロとも申請フォーム

この人とブロともになる

QRコード
QR