2018年5月17日、Stereophileのジム・オースティン氏が「
MQA: Aliasing, B-Splines, Centers of Gravity」と題する記事を掲載しました。MQA議論で題材とされるエイリアシングを含むサンプリング理論について技術的な観点からの考察であり、2ページにわたり多くの情報量を含んでいます。該当の記事から引用し意訳させて頂きます。
・
不適切なタイミングで適切なことをしても不適切なことになる -
Joshua Harris
「1940年代後半にクロード・シャノン氏(Claude Shannon)により策定されたサンプリング定理には、重要な要件がありました:サンプリングされた信号は帯域制限される必要があります。つまり、厳格に周波数に上限が必要です。この一つの制限により、シャノンの仕事は顕著な結果をもたらします:2倍のレートでサンプリングするとき、信号にはある区間の2つのサンプルに高域側の周波数が含まれるならば、信号を完全に再現できます。
完全に。この結果はデジタルオーディオの基礎であり、現在まで続いています。音楽を挿入します。」
「しかし、シャノンが
Radio Engineers研修所での論文集”ノイズの存在におけるコミュニケーション”を出版してから60年が経ち(脚注1)、サンプリング理論は進化しました。新しい取組みはほとんどすぐに始まり、数学者や数学に熟練したエンジニアが成し遂げました;たしか1949年1月には初版が出されました。しかしシャノンの仕事はデジタルオーディオコミュニティに受け入れられましたので、オーディオにおいてシャノンのサンプリング理論はほとんどすべてのデジタルの基礎となり、ポスト・シャノンの仕事は消え続けていました。ポスト・シャノンサンプリングがデジタル・シグナル・プロセッシングに適用された1990年代において、ほとんど全てが映像情報、メージングに焦点が当てられました。ほんの一握りの例外を除いて、オーディオの世界で忘れ去られていました。」
「ポスト・シャノンサンプリング理論は信号をサンプリングするときのシャノンの要件を緩和します。例えば録音において、サンプリングレートの半分に帯域制限すること。この制限を緩和することで、シャノン理論に欠けていた時間領域と周波数領域の対称性が復元されます。より新しい理論では、アンチ・エイリアシングフィルタを使うことは問題ありませんが、必須ではありません。ポスト・シャノンサンプリングはエイリアシングを当然のこととして受け入れ、しかし時間と周波数領域の両方でその影響を最小化します。」
「Master Quality Authenticated(MQA)の製作者であるボブ・スチュアート氏とピーター・クレイヴン氏は数年前、オーディオ関連で同様のアイデアを探求し始めました。最終的にMQAとなった技術(脚注2)を示唆する最初の記事は、いくつかのポスト・シャノンの取組みを示し、
2016年8月に
Stereophileのウェブサイトで"MQA: Questions and Answers,"としたその後の記事で、参照はかなり明示的です。私は疑問に思い始めました:MQAはポスト・シャノンサンンプリング理論の厳密な適用なのか?と。」
「より新しい理論がシャノンのエイリアシングへの厳格な制限を緩和することを考えると、MQAにおけるエイリアシングとその影響についてボブ・スチュアート氏へ技術的なインタビューをすることが合理的な入り口に思えました。インタビューは主にメールで行われ、表現はわずかに圧縮され、軽く編集され、時には注釈付けの形式で示されています。
ジム・オースティン(以下、ジム):MQAはポスト・シャノンサンプリング理論のオーディオ・コーデックへの適用ですか?
ボブ・スチュアート(以下、ボブ):はい。全くその通りです!
ジム:最初の適用ですか?
ボブ:はい。我々が知る限り、最初です。
ジム:ポスト・シャノンサンプリング理論の厳格な適用ですか?
ボブ:はい。そう信じています。MQAは望まし特性の直感的知覚、Bスプラインに基づくサンプリングと再構成の計算、ロスレス的な可逆処理(平坦化による)を合成した確固たる根拠に立っています。そして経験的な観察、音楽的なモデリング、多くの実験の情報に基づいています。
ジム:MQA懐疑論はしばしばエイリアシングに焦点を当てます。MQAをカバーする特許出願によると、あなたは”システム...では...デシメーション・フィルタ応答による非対称成分は、デシメーションの0-7kHzの範囲でエイリアスする周波数で少なくとも32dBの衰退により特徴づけられると”主張しています(脚注3)。この仕様、デシメーションの0-7kHzの範囲でエイリアスする周波数で少なくとも32dBが衰退することは、MQAに実装されていますか?
ボブ:すべてのケースで、MQAデコーダでリスナーが聞くエイリアシングは、引用された
特許請求の範囲に含まれるエイリアシングよりもはるかに下回り、聞き取れないか、または存在しないと主張しています。」
「[主張をテストするために、先ず-10dBFSピークのホワイトノイズを含むFLACファイルに、ノイズより50dB低いトーキングヘッズの”Girlfriend Is Better”から20秒間を貼り付け、20秒毎にレベルを10dB上げていきます。私は1分の箇所でかすかなドラムの音を検知し、ノイズレベルより30dB低く、MQAの仕様で許可されているエイリアスされたコンテンツレベルよりも少なくとも30dB高い音です。ノイズレベルより20dB低く、仕様より40dB高い場合、私は音楽をはっきりと聞くことができました。私のまとめとして:エイリアシングの仕様レベルは聞き取れず、安全マージンで安全です。1/fの音楽信号の代わりにホワイトノイズを使うことは、非常に保守的なテストになります。」
*
記事本文ではテスト用音源が再生できます。
「個人差がありますが、埋め込まれた音声ファイルでご自身でテストして下さい。はじめにノイズだけ聞こえます。しかしそれからノイズレベルの間に音楽が始まります。]」
Page2
ジム:再構成時の上向きのイメージングはどうですか?(*1)
ボブ:適切に処理されていれば、上向きのイメージングにサウンドでのネガティブな影響を持つ必要はありません。とくにイメージが関連する電子機器や変換器の周波数範囲を超えている場合は。そうは言うものの、MQAはスタジオで聞いたことを複製するだけでなく、エンベロープとスルーレートを維持するために、かなり詳細な制限を適用します。
ジム:MQAの主な主張は、デジタル変換で引き起こされる”タイミング・アーチファクト”を除去することで時間的な応答と音質を改良することです。”リンギング”をより少なくし”プリエコー”を無くします。インパルス応答はより短いです。しかし懐疑論は、MQAが設計として受け入れていると思われる(最小にしようとしているが)エイリアシングが、周波数領域だけでなく時間領域でも現れていると指摘しています。そしてそれはあなたとピーター・クレイヴン氏が執筆したMQA関連書から知り得るとしています(脚注4)。これは現実に問題ですか?重要ですか?
ボブ:MQAにおいて、再現されたインパルスの1次モーメント(重心)はいつも正確な場所にあります。オブジェクト抽出の聴覚科学に基づく多くの理由から、1次モーメントが耳に極めて重要であり、高次モーメントはあまり重要ではなく、(重要的なことは)ジッタのような誤差の一因とならならいことが示されていることは妥当と思われます。MQAインパルス応答の前縁形状の変動で生じる可能性のあるタイミング誤差は、間違ったピークで引き起こされる結果の誤差と比較してあまり重要ではありません;我々は1桁分以上の差を考慮しています。
ジム:エイリアシングを制限しているシステムはどのように重心をいつも正確な位置へ置くことができるのですか?前の質問で示唆したように、エイリアシングがタイミング誤差を引き起こす可能性がある場合、どのように可能なのですか?
ボブ:我々は3つの方法で質問に答える必要があります。一般論、MQAに関連する理論、現実論です。
実際に、サンプリング理論の概念は我々が直面する実践的な状況を解決します。
最小位相フィルタのインパルス応答はある特性があります:ゼロから最初のピークまで立ち上がりの時間があります(必ずしも重心と一致するわけではありません);それは減衰部分を有します。それは応答において”エネルギー”と表現されるトータル”領域”(0次モーメント)があります。それは最初から最後までトータル応答時間があります。(アナログまたはIIRフィルタでは無限ですが、一部のデジタルシステムでは有限です;この期間をフィルタの”サポート”と呼びます);それは0Hzの群遅延に等しい量だけ瞬間的な入力後に生じる1次モーメント(および重心=1/0次モーメント)を有します:等々
どのように重心がいつも正確な位置に可能になるのか?シンプルな答えは、これがBスプライン特性であるということです。より完全な答えは、Bスプライン(そしてsinc)サンプリング・カーネルが所謂”Strang-Fix条件”を満たすということです(脚注5)。MQAは再現されたパルスの重心が正確な位置を保つよう設計されています。MQAのカーネルは単純なBスプラインではありませんが、別のフィルタとBスプラインの畳み込みを含んでおり、このBスプライン特性は畳み込み後も残ります。
サンプリング理論における比較的最近の進化は、帯域幅制限されていない信号を処理するか、あるいはもっと正確に言えば、帯域幅と情報コンテンツは同義ではないという事実を両立させようとしています。
我々は
エンドツーエンドシステムのインパルス応答、特徴的な応答(応答特性)、そして平均カーネル応答という用語を一般的に使用しますが、これらが重要な考えを表すに便利な方法を提供すると再強調することは重要です。しかし現実の世界では、空気中にインパルスはありません。インパルスを聞きません。現実に、我々が聞いている全ての信号のパワー・スペクトラムは、これらのテスト信号とは根本的に異なります。音楽、音声、そして環境音において、スペクトル・エネルギーは周波数が上がるにつれ減衰します。そして通常、エネルギー・スペクトラムは我々の”カプセル化”(信号のサンプリングレートがカーネルレートより高いリサンプルを含む)の”ナイキスト周波数”よりも前にシステム・ノイズフロア以下で減衰しています。
エイリアスする信号がなければ、エイリアシングは問題にはなりません。[スチューアト氏強調]
ですから、MQAは再現されたパルスの重心が正確な位置にあることを保つよう設計されています。したがって、重心を推測することでパルスの”タイミング”を判別する耳の範囲内において、MQAはタイミング誤差が全くありません。もし耳が重心から根本的に異なるよう計測すれば不思議なことになりますが、しかし前縁部の始まりのような代わりの測定値はわずかに少しだけ(たとえば2.6µs)異なる結果につながります。192kHzのストリームが96kHzのナイキストにsincフィルタされている場合、比較し約13µsの誤差では耳は13µs離れた最初の正のパルス前部と誤解して捉えます。または、96kHz伝送に備えてストリームが48kHzにsincフィルタされている場合、おおよそ26µsの誤差です。
しかしこの小さな誤差でさえ極めて非現実的なテスト信号です。現実の音楽で、MQAが設計したアプリケーションでは、この影響は単に存在しないか、人間のリスナーにとって重要ではないと我々が考える低レベルに存在します。
ジム:先に、あなたは”エイリアスする信号がなければ、エイリアシングは問題にはならない。”と言いました。これはエイリアスする信号がなければタイムスミア(時間の滲み)自体が起こらないということと同じように本当ではありませんか?
ボブ:エイリアスが”インパルス応答”(アナログでは一様にサンプリングされている場合)に及ぼすどんな偏差も、エンドツーエンドのシステム応答を制御(及び関与)しているフィルターの影響とは全く異なります。後者は、フィルタリングがエイリアシングを適切に制御または除去するかどうかに関わりません。タイムスミアは、周波数とは関わりなく”フィルタ”が時間に合わせてすべてのサンプルを広げるという事実と関係します。とりわけ”現実の世界”では、A/D、ワークステーション、DAC等の量子化(ときにエイリアシング)の影響を考慮します。
このスミアは、オーディオのエンベロープと非線形の測定値はもちろん、複数の相互相関を聞き出す人間のリスナーに重要なものとなり得ると我々は考えます。」
Sidebar1:改善されたMQAエンコーディング
「2018年2月の
StereophileのMQAに関する記事 ”
Into the Fold”では、私はエンコードされていないDXDバージョン(24/352.8)と完全に異なる、MQAエンコードに起因する特定のMQAファイル(2L 2L-078)の計測値を示しました。それはオーディオ帯域にでさえかなりのノイズがあり、しかし注意書きしたように、その違いは聞こえませんでした。その問題の"メーカーのコメント"でボブ・スチュアート氏は、このファイルは "(2015年12月に) MQAで最初にエンコードされたものの1つ"であり "初期のSphynx2コンバータを使用した12のアルバムの1つです;これらの多くは今冬にリマスタリングされる予定で、この記事が掲載するまでに2Lから入手できるはずです。”と説明しました。
図1 スペクトル解析、0Hz〜96kHz、Prolog for Soprano and piano、オレンジとシアンのトレースはMQA(各音楽データとノイズデータ)。レッドとブルーはDXD(各音楽とノイズ)。
再エンコーディングがなされ、新しいファイルが2Lの
オンラインストアへアップロードされたことを2Lのモルテン・リンドベルグ氏に確認後、新しいMQAバージョンをダウンロードしました。前回と同様の計測を行い、元のMQAバージョンに付加していたノイズが新しいMQAバージョンには無いことを確認しました。上に示したのは、新しいMQAバージョンで、エンコードされたDXDバージョンと比較しています。-
Jim Austin」
Sidebar2:カールハインツ・ブランデンブルク氏とMP3について
「Stereophileの2018年3月号の
記事で、カールハインツ・ブランデンブルク氏とフラウンホーファー研究所のMP3促進とファイル共有化の関与において、私はブランデンブル氏自身の美化された記事を不注意にも真似てしまいました。インタビューでは、1997年にオーストリアの大学院生がMP3エンコーダのコピーを購入し、FTPサイトを介してオンラインで共有したとブランデンブルク氏は主張しています;それを先月繰り返しました。しかし、ステファン・ウィット氏の優れた本
How Music Got Free: A Story of Obsession and Invention(Viking Penguin, 2015)では、ブランデンブルク氏と彼のエンジニアチームがMP2や他の競合技術に勝つ最終的に成功した努力のなかで、数年前のオーディオショーでエンコーダを放棄し始めたと強く主張しています。ブランデンブルク氏はしばしばファイル共有に対し反対を述べています。しかしウィット氏の記事が正しければ、ブランデンブルク氏の抜け目のない目論見のビジネス上の意思決定は、2000年代の音楽業界を滅ぼしたファイル共有システムの作成への直接的な関与でした。-
Jim Austin」
「脚注1:
Proceedings of the IRE, January 1949, Vol.37 No.1, pp.10–21. Reprinted in Proceedings of the IEEE, February 1998, Vol.86 No.2, pp.447–45. See
https://web.archive.org/web/20100208112344/http://www.stanford.edu/class/ee104/shannonpaper.pdf を参照して下さい。
脚注2: J. Robert Stuart and Peter Craven, "A Hierarchical Approach to Archiving and Distribution,"
AES Paper 9178 (8 October 2014)。
脚注3: エイリアスされたコンテンツは特定の範囲の通常の音声より32dB低いのではなく、32dB減衰されるという主張を留意して下さい。エイリアシングが通常最も強くなるCDのサンプリングレートでは、この範囲の上方のエイリアシングは約36kHz以下に反映されます。この周波数範囲では、オーディオファイルの音楽はすでにレベルおいて非常に低いです。この仕様が満たされていれば、エイリアスされたコンテンツは7kHzで音楽的情報より少なくとも60dB低いと推定されます。 -
Jim Austin
脚注4:これは脚注2で参照されている論文です。関連テキスト:”周波数領域でのエイリアシングは、最初の刺激がサンプリング時点と比較してどこで示されたかという、インパルス応答の時間領域の現象と同等です:脚注8を参照してください。脚注8の記述:”複雑な問題は、サンプリングのため、トータルシステムは時間並進不変ではなく、そして固有の”インパルス応答”を持たないということです。応答はサンプリングポイントと比較して元のパルスの位置に応じてわずかに異なります。”
脚注5:括弧内の ”(およびsinc)”に留意してください。そしてこのMQAの特性がサンプリングへの通常のシャノン・アプローチ、つまりオールドファッションなPCMによって共有されることを意味しています。Strang-Fix条件とその意味については、Stereophileの”
MQA:質問と回答”を参照してください。 -
Jim Austin」
(*1)上向きのイメージング(upward imaging)についてアトキンソン氏に確認したところ、D/Aした際にサンプリング周波数のその高調波の両側に生成されるイメージのことですと回答がありました。また詳しくはStreophileの過去記事(The 2011 Richard C. Heyser Memorial Lecture: "Where Did the Negative Frequencies Go?" Case Study 3: Digital Recording & Playback : Case Study 3: Digital Recording & Playback)から最初の2つのイラストを
参照して下さいとのこと。
・
今回の記事では懐疑論で指摘されているエイリアシングを取り上げながら、MQAのサンプリング理論について考察しています。先ず、今日のデジタルオーディオの基礎となっているシャノン・サンプリング定理の簡単な説明と概況を示しつつ、ポスト・シャノンサンプリング理論が映像分野で採用されていたという解説。
次に、ポスト・シャノンサンプリング理論を初めてオーディオ分野へ適用したというMQAの主張について、実際には主にメールではありますが、インタビュー形式での掲載を行なっています。ポスト・シャノンサンプリング理論は定理の要件を緩和し、エイリアスを受け入れつつ時間・周波数領域の両方でその影響を最小化すると。そこでオースティン氏は検証に音源テストを採用しています。
Page2では再構成フィルタ(デコード側D/A)についての解説を行なっています。懐疑論で指摘される周波数スペクトルでの上向きのイメージングやそのエイリアシングが周波数領域だけではなく時間領域に影響するのではないかという批判に対し、再構成時にはインパルスの重心がいつも正確な場所にあると解説し、MQAのカーネルについて触れつつ反論を行なっています。
そのMQAのカーネルですが、エンコード側A/D処理と言い換えることができると思いますが、シンプルに言えばBスプライン特性だがそう単純なものではないと述べるスチュアート氏。また”エイリアスする信号がなければ、エイリアシングは問題にはならない”とも述べていることから、従前の特性についてカーネルで事前処理を行なっていることを示唆しているように考えることもできます。
サイドバー1、2については、以前のStereophileにおける記事中の内容を修正しています。前者は拙稿
Part12の後段、後者は
Part13の冒頭で、それぞれ該当の部分の修正前の記事をご覧頂くことができます。よろしければどうぞご参照下さい。
今回は技術的専門性のある記事、しかも引用・参照先の文献も2016年にStereophileに掲載されたボブ・スチュアート氏によるMQA総論や過去のデジタル録音関連の記事のため、それ自体が技術的な内容を含みます。したがって当記事だけ読んでも難しいかもしれませんが、興味深い内容です。理解を深める一助となれば幸いです。
最後に、今回も記事引用の機会を頂きましたStereophileのジョン・アトキンソン氏へ感謝申し上げます。
*「」の引用文は英文を意訳したものです。正確性が必要ならば各本文をご参照下さい。
*斜体は強調文で原文通りに記述しています。
・
コラム 音楽メディアとフォーマット・MQA Part1 - MQAとは?
・
コラム 音楽メディアとフォーマット・MQA Part2 - MQA波及予測
・
コラム 音楽メディアとフォーマット・MQA Part3 - CAのMQA Q&A
・
コラム 音楽メディアとフォーマット・MQA Part4 - 制作者利益について
・
コラム 音楽メディアとフォーマット・MQA Part5 - MQA懐疑論
・
コラム 音楽メディアとフォーマット・MQA Part6 - TIDALのMQA対応
・
コラム 音楽メディアとフォーマット・MQA Part7 - MQAデコード解説
・
コラム 音楽メディアとフォーマット・MQA Part8 - MQA懐疑論的仮説
・
コラム 音楽メディアとフォーマット・MQA Part9 - Bob Talks
・
コラム 音楽メディアとフォーマット・MQA Part10 - ミュージシャンの視点から
・
コラム 音楽メディアとフォーマット・MQA Part11 - Stereophile MQA検証1 再構成フィルタ比較
・
コラム 音楽メディアとフォーマット・MQA Part12 - Stereophile MQA検証2 Audio Origami
・
コラム 音楽メディアとフォーマット・MQA Part13 - Stereophile 文脈によるMQA解説
・
コラム 音楽メディアとフォーマット・MQA Part14 - Stereophile MQAベネフィットとコスト
・
コラム 音楽メディアとフォーマット・MQA Part15 - Stereophile MQAとDRM
・
コラム 音楽メディアとファーマット・MQA Part16 - Stereophile MQA検証3 Bスプライン
・
コラム 音楽メディアとファーマット・MQA Part17 - Stereophile MQA検証4 AD/DA
・
コラム 音楽メディアとファーマット・MQA Part18 - 音楽レーベルの視点から
関連投稿
・
レビュー Roon - MQA ソフトウェアデコード、DSP EQ検証
・
コラム SACD, HDCD, MQA-CD スペック比較考察
・
レビュー MQA-CD リッピング・デコード検証
・
レビュー Audirvana Plus 3 - MQA ソフトウェアデコード検証
・
コラム LINNのMQA批判について
・
レビュー Meridian Explorer2 - MQA
コメント
コメントを投稿