INFORMATION

お知らせ ページトップの「検索」のほか、サイドバーとページ中段にインデックスを設けています。
お知らせ Stay Healthy and Safe. #NewNormal

Latest Post

おかげさまで500,000アクセスを超えました。

イメージ
 Dear all readers  Even in Covid-19 pandemic situation, nature changes slowly. It's a fruitful autumn in my country. The picture is "Carnation and Rose".    My blog has achieved 500,000 accesses in this month.  The last 400,000 accesses were in Mar 2019. It has 100,000 accesses in a year and a half, an average of 180 daily accesses, and PV becomes further.  I'm just grateful and to express my gratitude to all readers. I appreciate for your continued support and encouragement. Stay Safe 25 Oct 2020 - INORI  読者のみなさまへ  澄み渡る空が時と共に藍から紅のグラデーションアートを作り出すこの季節にひときわ愛着を持ちます。  このたび当ブログは500,000アクセスを超えるに至りました。  前回の400,000アクセスが2019年3月、1年半余で100,000アクセス。1日平均180アクセスを頂いていることになり、PVはそれ以上になります。これはひとえに読者のみなさまのおかげです。本当にありがとうございます。  最近は投稿が滞っておりますが、これからも音楽と音響について筆者の関心事を読者のみなさんと共有できるよう、日々研鑽してまいりたいと考えております。  今後ともご指導ご鞭撻のほど、よろしくお願い申し上げます。 2020.10.25 みのりのころ INORI

コラム MQA技術解説についての私的メモ・ロスレスかロッシーか?



 MQAについてロスレスか?ビット数は?エンコードとは?音質は向上するのか?という巷の主要な疑問について、技術的な材料を元に回答をピックアップし私的な見解・考察を加えました。あくまで技術解説についての私的な観察メモと捉えて下さい。


 ロスレスかロッシーか?


 *当該記事の投稿後、Audio Origamiについて新たな内容が明らかになっています。その内容は別記事で取り上げましたが、当該記事は更新しておりませんでしたので以下、内容を修正しています。

 「Audio Origami(折り紙)」はMQAの圧縮技術を抽象化し2次元で示したものですが(実際は3次元ということ)、そこで使用されているノイズフロアのシャノンダイアグラムを見ますと、弦楽四重奏曲 24bit/192kHzのオーディオライン及びノイズフロアが図示されており(A)0-24kHz, (B)24-48kHz, (C)48-96kHzに区分されています。






 A・B:音楽成分のピークレベル(赤)とその前後のバックグラウンドノイズ・ピークノイズレベル(緑)・平均ノイズフロア(青)より10dB低い検知できるノイズ(オリーブ)・時間的な分解能に影響を与え成分を取り除くと音質低下すると認知されている領域

 C:ほとんどのマイクやスピーカーの通過帯域を超え、ノイズレベルが人間の聴覚閾値を越えるか上下する(緑・青)ほとんど音楽成分がない、しかしサンプリングレートを上げると(A)領域の分解能が向上すると認知されている領域

 P:音楽とノイズカーブが収束する交差周波数。P点を越えると音楽はノイズ成分に埋もれる箇所、30kHz-60kHzの間の40kHzが一般的。

 MQAはシャノンダイアグラムの横軸サンプリングレートと縦軸ノイズレベルとP点を三角形に結んだオレンジ色枠の中のすべての音楽成分を捉えることに着目していると言われています。オレンジ色のトライアングルは音楽的に関連する信号(残りはノイズと静寂)を囲み、全体のコーディングスペース面積の約1/6です。つまりデータレートの5/6が浪費されていると。そこでMQAの「Audio Origami」は以下のようになります。

・Cをカプセル化 (データレートを低減)
・BのノイズフロアへCのカプセルを埋め込み、Bをロッシー圧縮
・AのノイズフロアへBを埋め込み、ロスレス&ロッシー圧縮

 MQAは(C)のデータレートを低減する、つまり(C)の大部分を占めるノイズ・静寂成分は圧縮しないのでロッシーということになります。コンテンツレート48kHz以下の音源は(B)ですのでロスレス&ロッシー圧縮になります。コンテンツレート24kHzまでは可逆と不可逆圧縮の併用ということになりますので、エンコード処理を含む全体で捉えれば圧縮コーデックとしてはロッシーとの認識は妥当だと考えます。(*13)


 このデジタルドメインの範囲でのロスレス概念について、MQAは疑問を呈しています。

 ”「MQAは本当にロスレスですか」という質問はロスレスが最善のものという想定に立っていることが多いのですが、ロスレスがやっていることは単にいくつかのビットを取り出してそれらを時間と場所の異なるところで再生するということです。皆さんが望むのがそれだけなら、FLACで充分でしょうし、MQAの必要はないでしょう。MQAのチームはロスレス圧縮だけでなく、ロスレスプロセスやデータ埋め込みについても理解をしています。(MQAチームが初めてロスレス圧縮システムをインプリしてRIAAにデモを行ったのはFLACが生まれるより10年前のことです。) さらにアナログからアナログへのシステム経路は他の技術要素も加わってもっと精緻です。ロスレスが扱うのはデジタル領域内のデータで、我々の経験では最大の問題はデータをアナログから取り込むところと可聴な損傷を最小に抑えてそれをアナログに戻すところです。この俯瞰図を理解しないと、MQAは奇妙なものに見えるでしょう。MQAが対処しようとしている問題は、アナログ信号を如何にして異なる時間と場所に移動させるかです。そのアナログ信号はミキシング卓で制作者が聴いたものであり、あなたが自分のスピーカーから再生したいと思っているものです。多くの録音及びマスタリング技術者が MQAは従来の方法に著しい改善をもたらし、彼らがオリジナルセッション時に現実に聞いたあるいはそう記憶している音を、またアーカイブ素材の場合はアナログテープレコーダーの音を再現していると証言しています。” (*1)


 つまり録音をアンプ・スピーカーで再生するまでの一連のプロセスにおいてロスを最小化するアプローチがMQAのスタンスであると理解できます。考えてみれば、既存のデジタルメディアのフォーマット再生のプロセスは、A/Dに該当するセクションの情報はフォーマットとは無関係に単に付随的・文学的な情報としか扱われておらず、またD/Aに該当するセクションではA/Dに該当するセクションの情報をリスナーがフォーマットとは別次元で補完する、つまりA/D-D/Aのセクションが別々に機能しています。MQAはそれら既成概念と異なる志向が伺え、コーデック以上のプロセス、哲学であると言われる所以はここにあると考えます。




 MQAは何ビット?



 MQAは24bitの下位ビットからオリジナルの高域情報に非常に近似なものを再構築するとしています。構造は柔軟で24bitから3パターンが視聴できるということです。

・デコーダなしの場合、16bitに切り詰めて視聴
・16bitに切り詰めてデコードされる
・24bitからフルデコードされる

 0〜20kHzのベースバンドではこれらの3パターンがあり、広義には上位16bitは0〜20kHzの範囲の大部分または全部を伝達し、下位ビットはベースバンドの分解能を向上させ周波数範囲を拡張することができる、しかしこれらのビットは”解像度の向上をもたらしビット範囲拡張することではない(*2)”としています。また動的に変化する周波数や信号依存のノイズフロアを有さないという点で、MP3とは完全に異なるとしています。

 さらにデジタルチャンネルでのダイナミックレンジの概算は6.02 x NdB(N=bit数)ですが、より正確にはディザ無しの場合は98.09dB、TPDFディザを使用する場合は93.32dBに減少するそうです。MQAでは広帯域ランダムノイズを含む1Hzの帯域幅で表す雑音スペクトル密度(NSD)が指標として使用され、この測定値はノイズシェーピング、聴覚閾値、データレートとして信号面積(per-root-Hz)を表す図1・2のシャノン・ダイアグラムを扱う場合に役立つとしています。その場合16bitのNSD(雑音スペクトル密度)=-93.32-10 log(22050)= -136.76dBFS/root Hz。(96kHzでは-140.1dBFS、192kHzでは-143.1dBFS) (*3)。

 デジタルドメインでは有効ビット数という概念がありますが、アナログドメインでの指標を採用しているということになりそうです。ただMQAはPCMデジタルドメインのノイズとMQAのノイズを比較しているそうです。




 図3は録音のバックグラウンドノイズをプロットしたもので、60年前の未加工のアナログテープや最新デジタル録音まで含まれているそうです。その中にはマイクや会場の雑音やアナログテープノイズを含むそうで、最良のテープレコーダーのノイズフロアでも16bitのノイズフロアを上回り、20bitPCMがこれらを取り込むには十分で、結果から32bit精度が明確なメリットをもたらさないことが注目としています。

 また個々の録音についてはピークとノイズカーブが三角形を形成しそのタイプ(鋭利・鈍角など)は音源に依存し、この洞察は実際の録音ごとに次の要素があることを考慮することができるとしています。

・音楽が再生される前後に持続するバックグラウンドノイズ 
・スルーレート制限を推測するピークレベル
・信号の可変部分がノイズを下回ると思われる周波数
・シャノンダイアグラムにプロットされたときに、音楽の実際のコンテンツがわかる領域

 図1, 2に戻り、”録音環境のノイズ、 マイクの自己ノイズ(併せてアナログマスターのテープノイズ)などがあるため、音楽の録音では16bit以上のダイナックレンジを得ることすら難しいのが現実で、これに加えて人間が聴くことのできるノイズ中の信号はノイズレベル以下10dBまで(オリーブ色の曲線)であり、19bitから24bitでは重要な情報はなんら伝えられないということになる。(*4)” ということです。


 そこでMQAのビット数ですが、デコーダありの場合、24bitオリジナルでは23bitのダイミックレンジ性能、16bitは15.93bitのダイナミックレンジ性能を確保しているそうです。いずれの場合にも可聴帯域のコンテンツノイズは3-6bit以下、ピュアロスレスモードでは24bit、すべての場合においてMQAのノイズフロアは曲や作品全体で一定としています。デコーダ無しの場合、上記より通常15bit以上ですが、これはコーディングスペースではなく互換性を考慮して制限しているそうです。




 エンコードとは?



 エンコーダ/デコーダが身近にならなければMQAは普及しないとの評価を見聞することがあります。デコーダについては当初ハードウェアのみリリースされていましたが、ソフトウェアデコードが可能になったこと、USB, Ethernetインターフェースを持つモデュールが開発されたこと、さらにDAWプラグインのリリースも予定されていることからデコーダの普及は時間の問題と思われます。

 エンコーダについてはMQAが圧縮コーデックというイメージが先行し、FLACやMP3のようにデスクトップでエンコードできないものかという意見に接しますが、そこには誤解が生じているように思います。エンコードに関する情報はAES論文、JASジャーナルに掲載されたホワイトペーパー、MQAウェブサイトのBob Talksにありますが、それらの中でたとえばBob Talksには音源の出処を探りMQA化していく情報が例示され、ホワイトペーパーには”理想的にはマルチビットコンバーターとモジュレーターを直接接続すればよいが、MQAはこの直接接続を仮想的に作り出すことが出来る(*2)”という記述があり、その一節からはエンコーダが単に圧縮のみを扱うだけでなくその他の機能性がイメージできていました。

 そこに、MQA作品をリリースしているUNAMASレーベル・沢口さんが自社のウェブサイトにエンコード/デコードについて一歩踏み込んだ技術解説をなされています。その一節を以下より引用させて頂きます。



 ”これまでもコンバータやマスタークロック供給、様々なジッター低減といったアプローチで途中の信号は、改善されていますが、MQAは、上流に遡って一番基本となるレコーディング時に使用したA/Dコンバータが持つ時間軸信号構成と同じ信号をMQAデコーダによって補完・修正しエンド・ユーザーの地点でレコーディング時のA/D変換を再現するというのが大きな特徴です。MQAではこれをDe-BlurとかDe-Bleedingと呼んでいます。このためには、音楽制作レーベルやエンジニアから使用したDAWやA/Dコンバータの情報をもらって分析しておかなければなりません。UNAMAS Labelでもエンコードを依頼するときに必ず使用したDAWやA/Dコンバータの機種を付記し、さらにFINAL MIX前の源データ(RAW DATA)のサンプルを提供します。このことでA/Dコンバータとオリジナル録音時のデジタル信号の構成を分析しメタデータ化してMQAエンコードしたFLACが作成されます。こうした手間を面倒に思ったり、何かノウハウが盗まれるのではないか?といった危惧を持つレーベルやメーカだとこの仕組みは、成立しません。 ”( *5)



 すなわち録音まで情報的に遡り、その時点でのA/Dあるいはその周辺の情報、もちろん録音はアナログマスターであったりデジタルドメインであったりとさまざでしょうが、それらから音声信号を再構築する作業がエンコードならば、録音・A/Dにあたるセクション情報がフォーマットと相関していることがわかります。そしてメタデータはMQAフォーマットに内包されデコード時に再現され、A/D-D/Aが一体として機能していることになります。これがつまりMQAがエンドツーエンドのプロセスであるという説明に当たるものだと理解します。

 フルデコードはD/Aを最適化すると説明されていますが、ソフトウェアデコードはパーフェクトではないという理由はここにあると考えます。またエンコードにはスキルが必要との情報がありますが、なるほどデスクトップだけで完結する作業ではないようです。エンコード/デコードのスキームはA/Dのセクション情報まで遡るとされていますが、これらは前例が無いばかりか、MQAがアーティスト・レーベル等の制作側と密接に関わっていることが今までのフォーマット以上に音源の信頼性という観点では担保されているものだと考えます。



 音質は向上するのか?



 MQAの前提は「より効率的にアナログ音楽をデジタルに変換しアナログに戻す」ということ。そのために現代におけるサンプリング理論による音楽信号の統計と人類の神経科学の洞察とを組み合わせているとしています。統計に関しては先述で、そのほか時間領域性能・インパルスレスポンスの向上、サンプリングカーネルの改良、変調ノイズを減少するためにデコーダへの減算ディザの導入等を図っていると言われています。


 ”MQAは「アコースティック・アブソリュート・ゼロ(absolute absolute zero)」以上の信号を保護することを含め、適切な熱制限内でアナログ/アナログ・ロスレスに近づくことを目標として、DACモジュレータまでの「ロス・ツー ・ロスレス」デジタル・パスを提供するように設定されています。” (*6)



 図4はハイレート録音のまとめで明らかになった、多くタイプの音楽に20kHz以上に重要なコンテンツがあるとするものです。”音楽スペクトルの特筆すべき共通点の一つは周波数が上がるにつれ、ときに大きくパワーが衰退します。たとえいくつかの楽器が20kHz以上を出したとしてもトランスペアレントなシステムが再現する必要が必ずしもあるとは言えず、帯域が減少したことを人間が検出できるかが重要なのです。”(*7)


 ”ポイントは、A/D変換時の時間軸情報をMQAエンコード時にメタデータとして取り込みMQAデコード時に同じタイミングでD/Aする仕組みを形成していることになります。なぜインパルス・レスポンスの応答性能が音楽では、大切なのか?これについてもBobは、「これまでハイレゾで追及してきたのは、ハイサンプリングによる周波数領域の拡大でした。しかし音楽成分を分析すると三角図形の分布になっていることがわかります。サンプリング周波数を上げることで周波数領域ではなく変換時のインパルス応答特性やプリエコー・ポストエコーといった時間の滲みを結果的に改善しているのです。」と述べています。我々の聴覚検知は、インパルス・レスポンスまでを検知できるそうです。”(*8)
 ”MQAが折り畳みとその後デコーダーで用いるロスレスの広げ戻しを達成するためにこの「覆い」の下で行う新たな処理の領域についてはこれらの図(*Audio Origami)には描かれていません。例えば、サンプリング・カーネルは新たなもので、環境的・音楽的信号傾向に適合させていて、人間の聴感に適応でき、細かな時間領域分解能を持ちながら、微細ビットのロスレス圧縮の解像度を上げています。MQAではまたend-to-end構造の開発でも雑音変調ゼロ化を達成するためデコーダーに減法ディザー技術を導入しており、他方式とは一線を画しています。” (*9)
 ”MQAではサブトラクティブディザがデコーダーで作用するため、他のフォーマットとは違い、ノイズ変調がなく、また、ロッシーなコーデックとは違い、MQAは決して音楽信号に影響を及ぼすことはなく、音楽信号の特性を厳密に保ち続ける。”


 今まではサンプリングレートを上げてノイズを含めて録音することはリスナーの空間認知(ステレオイメージ、音像・音場など)に関連しているとの曖昧な情報に接していましたが、MQAではサンプリングレートを上げることは可聴帯域での分解能向上に有効であるとの知見を示しています。図1の(B)(C)の領域がそれに該当すると思われ、オレンジ色の三角形のスペクトルを改善することにMQAが着目している内容とは、単にレートを上げるだけではなくサンプリングカーネルの改良やデコードにおけるA/D変換の再現など、複数要素で構成されているのではないかとイメージしています。もっとも音質が向上しているかどうかは主観評価を行うことが身近な材料ではないでしょうか。




 MQAのオプションは?



 MQAは1種類ではなく階層性があるそうです。言い換えれば拡張性なのかもしれませんが、デコード(アンフォールディング)に44.1-48kHzファミリーでの階層性がありますので、階層性という言葉自体にMQAのコンセプトと機能性の含意があると言えるのではないかと思います。


 ”・チャンネル数は2以上にスケールアップ可能。
・2x以上でサンプリングされた音楽の場合、プラットフォームに合わせてアンフォールディングを決定することで、再生サンプルレートを階層的に最適化することができます。
・転送レートは1x、2x、4x、8xにスケール可能。これまで1xに集中していたのは現在市販されている録音の配信には1xが充分効率的だったから。
・1xの転送レートは低いデータ転送速度と高い後方互換性を提供。高度な録音に対しては若干の制約があります。
・アーカイブや高度な配信には転送レートを2x、4xにでき、それに比例して周波数特性と帯域幅は拡張されます。”(*11)


 
 図5はさまざまなファイルタイプ(すべてMQAと総称される)をまとめたもので、MQLファイルは転送レートの少なくとも2xの元のサンプルレートを持ち、1つのロスレスフォールドを含む。エンカプセル化を含むこともできるとしています。アーカイブは無制限であるべきですが、時間精度で50kHz以上を再生できる現行の再生システムは非常に稀で研究機関にあるそうです。また記載されている周波数はサンプリング周波数ではなくオーディオ周波数で、マスタリングエンジニアは通常24kHz以下の19.5-23bitノイズフロアのオプションを選択できるとしています。(*12)

 転送レートは一般的には1xですが、特定用途向けに拡張できるという点は将来性に期待できるオプションです。


 以上がMQAについての主な疑問への説明と回答についてまとめたものです。文章構成はできるだけ意図が汲み取れる範囲で再構成してみました。それでも回答が他の質問への回答と重なる点は特徴で、それだけMQAが機能的に多面・複層的であるものだと考えております。とりわけエンコード/デコード部分についてはStereophile Q&AやJASジャーナルのホワイトペーパーでは専門的でわかりにくかったものを、UNAMASレーベル・沢口氏の踏み込んだ技術解説はわかりやすく、以前より概略が掴みやすくなったと感じているところです。

 MQAは当初、ロスレスかロッシーか?といった圧縮コーデックの側面だけがフューチャーされ、単語は並ぶが理解がなかなか深まらない、いまだその状況は続いているとの認識の下に、あえてなかなかクローズアップされない細部を取り上げてみました。もし今まで知らなかったことが発見できたならばなによりです。また受け止め方の違いや認識の誤りがあるかもしれません。これらはあくまでも私的な観察メモですので、正確性が必要ならば引用した本文をご覧頂きぜひ理解を深めていただきたく思っているところです。



出典引用:*1*4*8*9* UANAMAS LabelがMQAコーディングをなぜリリースするのか? By Mick Sawaguchi C.E.O UNAMAS Label 及び 参考資料:StereophileMQA
*6*7*11*12 MQA: Questions and Answers | Stereophile.com
*2*3*4*10:JAS Journal 2015 Vol.55 No.6 (11月号) MQA (Master Quality Authenticated) 新デジタルコーディング方式 ‐ MQA (Master Quality Authenticated) Bob Stuart, Keith Howard 訳:鈴木 弘明(株式会社ソナ)
*13 コラム 音楽メディアとフォーマット・MQA Part12 Stereophile MQA検証2 Audio Origami 及びMQA技術とMQA-CD制作フロー:MQA Production Seminar 2017




関連投稿

コラム ステレオファイル誌のMQA検証記事・要約
レビュー MQAライブストリーミング解説 - Mick沢口氏インタビュー
コラム なぜMQAコーデックを選ぶのか?
レビュー Mytek Brooklyn DAC+ Part1 リスニング編
レビュー Roon - MQA ソフトウェアデコード、DSP EQ検証
コラム 音楽メディアとフォーマット・MQA Part11 - Stereophile MQA検証1 再構成フィルタ比較
コラム SACD, HDCD, MQA-CD スペック比較考察
レビュー MQA-CD リッピング・デコード検証
レビュー Audirvana Plus 3 - MQA ソフトウェアデコード検証
コラム LINNのMQA批判について
コラム MQAをなぜ探るのか?
レビュー Meridian Explorer2 - MQA





 




コメント

ラベル別INDEX

もっと見る

New Release