找回密码
 -注册-
查看: 369|回复: 11
打印 上一主题 下一主题

旧文重读:专访数字设计师Ed Meitner dsd项目

[复制链接]
跳转到指定楼层
1
发表于 2025-5-30 09:11 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式 来自 中国
本帖最后由 zikomol 于 2025-5-30 09:13 编辑

dsd大神Meitner的采访,搬过来了英文链接:https://positive-feedback.com/Issue11/meitnerinterview.htm
来自 3楼
 楼主| 发表于 2025-5-30 09:49 | 只看该作者 来自 中国
本帖最后由 zikomol 于 2025-5-30 10:40 编辑

核心论点提取,太长不看可以看这下面:

如果你拥有单比特 DSD 格式,(A)你拥有了一种相当健壮的存储方式,(B)你现在可以将其转换成将来可能出现的任何其他格式,PCM 96/24 或无论什么。所以它首先就是一种非常通用的格式。别忘了,你今天在市场上看到的每一个模数(A/D)转换器都是从 DSD 调制器开始的。所以模数转换器上已经有了 DSD 信号,它只是进入了 PCM 抽取滤波器(down sampler or decimator)并被转换成 PCM。因此,音频在数字世界的生命实际上是从一个单比特信号开始的。

所以这(DSD)只是它的一个自然延伸。 没错。所以现在,如果你有一条音频链,从模数转换器出来的是单比特信号,进入存储介质,即硬盘或 AIT(高级智能磁带)。而你的数模(D/A)转换器也相对简单,因为你不需要做任何从 PCM 到比特流的转换。如今大多数转换器都是某种形式的比特流转换器。所以我们只是去掉了 PCM 部分。

所以实际上,DSD 更简单,因为你不需要使用抽取滤波器(decimation filter)进行那种转换来变成 PCM。你只是省去了所有那些额外的步骤。

那么为这种格式设计转换器有哪些挑战?
   实际上,关键在于驱动模数转换器的方式,你必须小心处理那里的模拟电路。在整个数字音频领域,模拟部分是薄弱环节。因此需要高度关注那些必须处理的经典模拟问题和模拟事项。除此之外,真的没什么大魔法。

当您说模拟是链路的薄弱部分时,能再为我详细解释一下吗?

你有一个模拟信号输入模数转换器。它需要以某种方式被处理。可能需要一些增益或增益调整。它可能是平衡输入或单端输入。然后,模数转换器的实际端口需要被相当低阻抗的电路驱动。模数转换器输入端存在一些容性阻抗(reactive impedance),这意味着通常运放(op amps)在那里表现不佳。因此你需要模拟电路能够正常工作并尽力驱动模数转换器的输入。当然,一旦完成了这点,还有电源等问题。
在数模转换端,你有数字部分;换句话说,进入数模转换器的比特流部分必须输出模拟信号。所以同样的问题也存在。在运放或其他模拟电路附近有高频信号。因此你必须非常小心。我认为我的专长就在于那个接口部分:如何将音频传递给模数转换器,以及如何从数模转换器取出音频并再次呈现给外部世界。此外还有时基抖动(jitter)和时钟分配问题,这些都是相对敏感的问题,多年来我已学会处理,并尽可能做到最好。
回复

使用道具 举报

来自 4楼
 楼主| 发表于 2025-5-30 09:51 | 只看该作者 来自 中国
本帖最后由 zikomol 于 2025-5-30 10:31 编辑

现在,DSD 的另一个问题是,你必须使用五阶(fifth-order)噪声整形滤波器(noise shaping filters),将转换过程中产生的噪声移出音频频带。

是的。

您能从设计角度告诉我这带来了什么样的挑战吗?

M:就是我之前说过的。系统存在高频噪声。模拟部分必须处理它,这意味着需要低失真、低噪声、非常高速的模拟电路,能够在 DSD 信号所呈现的那种噪声存在下工作而不产生任何互调产物(intermod products)。

P: 另一件事是,你的输入频带相当宽,大约在直流(DC)到 100 千赫(kilocycles)之间,这也必定带来一些挑战。

M: 是的。这又回到了同一个问题。需要在低噪声、低失真、宽带宽以及驱动能力(例如驱动容性负载,像模数转换器输入)之间进行权衡。而这些权衡通常是相互对立的。

P: 带宽越宽,通常引入的噪声就越多。

Meitner: 没错。是的。

P: 所以当你试图在保持 DC 到 100 kHz 信号的同时,还要挤出 120 dB 的动态范围,这一定相当棘手。

M: 嗯哼。

所以您认为与 PCM 转换器相比,您能以有竞争力的价格制造这些产品?

M: 哦,绝对可以。因为在 PCM 转换器中,你也有许多同样的问题,只是你无法直接看到高频问题。但你仍然可能看到它们表现为互调失真,即使看不到,你也能听出声音不好。而且,你知道,对我非常有帮助的是,多年来我与一家名为 Amber Electro Design 的公司合作,我们制造失真分析仪。

将音频转换为 PCM 是一件非常“非自然”的事情,而如果你看看将音频转换为单比特格式,则是一件非常自然的事情。在任何形式的转换中,你都会丢失一些东西。你必须选择丢失最少的格式,这意味着对音频最友好的格式,这绝对是 DSD 优于 PCM 的地方。
只看 PCM 的一个问题。想象一下在过零点(zero crossing)会发生什么。你所有的比特都在翻转。你知道,如果突然 23 个比特从全零变成全一,系统会产生来自电源的噪声冲击。这在每个过零点都会发生。而且你需要非常好的纠错能力,因为如果在过程中符号位(sign bit)出错,突然间信号本该是正的,却被识别为负的

另一件事是归档我们的录音,这对我来说非常重要,因为旧的录音带正在分解,需要有人对它们做点什么。如果你现在把它们转换成 PCM,你就被钉死在这种格式里了。你永远无法摆脱它。而如果你在单比特域(one-bit domain),在 DSD 域中进行转换,你可以像我之前说的,再把它转换成任何其他格式.

通过使用抽取滤波器和降采样器(down sampler)。所以我们可以获取 DSD 并把它转回 44.1 或 96/24 或任何未来的格式。并且损失更少。 因为那些做 96/24 并试图转换成 44.1 的人最终会丢弃一些东西。
回复

使用道具 举报

来自 5楼
 楼主| 发表于 2025-5-30 09:55 | 只看该作者 来自 中国
本帖最后由 zikomol 于 2025-5-30 10:39 编辑

PCM 是非自然的。是的,它与音频真的没什么关系。你在过零点只有最低分辨率(minimal resolution),而使用 DSD 你拥有最高分辨率(maximum resolution),等等等等。DSD  它是转换过程中转换最少的方式。

而 PCM,您提到过,最大的问题是在最低有效位(least significant bit)附近,也就是过零点;而在 DSD 中,那正是你拥有最高分辨率的地方。

Meitner: 事实上,你有一个非常类似于我们听觉感知的情况。我们主要感知的是速度变化(velocity changes)。而速度变化在正弦波过零点达到最大。所以这正是你需要非常小心的地方。如果你纵观整个高端音频行业,都是甲类(class A)、甲类、甲类。而你知道,那些老式的固态过零失真放大器之类的东西从来就行不通。

Pappas: 因为耳朵在那一刻更敏感。

Meitner: 是的,“最大速度”意味着“最大强度”,也就是我们听得最清楚的点。现在看看 PCM 信号在过零点,在它穿过零点的那个瞬间,你只有零比特分辨率(zero-bit resolution)。你唯一的分辨率是抖动(dither)。
假设你有一个 16 比特系统,其中一个比特是经过抖动处理的。你现在让你的本底噪声(noise floor)以 1 比特量化(quantized),这就是为什么当你转向更高分辨率的音轨或更高分辨率的 PCM 转换器时,人们认为它们更好——它们可能确实更好——但在我看来,它们更好的根本原因是你用更多的比特来量化你的噪声。

在过零点附近任何地方。因为我们知道,随着你的信号电平下降,每降低 6dB,你就失去一个比特。 这就是为什么你在做数字录音时,要尽可能让这东西(电平)接近 0 dB。那么,让我们看一个典型的话放(mike pre-amp),它的等效输入噪声(equivalent input noise)可能是 -131 或 -130 dB。然后我们施加,比如说 40 dB 的增益,这是典型的增益,我想,结果现在的噪声是 -90 dB。现在我们有一个 16 比特的转换器。那个转换器现在将被那个噪声以一到两个比特进行抖动处理(dithered)。所以底部噪声的分辨率是一到两个比特。现在,我们拿一个 20 比特的转换器。突然我们有了相同的情况,相同的本底噪声,只是那个本底噪声现在被五到六个比特量化了,如此类推。所以我称之为“跳舞的比特”(the bits that are dancing)。正是这些比特让你度过了那些你需要分辨率却没有足够比特来处理的时刻。而 DSD 规避了这些问题。

Pappas: 每个人的大脑都如此习惯于让 PCM 代表一个绝对值,而且外面肯定有不少唱反调的人说你做不到(在单比特领域工作)。

Meitner: 是的,嗯,总是有的。问题是,人们痴迷于绝对值,完全忘记了人类感官输入对绝对值不那么敏感,而对变化量(deltas)更敏感,我们的听觉真的没什么不同。所以,你知道,这也是哲学上的一个分歧点:PCM 是绝对的机器,而 DSD 是相对的机器。对我们人类来说,相对的方式更好。我坚信,如果 PCM 不存在,人类的普遍健康会更好。

Pappas: 具体来说,为什么是这样?

Meitner: 因为 PCM 有一种潜意识的刺激性(subliminal irritation),可能以不好的方式影响人们的心理状态,并且肯定分散了聆听音乐的乐趣。如果听音乐被认为是放松,是缓解压力的方式,那么 PCM,像 CD 播放,肯定不如一些老式模拟设备做得好。

回复

使用道具 举报

来自 6楼
 楼主| 发表于 2025-5-30 10:46 | 只看该作者 来自 中国
Meitner: 我认为 24 比特是一堆谎言(crock of lies)。我不知道有多少营销比特(marketing bits)混进了里面。

Pappas: 那么您认为它们实际能提供多少线性比特(linear bits)?

Meitner: 哦,在数字域,我确信它们提供了 24 比特。但当涉及模拟部分,我从未见过能实现 24 比特线性的模拟电路。

Pappas: 所以是营销比特,嗯?

Meitner: 嗯,是的。但同样,你知道,好的一面是至少现在你的噪声量化用了更多的比特。

Pappas: 这提高了你在过零点的性能。

Meitner: 是的,是的。而且通常那些转换器都是基于 Delta-Sigma 调制(delta sigma modulation)类型的设计。

Pappas: 这本质上就是去掉抽取滤波器的 DSD。



Pappas: DSD 的输出有某种标准格式吗?

Meitner: 是 S/DIF。只是它有三根线:同步(sync,即时钟),然后左声道 DSD 和右声道 DSD。所以你当然不会有那种古怪的 S/PDIF,那种你必须从数据和整个数据流中提取时钟的方式,那是另一个抖动问题。也不需要从中推断左右声道。

Meitner: 它是分离的,你知道,时钟、左声道、右声道。

Pappas: 这对尝试从中重构时钟来说是个巨大的区别。

Meitner: 所有这些发烧友的分体式设备?比如一个 CD 转盘加一个转换器?嗯,薄弱环节真的是 S/PDIF。如果它甚至用一根线传输时钟和左/右声道,那会好很多,而不是这种把所有东西都塞在一根线上然后带来所有问题的方式。

Pappas: 非常有趣。所以换句话说,实际上买一台一体机(one-piece unit)可能更好——

Meitner: 哦,是的。哦,是的。

Pappas: 因为你不需要转换成 S/PDIF……

Meitner: 没错。

Pappas: ……然后再转换回来。你可以保持一切……

Meitner: 我认为每次转换,没人能自大到认为不会有任何损失。

Pappas: 所以实际上,使用分体式系统(two-piece system),你进行了两次转换。

Meitner: 没错。没有免费的午餐。
回复

使用道具 举报

来自 7楼
 楼主| 发表于 2025-5-30 11:04 | 只看该作者 来自 中国
本帖最后由 zikomol 于 2025-5-30 11:11 编辑

Pappas: 我喜欢您的术语:“好味道”(good flavor)。在我看来,DSD 是数字工作方式思维的重大转变。我们实际上从 70 年代末就开始做 PCM。我认为 DSD 代表了一种真正的思维转变。我必须假设你们也是沿着同样的思路在思考。

Meitner: 它是“非数字的数字”(undigital digital)。

Meitner: 嗯,你知道,在我们这些知情者中,有过巨大的呼声——为什么 CD 非得设计成那样。你知道,它本可以更好。但我猜那些刻板的工程师们接手了,说:“好吧,我们就这么做。”
Pappas: 嗯,我也认为他们基于当时可用的技术做了几个决定,没有过多考虑未来会发生什么。而且出于很多原因,PCM 在低性能计算机系统上相对容易处理。而且你知道,如果你回到那个时代,拥有 640K RAM 的计算机要价八千美元

Meitner: 对于 44.1(kHz),那个滤波器,所谓的过采样滤波器(oversampling filter)或插值器(interpolator),是一个线性相位(phase linear)器件,对吧?所以你在瞬态(transient)之前有振铃(ringing)。在之后也有振铃。现在,瞬态之前的振铃,我们的听觉系统会预判(anticipating),我们听到的是噪声调制(noise modulation),虽然非常轻微,但刺耳(grating)。我记得无论何时我们在这里播放 CD,我们总是回到一个带模拟滤波器的 1 FS(单倍采样)系统,因为那个模拟滤波器在瞬态之后才振铃。所以你看一个阶跃信号(step),它上升,然后有一些振铃,对吧?然后它在下降时不振铃。换句话说,它不知道信号的未来走向,这是另一个非常“非自然”的部分。在过去的五六年里,我们制造了一种转换器,它有过采样,有数字滤波,但没有振铃。这带来了巨大的不同;DMP 的 Tom Jung 等人可以证明这一点。它是最接近 DSD 的东西。
Meitner:那个转换器是IDAT。基本上我们所做的是制造了一个检测器,当 FIR 滤波器(有限脉冲响应滤波器)遇到麻烦时能检测出来。所以我们能在 FIR 和线性插值(linear interpolation)之间切换。在正弦波上仍然有平坦的 20 kHz 响应。但如果你看一个八倍过采样的插值器会做什么,它会给你平坦的频率响应。这意味着它处理了 sin(x)/x 误差(sine-x-over-x error)。它把误差推到了八倍(频率)之外。所以现在在 20 kHz 处原本下降 3.2 或 3.4 dB 的变成了只下降 0.04 dB。但它只在正弦波上知道怎么做。想象一个瞬态信号来了。它做不到。它现在可能在 20 kHz 处给你带来高达 3.4 dB 的误差。 在瞬态上。

Meitner: 所以你有这个瞬态到来,这些瞬态是幅度调制的(amplitude modulated),但它们被定位在采样系统中,这才是致命的问题。 因此,容忍瞬态上 3.4 dB 的误差但保持该死的瞬态稳定要好得多,而线性插值器永远不会撒谎(lie)。而且我认为,在某种程度上,96/24 如果使用砖墙滤波器(brick wall filters)之类的东西,仍然会有我们讨论的问题。程度不同,但仍然存在。

任何相位均衡滤波器(phase equalize filter)——我不知道你是否记得所有那些数字磁带机,输入必须有一个抗混叠滤波器(aliasing filter)。有些是未经相位均衡的,只是椭圆滤波器(elliptical filter)。然后 Apogee 推出了他们的相位均衡滤波器,声音开始听起来像 CD。你不能把未来引入音频信号。
我不知道人们为什么不抓住这一点,但它如此明显。你加入了一些幅度调制的东西,所有那些说一些混叠(alias)被推到 20 kHz 以上的理论狗屁不值(don’t mean dick),因为你仍然在通带内产生涟漪效应(ripple-down effect)。

这就是为什么我说它是一种潜意识的东西,因为你听不太清楚。在 10、15 kHz 的幅度变化,你听不太出来。但没人真正知道当这种情况长时间持续时会产生什么影响。最恶毒的乐器是小号(trumpet)。你看看小号的信号特征,你有这些曲线非常尖锐的针尖点(fine needle points),具有非常快的转折(turnaround)。嗯,你知道,那个 FIR 滤波器持续处于振铃模式(ringing mode)。有很多谐波分量(harmonic components)。且幅度很高。FIR 不是一个滤波器。它是一个窗口(window)。那个窗口必须有一个有限的开口,问题在于那个窗口里有多少个样本。仍然有太多样本导致了所谓的吉布斯现象(Gibbs phenomenon),也就是振铃。


回复

使用道具 举报

2
 楼主| 发表于 2025-5-30 09:15 | 只看该作者 来自 中国
本帖最后由 zikomol 于 2025-5-30 11:08 编辑

为了方便阅读,以下是ds翻译版

DSD/SACD 革命,第二部分:Positive Feedback 杂志专访数字设计师 Ed Meitner
作者:Mike Pappas

Pappas: 我正在为《Positive Feedback》杂志深入挖掘 DSD 项目的故事。这也是我们进行这次电话采访的原因之一,我希望您能亲口讲述这个故事。我想了解您是如何参与其中的,以及您为何认为这是一个好的方案。

Meitner: 最初是通过 DMP 唱片公司的 Tom Jung,他向索尼的 David Kawakami 推荐了我。我们在去年的 CES(消费电子展)上会面,那是一月份,讨论了是否希望我参与以及我能贡献什么。他们即将在纽约召开 MPGA(音乐出版商协会)会议,这次会议需要一些转换器。同时,在那次 MPGA 会议上,Tom Jung 录制了巴西爵士乐团 Manfredo Fest。我为那次录制制作了第一套转换器。结果效果相当不错,于是我们决定继续合作。索尼需要更多的转换器工作,比如八声道设计之类。我同意做这些,这基本上就是项目的开端。

Pappas: 我们来谈谈您的背景。我是否理解正确,您很久以前,在 80 年代,曾接触过 DBX 系统?

Meitner: 是的,嗯,接触过。当它可用时我研究过它。因为在 70 年代,我曾在一家名为 Olive Electrodynamics 的公司工作。

Pappas: 哦,是的。

Meitner: 我是那里的模拟设计师。

Pappas: 明白了。

Meitner: 我们制造录音棚控制台。

Pappas: 事实上,我相信是其中一些最早实现自动化的型号。

Meitner: 没错,是的。我们使用了来自 Dave Blackmere 的 VCA(压控放大器)。我就是这样认识 Dave 的,我想从那时起我们就成了朋友。

Pappas: 所以那时您就有机会尝试 DBX 系统,它也是一种比特流技术。

Meitner: 嗯,我们那时称之为“Delta Slope”(增量斜率)。另外,在 ADS(Applied Digital Systems)我们拥有一家名为 Delta Labs 的公司。

Pappas: 哦,是的。

Meitner: Delta Labs 完成了该方案的大量原始设计工作。还有 Shure 的 HDS 转换器或 HDS 环绕声系统,也使用了 Delta Slope 调制器和解调器来处理后置延迟。

Pappas: 啊,非常有趣。这么说您在这类数据转换方面有相当长的历史了。

Meitner: 嗯,我还为寻呼终端制造过一些替代盒式磁带(cassette)的设备,我们把那种格式塞进移位寄存器(shift ridges),获得了大约 15 到 20 秒的录制时间。

Pappas: 非常有意思。

Meitner: 显然,你知道,这很快就淘汰了盒式磁带机。

Pappas: 我想也是。

Meitner: 但后来我自己也做了很多研究,它总是会出现。但问题始终是缺乏存储手段;也就是说,比特数太多,除了 U-matic 录像机之类的东西,没什么能存储它。所以它从未真正兴盛起来,直到现在。

Pappas: 您认为这个格式有成功机会的原因之一,除了您认为——我猜您认为它的声音优于 PCM(脉冲编码调制)——是存储和计算机处理能力已经变得足够便宜,使其变得可行。

Meitner: 是的。另外,事情是这样的,如果你试图归档或重新归档模拟磁带和模拟母带……

Pappas: 对。

Meitner: …… 嗯,如果你拥有单比特 DSD 格式,(A)你拥有了一种相当健壮的存储方式,(B)你现在可以将其转换成将来可能出现的任何其他格式,PCM 96/24 或无论什么。所以它首先就是一种非常通用的格式。别忘了,你今天在市场上看到的每一个模数(A/D)转换器都是从 DSD 调制器开始的。所以模数转换器上已经有了 DSD 信号,它只是进入了 PCM 抽取滤波器(down sampler or decimator)并被转换成 PCM。因此,音频在数字世界的生命实际上是从一个单比特信号开始的。

Pappas: 所以这(DSD)只是它的一个自然延伸。

Meitner: 没错。是的。所以现在,如果你有一条音频链,从模数转换器出来的是单比特信号,进入存储介质,即硬盘或 AIT(高级智能磁带)。而你的数模(D/A)转换器也相对简单,因为你不需要做任何从 PCM 到比特流的转换。如今大多数转换器都是某种形式的比特流转换器。所以我们只是去掉了 PCM 部分。

Pappas: 所以实际上,DSD 更简单,因为你不需要使用抽取滤波器(decimation filter)进行那种转换来变成 PCM。你只是省去了所有那些额外的步骤。

Meitner: 正是如此。没错。

Pappas: 那么为这种格式设计转换器有哪些挑战?

Meitner: 实际上,关键在于驱动模数转换器的方式,你必须小心处理那里的模拟电路。在整个数字音频领域,模拟部分是薄弱环节。因此需要高度关注那些必须处理的经典模拟问题和模拟事项。除此之外,真的没什么大魔法。

Pappas: 当您说模拟是链路的薄弱部分时,能再为我详细解释一下吗?

Meitner: 嗯,你有一个模拟信号输入模数转换器。

Pappas: 对。

Meitner: 它需要以某种方式被处理。可能需要一些增益或增益调整。它可能是平衡输入或单端输入。然后,模数转换器的实际端口需要被相当低阻抗的电路驱动。模数转换器输入端存在一些容性阻抗(reactive impedance),这意味着通常运放(op amps)在那里表现不佳。因此你需要模拟电路能够正常工作并尽力驱动模数转换器的输入。当然,一旦完成了这点,还有电源等问题。
在数模转换端,你有数字部分;换句话说,进入数模转换器的比特流部分必须输出模拟信号。所以同样的问题也存在。在运放或其他模拟电路附近有高频信号。因此你必须非常小心。我认为我的专长就在于那个接口部分:如何将音频传递给模数转换器,以及如何从数模转换器取出音频并再次呈现给外部世界。此外还有时基抖动(jitter)和时钟分配问题,这些都是相对敏感的问题,多年来我已学会处理,并尽可能做到最好。

Pappas: 现在,DSD 的另一个问题是,你必须使用五阶(fifth-order)噪声整形滤波器(noise shaping filters),将转换过程中产生的噪声移出音频频带。

Meitner: 是的。

Pappas: 您能从设计角度告诉我这带来了什么样的挑战吗?

Meitner: 就是我之前说过的。系统存在高频噪声。模拟部分必须处理它,这意味着需要低失真、低噪声、非常高速的模拟电路,能够在 DSD 信号所呈现的那种噪声存在下工作而不产生任何互调产物(intermod products)。

Pappas: 另一件事是,你的输入频带相当宽,大约在直流(DC)到 100 千赫(kilocycles)之间,这也必定带来一些挑战。

Meitner: 哦,是的。是的。这又回到了同一个问题。需要在低噪声、低失真、宽带宽以及驱动能力(例如驱动容性负载,像模数转换器输入)之间进行权衡。而这些权衡通常是相互对立的。

Pappas: 带宽越宽,通常引入的噪声就越多。

Meitner: 没错。是的。

Pappas: 所以当你试图在保持 DC 到 100 kHz 信号的同时,还要挤出 120 dB 的动态范围,这一定相当棘手。

Meitner: 嗯哼。

Pappas: 这是否意味着“昂贵”?

Meitner: 不一定。

Pappas: 所以您认为与 PCM 转换器相比,您能以有竞争力的价格制造这些产品?

Meitner: 哦,绝对可以。因为在 PCM 转换器中,你也有许多同样的问题,只是你无法直接看到高频问题。但你仍然可能看到它们表现为互调失真,即使看不到,你也能听出声音不好。而且,你知道,对我非常有帮助的是,多年来我与一家名为 Amber Electro Design 的公司合作,我们制造失真分析仪。

Pappas: 非常好的失真分析仪。

Meitner: 是的,所以我又负责了所有的模拟部分。所以,低失真、低噪声和宽带宽对我来说并不陌生。

Pappas: 业界目前正在推进两种不同的标准。频谱的一端在推动 96/24 PCM,它基本上不过是加强版的 44.1(kHz)……

Meitner: 对。

Pappas: ……而你们则从一个完全不同的角度介入,说:“忘了 PCM 吧。这里有一个更好的解决方案。”

Meitner: 嗯哼。

Pappas: 我理解为什么我认为它是一个更好的格式。告诉我为什么你们认为它是一个更好的格式。

Meitner: 将音频转换为 PCM 是一件非常“非自然”的事情,而如果你看看将音频转换为单比特格式,则是一件非常自然的事情。在任何形式的转换中,你都会丢失一些东西。你必须选择丢失最少的格式,这意味着对音频最友好的格式,这绝对是 DSD 优于 PCM 的地方。
只看 PCM 的一个问题。想象一下在过零点(zero crossing)会发生什么。你所有的比特都在翻转。你知道,如果突然 23 个比特从全零变成全一,系统会产生来自电源的噪声冲击。这在每个过零点都会发生。而且你需要非常好的纠错能力,因为如果在过程中符号位(sign bit)出错,突然间信号本该是正的,却被识别为负的。

Pappas: 那可不太好。

Meitner: 是的。另一件事是归档我们的录音,这对我来说非常重要,因为旧的录音带正在分解,需要有人对它们做点什么。如果你现在把它们转换成 PCM,你就被钉死在这种格式里了。你永远无法摆脱它。而如果你在单比特域(one-bit domain),在 DSD 域中进行转换,你可以像我之前说的,再把它转换成任何其他格式。

Pappas: 通过使用……

Meitner: ……通过使用抽取滤波器和降采样器(down sampler)。所以我们可以获取 DSD 并把它转回 44.1 或 96/24 或任何未来的格式。

Pappas: 并且损失更少。

Meitner: 没错。

Pappas: 因为那些做 96/24 并试图转换成 44.1 的人最终会丢弃一些东西。

Meitner: 嗯,是的,那是一场噩梦。

Pappas: 嗯,如果你相信他们的宣传,那就不是噩梦。

Meitner: 嗯,是一场噩梦。我不相信那套宣传。

Pappas: 他们谈论起来好像没什么大不了的。而我们这些知道 96/24 不能整除 44.1 的人,知道那根本不可行——

Meitner: 是的,但也别忘了,说“数字音频完美永恒”的也是这些人。

Pappas: 你们在这件事上必须承担相当大的风险。让我们……

Meitner: 我不这么认为。

Pappas: 让我们转向更实际的一面。目前世界似乎正朝着扩展 PCM 的方向发展。市面上有很多硬件,虽然很多质量不怎么样,但硬件是存在的。告诉我为什么我不该认为你们处于“追赶”模式。

Meitner: 你说的“追赶”是什么意思?

Pappas: 嗯,在专业音频行业,96/24 有无数供应商提供至少能运行 96/24 的数字音频工作站(DAW)。

Meitner: 是的。他们也是唱反调的人,因为他们投入了这么多既得利益。

Pappas: 我相信 DSD 是一种更好的方式,我基本觉得我们转向 96/24 就像小孩试图在雪佛兰 Chevette 里塞进一个更大的引擎。

Meitner: 没错。

Pappas: 你知道,你仍然有传动系统和底盘的所有限制,也许它能跑快一点点。

Meitner: 看,我总是要回到同一点:你的模数转换器开始它的生命——我应该说音频通过模数转换器开始它的生命——是作为一个单比特或类似单比特的信号,然后你把它搞砸了。

Pappas: 正如您所指的那个过程,PCM 是非自然的。

Meitner: 是的,它与音频真的没什么关系。你在过零点只有最低分辨率(minimal resolution),而使用 DSD 你拥有最高分辨率(maximum resolution),等等等等。

Pappas: 换句话说,DSD 基本上是——

Meitner: 它是转换过程中转换最少的方式。

Pappas: 而 PCM,您提到过,最大的问题是在最低有效位(least significant bit)附近,也就是过零点;而在 DSD 中,那正是你拥有最高分辨率的地方。

Meitner: 没错。

Pappas: 这非常有趣。

Meitner: 事实上,你有一个非常类似于我们听觉感知的情况。我们主要感知的是速度变化(velocity changes)。而速度变化在正弦波过零点达到最大。所以这正是你需要非常小心的地方。如果你纵观整个高端音频行业,都是甲类(class A)、甲类、甲类。而你知道,那些老式的固态过零失真放大器之类的东西从来就行不通。

Pappas: 因为耳朵在那一刻更敏感。

Meitner: 是的,“最大速度”意味着“最大强度”,也就是我们听得最清楚的点。现在看看 PCM 信号在过零点,在它穿过零点的那个瞬间,你只有零比特分辨率(zero-bit resolution)。你唯一的分辨率是抖动(dither)。
假设你有一个 16 比特系统,其中一个比特是经过抖动处理的。你现在让你的本底噪声(noise floor)以 1 比特量化(quantized),这就是为什么当你转向更高分辨率的音轨或更高分辨率的 PCM 转换器时,人们认为它们更好——它们可能确实更好——但在我看来,它们更好的根本原因是你用更多的比特来量化你的噪声。

Pappas: 而这存在于过零点问题中。

Meitner: 嗯,在过零点附近任何地方。因为我们知道,随着你的信号电平下降,每降低 6dB,你就失去一个比特。

Pappas: 对。

Meitner: 这就是为什么你在做数字录音时,要尽可能让这东西(电平)接近 0 dB。那么,让我们看一个典型的话放(mike pre-amp),它的等效输入噪声(equivalent input noise)可能是 -131 或 -130 dB,对吧?

Pappas: 对。

Meitner: 然后我们施加,比如说 40 dB 的增益,这是典型的增益,我想,结果现在的噪声是 -90 dB。现在我们有一个 16 比特的转换器。那个转换器现在将被那个噪声以一到两个比特进行抖动处理(dithered)。对吗?

Pappas: 对。

Meitner: 所以底部噪声的分辨率是一到两个比特。现在,我们拿一个 20 比特的转换器。突然我们有了相同的情况,相同的本底噪声,只是那个本底噪声现在被五到六个比特量化了,如此类推。所以我称之为“跳舞的比特”(the bits that are dancing)。

Pappas: 跳舞的比特(Dancing bits)。

Meitner: 正是这些比特让你度过了那些你需要分辨率却没有足够比特来处理的时刻。

Pappas: 而 DSD 规避了这些问题。

Meitner: 是的。这就是我所说的更友好的转换、转换更少的转换,或者几乎可以说是最小化的转换。

Pappas: 关于时基抖动(jitter)的问题,对 DSD 的影响是否与 PCM 相同?

Meitner: 当然。

Pappas: 好的,那么在抖动性能方面,DSD 没有劣势或优势吗?

Meitner: 没有。抖动仍然是一个重要问题。在我看来,抖动的问题在于很少有人——几乎没有——有分析它的设备。我认为在过去的五六年里——从《Stereophile》杂志采用我们的抖动分析仪那一刻起——我们几乎是唯一真正测量这些东西的人。而且我们的测量方式不仅能让你知道有多少抖动,还能知道抖动中的频率分量是什么。

Pappas: 是那个 LIM 设备吗?

Meitner: 是的。

Pappas: 能给我们一些背景信息吗?我认为这很重要。

Meitner: 基本上,它是一个相位解调器(phase demodulator),你可以在 2FS 到 768FS 范围内观察数字系统中的任何采样频率。在 20 kHz 带宽内,它能给出你的抖动分量以及抖动中的频率分量,这比仅仅知道抖动的实际值更重要。因为如果只是噪声,还没那么糟,但如果里面有与音频无关的分量,嗯,那就是另一回事了。这些“分量”是什么?嗯,典型的是来自 CD 驱动器、卡座的伪迹(artifacts);里面有来自聚焦调整、循迹调整、电机速度调整以及其他各种与音频无关的东西产生的抖动分量。所以这个设备能显示这些分量是什么。

Pappas: 非常有趣。

Meitner: 你知道,当《Stereophile》采用它时,我们同意并承诺,如果我们任何竞争对手想要这个设备,我们会以非常合理的价格提供,我们也确实这样做了。

Pappas: 这个设备的主要优势不仅仅是知道数值,还在于知道抖动分量的频谱?

Meitner: 正是如此。

Pappas: 这要实用得多——

Meitner: 嗯,然后你就能找到问题了。

Pappas: 否则你只是在盲目摸索。

Meitner: 没错。

Pappas: 那么,让我们谈谈未来。似乎有一些供应商正在加入 DSD 阵营,能够提供数字音频工作站(DAW)之类的东西。在 DSD 领域工作,比如构建数字调音台(digital mixing desks),是更容易还是更困难?

Meitner: 真的没什么不同。

Pappas: 好的。

Meitner: 只是需要重新学习。仅此而已。在索尼的演示中,他们有一个纯粹单比特的调音台,包括滤波器等等。

Pappas: 每个人的大脑都如此习惯于让 PCM 代表一个绝对值,而且外面肯定有不少唱反调的人说你做不到(在单比特领域工作)。

Meitner: 是的,嗯,总是有的。问题是,人们痴迷于绝对值,完全忘记了人类感官输入对绝对值不那么敏感,而对变化量(deltas)更敏感,我们的听觉真的没什么不同。所以,你知道,这也是哲学上的一个分歧点:PCM 是绝对的机器,而 DSD 是相对的机器。对我们人类来说,相对的方式更好。我坚信,如果 PCM 不存在,人类的普遍健康会更好。

Pappas: 具体来说,为什么是这样?

Meitner: 因为 PCM 有一种潜意识的刺激性(subliminal irritation),可能以不好的方式影响人们的心理状态,并且肯定分散了聆听音乐的乐趣。如果听音乐被认为是放松,是缓解压力的方式,那么 PCM,像 CD 播放,肯定不如一些老式模拟设备做得好。

Pappas: 所以也许这就是音乐行业销量下滑的原因之一。

Meitner: 有可能。除了这个事实,现在似乎也不是我记得的六七十年代那种场景了。这话很难说出口,但我从很多人那里听说,用黑胶唱片(LP)时,你会坐下来,闭上眼睛,随着音乐飘走,放松并释放压力。而用 CD,感觉完全不一样了。所以即使你可能没有立即听到明显的问题,我相信它们会慢慢磨损你的感受。

Pappas: 您认为另一个原因可能是当你播放一张黑胶唱片时,它通常大约 22 分钟,然后就需要起来换面?

Meitner: 嗯,那也可能是原因。现在有了 CD,你有遥控器。你可以随时更换。但我发现很多人甚至坚持不到 20 分钟。

Pappas: 他们在之前就放弃了。

Meitner: 是的。你知道有趣的是,除此之外,所有从多比特(multi-bit)领域起步的转换器制造商,都转到了单比特(single bit)。飞利浦(Phillips)有他们的比特流(bitstream);看看 DAC 芯片和模数转换芯片的供应商,全都转向了单比特。你今天很难再找到多比特转换器,因为它们存在额外的无法正确处理过零点等问题。

Pappas: 这个问题在 24 比特上会更糟。因为对 PCM 玩家来说,试图在那么低的电平上获得转换器的线性度(linearity)是个真正的问题。

Meitner: 我认为 24 比特是一堆谎言(crock of lies)。我不知道有多少营销比特(marketing bits)混进了里面。

Pappas: 那么您认为它们实际能提供多少线性比特(linear bits)?

Meitner: 哦,在数字域,我确信它们提供了 24 比特。但当涉及模拟部分,我从未见过能实现 24 比特线性的模拟电路。

Pappas: 所以是营销比特,嗯?

Meitner: 嗯,是的。但同样,你知道,好的一面是至少现在你的噪声量化用了更多的比特。

Pappas: 这提高了你在过零点的性能。

Meitner: 是的,是的。而且通常那些转换器都是基于 Delta-Sigma 调制(delta sigma modulation)类型的设计。

Pappas: 这本质上就是去掉抽取滤波器的 DSD。

Meitner: 没错。是的。而且你知道,在音频传统上,少即是多(less has always been better)。

Pappas: 我不知道,除非你是英国调音台制造商。(注:此处 Pappas 可能意指英国高端调音台通常以复杂、功能多著称,与“少即是多”理念相对)

Meitner: 通常是少更好。如果你能制造更短的反馈路径、更短的这样、更少的那个,通常在音质上效果更好。

Pappas: DSD 的输出有某种标准格式吗?

Meitner: 是 S/DIF。只是它有三根线:同步(sync,即时钟),然后左声道 DSD 和右声道 DSD。

Pappas: 非常有趣。

Meitner: 所以你当然不会有那种古怪的 S/PDIF,那种你必须从数据和整个数据流中提取时钟的方式,那是另一个抖动问题。

Pappas: 而且你也不需要从中推断左右声道。

Meitner: 不需要。

Pappas: 那非常有趣。

Meitner: 它是分离的,你知道,时钟、左声道、右声道。

Pappas: 这对尝试从中重构时钟来说是个巨大的区别。

Meitner: 所有这些发烧友的分体式设备?比如一个 CD 转盘加一个转换器?嗯,薄弱环节真的是 S/PDIF。如果它甚至用一根线传输时钟和左/右声道,那会好很多,而不是这种把所有东西都塞在一根线上然后带来所有问题的方式。

Pappas: 非常有趣。所以换句话说,实际上买一台一体机(one-piece unit)可能更好——

Meitner: 哦,是的。哦,是的。

Pappas: 因为你不需要转换成 S/PDIF……

Meitner: 没错。

Pappas: ……然后再转换回来。你可以保持一切……

Meitner: 我认为每次转换,没人能自大到认为不会有任何损失。

Pappas: 所以实际上,使用分体式系统(two-piece system),你进行了两次转换。

Meitner: 没错。没有免费的午餐。

Pappas: 连打折午餐都没有。

Meitner: 没有。

Pappas: 嗯,如果这种格式要被接受,供应商必须推出各种硬件。

Meitner: 实际上需要的硬件更少。

Pappas: 但你会需要多轨录音机(multi-track machine)。

Meitner: 是的。

Pappas: 你需要某种方式在双轨环境中使用它。你需要某种方式把它放进电脑并处理它。我说“大量硬件”,就是这个意思。

Meitner: 好的。但别忘了索尼和飞利浦是非常强大的引擎。

Pappas: 哦,绝对是的。

Meitner: 他们真的在努力——你去过那次 AES(音频工程协会)展会吗?

Pappas: 没有。

Meitner: 因为你会真的很惊讶那里已经有多少设备了。

Pappas: 真的吗?

Meitner: 是的。还有关于双层光盘(dual layer disc)的问题,它是向后兼容的。你知道这在这个行业里是前所未有的。

Pappas: 是的,以前你必须扔掉之前用过的所有东西。

Meitner: 完全正确。

Pappas: 我认为 CD 如此成功的原因之一是零售商可以放弃黑胶唱片的库存要求,在给定的店面空间里比黑胶唱片放置更多产品,而且退货问题也没那么严重。

Meitner: 对。

Pappas: 而有一件事你会很难做到,就是让零售商库存双倍的货物。

Meitner: 嗯哼。

Pappas: 你不会看到像 Tower Records 这样的商家愿意为另一种格式放弃任何店面空间。所以我认为双层设计对我来说是个绝妙的主意,因为它让你绕过了这个坑。零售商看不出区别。消费者也看不出区别。区别只在于他把它插到什么机器上。

Meitner: 没错,是的。

Pappas: 这对我来说是让一种格式成功的关键,它必须对客户透明。

Meitner: 是的。

Pappas: 因为坦率地说,你知道,大多数客户认为现在的“完美音质永恒”(perfect sound forever)就够好了。而且大多数客户是在便携音响(boom boxes)和大型手提录音机(ghetto blasters)上听音乐。

Meitner: 对。

Pappas: 但他们是购买大部分音乐并驱动市场的人。

Meitner: 所以这不是坏事。你知道,这不是某个邪恶的大公司想强行推行新格式。事实上,他们非常认真地考虑了这个问题,并提出了这种双层设计,没有人真正损失什么。在我看来是双赢的局面。

Pappas: 嗯,看起来他们在让像您和 Sonic Solutions 这样的人参与进来方面做得很好,这样人们就知道这不是“独家专卖”(one-stop-shop)。

Meitner: 对。

Pappas: 因为行业不喜欢那样。他们想去多个供应商那里挑选他们买的东西和从哪里买。“独家专卖”对这个行业不是好事。

Meitner: 我认为整个发展在策略上(politically)非常正确。那些追求更好音质的人将从中受益。96/24 可以并行运行。96/24 甚至可以作为顶层(top layer)。

Pappas: 哦,真的吗?

Meitner: 嗯,为什么不呢?

Pappas: 如果你都用 DSD 录制,那么你可以转换成 96/24。

Meitner: 是的,你拥有一种开放格式,可以用于任何类型的转换。所以我真的不明白为什么有些人屁股里插着根刺(have a pickle up their rear)并抨击它。

Pappas: 嗯,也许因为他们没想到。

Meitner: 嗯,也许吧,是的。我真的不想纠结于唱反调的人;我知道他们的想法。至于音质,这里有一个简单的测试。我正在将一些黑胶唱片(vinyl LPs)转成 DSD。而且,你知道,在 DSD 中,这是对原始声音损伤最小的转换方式。如果你认为播放黑胶唱片并喜欢它所有的优点,现在我们可以在 DSD 格式中拥有它。我们甚至可能去除一些噼啪声(clicks and pops),同时保留整体的好味道(good flavor)。这同样适用于模拟磁带和任何类型的转换。所以这真是一件非常好的事情。

Pappas: 嗯,模拟磁带的情况变得非常关键,因为所有那些东西真的开始分解了。

Meitner: 没错。

Pappas: 60 年代的东西实际上没有 70 年代的那么糟,那时大家都换成了高输出磁带(high-output tapes);那些东西真的在分解。

Meitner: 是的。

Pappas: 如果你转换成 96/24,那就完了:你被卡住了。你哪儿也去不了。

Meitner: 你也应该拿那张 MoFi(Mobile Fidelity Sound Lab)做的 Tom Petty 碟。把它和用 DSD 系统制作然后通过索尼 Direct(Sony Direct)降采样的版本,以及 SBM direct(Super Bit Mapping direct)与原始版本比较。那是天壤之别。

Pappas: 真的吗?

Meitner: 是的,你绝对要拿到那张碟。因为它会向你展示,当它被正确降转换时,有多少好味道被保留了下来。

Pappas: 我喜欢您的术语:“好味道”(good flavor)。在我看来,DSD 是数字工作方式思维的重大转变。我们实际上从 70 年代末就开始做 PCM。我认为 DSD 代表了一种真正的思维转变。我必须假设你们也是沿着同样的思路在思考。

Meitner: 它是“非数字的数字”(undigital digital)。

Pappas: 我简单告诉你,80 年代我在 Otari Corporation 工作。我们在旧金山 Wally Heder 的地方做了一个大型对比测试(shoot out),用了所有的 PCM 机器和 DBX 系统,那是在,天哪,大概是 81 或 82 年。

Meitner: 是用那台邪恶的 PCM-F1(Sony 的早期 PCM 适配器)吗?

Pappas: 哦,嗯,我们听了邪恶的 PCM-F1,还有 Mitsubishi 850 机器和 JVC 系统。我们用了 DBX 系统。那时,DBX 系统是市面上声音最好的数字系统。我们做了同样的事情。我们连接了所有数字系统,听了直接从控制台出来的声音与经过处理的数字系统馈送的声音。那时 Otari 试图从 DBX 获得该技术的许可,但 DBX 经历了几次所有权变更,一切都泡汤了。

Meitner: 是的,我想是——是谁买了他们?Garrard 之类的?

Pappas: 哦,天哪!我不知道。他们在大约三年里换了大概四个东家。

Meitner: 是的,没错。

Pappas: Otari 的人不喜欢那种事情。交易就告吹了。但我们都准备好签约制造多声道数字机之类的东西了。

Meitner: 那本来会很好。

Pappas: 嗯,当时那个产品肯定比任何 PCM 系统好得多。

Meitner: 嗯,你知道,在我们这些知情者中,有过巨大的呼声——为什么 CD 非得设计成那样。你知道,它本可以更好。但我猜那些刻板的工程师们接手了,说:“好吧,我们就这么做。”

Pappas: 嗯,我也认为他们基于当时可用的技术做了几个决定,没有过多考虑未来会发生什么。

Meitner: 是的。

Pappas: 而且出于很多原因,PCM 在低性能计算机系统上相对容易处理。而且你知道,如果你回到那个时代,拥有 640K RAM 的计算机要价八千美元。

Meitner: 哦,是的,我记得。事实上,在 Olive,我们过去常常制造自己的计算机机构,你知道,用了很多芯片。很多很多芯片。而且它们也不是很可靠。

Pappas: 嗯,我记得 40 兆字节的硬盘驱动器又大又贵。而且也不太可靠。“但除此之外,林肯夫人,它们都很好。”(注:调侃美国前总统林肯遇刺的黑色幽默,意指除了不可靠这个致命问题,其他都好)所以我认为那些家伙的想法是:“好吧,我们就这么造,它容易处理,我们就凑合用吧。”

Meitner: 因为,你我私下说,我敢说即使在 16 FS(16倍过采样?)下,Delta Slope(DBX 的技术)也会比 PCM 更好。

Pappas: 哦,我也同意这个观点。

Meitner: 你知道,没人真正在意大多数系统中有那么一点背景噪声;它们播放的音量从未大到能听到它。唱片噪声的问题与其说是噪声本身,不如说是里面的苏打饼干(soda biscuits)。(注:意指噼啪等爆豆声)

Pappas: 是的,瞬态的“噼啪爆裂声”(snap-crackle-and-pop)有点烦人。

Meitner: 没错,是的。但仅仅是均匀的噪声,你知道,80 dB 加权什么的,本不该是什么大问题。

Pappas: 不是。我认为市场部有相当多的意见。而市场部的人说它必须,你知道——

Meitner: “完美”。

Pappas: 是的,而且必须寂静无声。

Meitner: 是的。

Pappas: 我想这就是为什么我们最终做了 44.1 PCM。而且坦白说,当你想到 CD 超越黑胶唱片的速度有多快时,如果你看 RIAA(美国唱片业协会)的数据,这种转换和消费者对该格式的接受度非常迅速,考虑到所有因素。而且相当了不起。而且,你知道,我认为这都是营销炒作的一部分:“看看这些规格,别让我们去听它,数字看起来棒极了!”

Meitner: 对于 44.1(kHz),那个滤波器,所谓的过采样滤波器(oversampling filter)或插值器(interpolator),是一个线性相位(phase linear)器件,对吧?所以你在瞬态(transient)之前有振铃(ringing)。在之后也有振铃。现在,瞬态之前的振铃,我们的听觉系统会预判(anticipating),我们听到的是噪声调制(noise modulation),虽然非常轻微,但刺耳(grating)。我记得无论何时我们在这里播放 CD,我们总是回到一个带模拟滤波器的 1 FS(单倍采样)系统,因为那个模拟滤波器在瞬态之后才振铃。所以你看一个阶跃信号(step),它上升,然后有一些振铃,对吧?然后它在下降时不振铃。换句话说,它不知道信号的未来走向,这是另一个非常“非自然”的部分。在过去的五六年里,我们制造了一种转换器,它有过采样,有数字滤波,但没有振铃。这带来了巨大的不同;DMP 的 Tom Jung 等人可以证明这一点。它是最接近 DSD 的东西。

Pappas: 那个转换器是——?

Meitner: IDAT。基本上我们所做的是制造了一个检测器,当 FIR 滤波器(有限脉冲响应滤波器)遇到麻烦时能检测出来。所以我们能在 FIR 和线性插值(linear interpolation)之间切换。

Pappas: 这是个巧妙的技巧。

Meitner: 所以我们没有一些竞争对手在使用样条拟合(spline fitting)和曲线板拟合(French curve fitting)之类方法时出现的典型失真特性。我们在正弦波上仍然有平坦的 20 kHz 响应。但如果你看一个八倍过采样的插值器会做什么,它会给你平坦的频率响应。这意味着它处理了 sin(x)/x 误差(sine-x-over-x error)。它把误差推到了八倍(频率)之外。所以现在在 20 kHz 处原本下降 3.2 或 3.4 dB 的变成了只下降 0.04 dB,对吧?

Pappas: 对。

Meitner: 但它只在正弦波上知道怎么做。想象一个瞬态信号来了。

Pappas: 它就搞不定了。

Meitner: 它做不到。它现在可能在 20 kHz 处给你带来高达 3.4 dB 的误差。

Pappas: 在瞬态上。

Meitner: 在瞬态上。

Pappas: 哇。我从未意识到这一点。

Meitner: 所以你有这个瞬态到来,这些瞬态是幅度调制的(amplitude modulated),但它们被定位在采样系统中,这才是致命的问题。

Pappas: 我甚至从未想过这个。

Meitner: 因此,容忍瞬态上 3.4 dB 的误差但保持该死的瞬态稳定要好得多,而线性插值器永远不会撒谎(lie)。

Pappas: 这非常有趣。

Meitner: 我们在第一个产品中实现了它,该产品立即在《Stereophile》杂志获得了 A 级评级。从那时起,那是一个我们制造的 15,000 美元的展示品,然后我们学会了如何更便宜、更优雅地制造它,把价格降到了 2,000 美元。所以我们只卖了六台那些昂贵的。

Pappas: 你卖了很多两千美元的那个。

Meitner: 是的。但那效果非常好。而且我认为,在某种程度上,96/24 如果使用砖墙滤波器(brick wall filters)之类的东西,仍然会有我们讨论的问题。程度不同,但仍然存在。

Pappas: 嗯,他们只是把问题稍微推远了一点。

Meitner: 是的。

Pappas: 仍然是个问题。

Meitner: 是的。任何相位均衡滤波器(phase equalize filter)——我不知道你是否记得所有那些数字磁带机,输入必须有一个抗混叠滤波器(aliasing filter)。

Pappas: 对。

Meitner: 嗯,有些是未经相位均衡的,只是椭圆滤波器(elliptical filter)。然后 Apogee 推出了他们的相位均衡滤波器,声音开始听起来像 CD。你不能把未来引入音频信号。

Pappas: 我从未这样看待过。这非常有趣。

Meitner: 所以对我们来说,在开发这个项目的任何时候,健全性检查(sanity check)都是那个 1 FS 转换器。

Pappas: 非常有趣。

Meitner: 我不知道人们为什么不抓住这一点,但它如此明显。你加入了一些幅度调制的东西,所有那些说一些混叠(alias)被推到 20 kHz 以上的理论狗屁不值(don’t mean dick),因为你仍然在通带内产生涟漪效应(ripple-down effect)。

Pappas: 你必然会有。

Meitner: 是的。这就是为什么我说它是一种潜意识的东西,因为你听不太清楚。在 10、15 kHz 的幅度变化,你听不太出来。但没人真正知道当这种情况长时间持续时会产生什么影响。最恶毒的乐器是小号(trumpet)。

Pappas: 可不是嘛!(Tell me about it!)

Meitner: 所以你看看小号的信号特征,你有这些曲线非常尖锐的针尖点(fine needle points),具有非常快的转折(turnaround)。嗯,你知道,那个 FIR 滤波器持续处于振铃模式(ringing mode)。

Pappas: 而且你有很多谐波分量(harmonic components)。

Meitner: 没错。

Pappas: 而且幅度很高。

Meitner: FIR 不是一个滤波器。它是一个窗口(window)。那个窗口必须有一个有限的开口,问题在于那个窗口里有多少个样本。

Pappas: 在高频下,不够多。

Meitner: 嗯,仍然有太多样本导致了所谓的吉布斯现象(Gibbs phenomenon),也就是振铃。一旦这个被消除,业内有些人就完全爱上了这个结果。事实上,我们有一个客户问了一个非常有趣的问题:市面上有多少五年前的数字设备是你现在还愿意拥有的?

Pappas: 没有(None)。



回复

使用道具 举报

8
 楼主| 发表于 2025-5-30 11:13 | 只看该作者 来自 中国
顶顶,看起来太专业没人回复吗?我还挺喜欢看的,很有营养
回复

使用道具 举报

9
 楼主| 发表于 2025-5-30 11:32 | 只看该作者 来自 中国
本帖最后由 zikomol 于 2025-5-30 11:49 编辑

那我写一下读后启发,与坛里大神交流。

解码器上了一个级别后声音好不好听的核心是模拟电路设计,因为在运放或模拟电路附近有高频信号,很难处理。时基抖动(jitter)和时钟分配问题,都是解码器的设计难点。

对于dsd这种高带宽文件,需要低失真、低噪声、超高速的模拟电路,能够在 DSD 信号所呈现的噪声下工作而不产生互调产物。要在低噪声、低失真、宽带宽以及驱动能力(例如驱动容性负载)之间权衡,而这些权衡通常是相互对立的,同时要兼顾动态范围。所以解码器的模拟电路是非常难设计的。
听觉感知很大程度上是速度变化,而此时过0点是强度最大的。pcm此时0bit,只有抖动作为分辨。而dsd的此时就比较完善,基于变化量,听感更好。

模拟域不可能实现24bit及以上的分辨率,看到任何高于24bit宣传的r2r解码,直接当垃圾别买,因为造假。

SPDIF这种口最好别用,因为格式转换问题。 cd44.1KHZ格式是真的拉

回复

使用道具 举报

10
发表于 2025-5-30 17:01 | 只看该作者 来自 北京
所以spl独家的120v高压运放用于低通滤波非常的猛,在低噪声、低失真、宽带宽以及驱动能力这块儿做的很好,数字电路平平无奇,模拟电路很厉害。
回复

使用道具 举报

11
 楼主| 发表于 2025-5-30 18:35 | 只看该作者 来自 广东
AlexZodiac 发表于 2025-5-30 17:01
所以spl独家的120v高压运放用于低通滤波非常的猛,在低噪声、低失真、宽带宽以及驱动能力这块儿做的很好, ...

我去研究下spl的,好像你就是spl用家,解码解dsd听感如何?好像最高解到dsd256。
回复

使用道具 举报

12
 楼主| 发表于 2025-5-30 18:42 | 只看该作者 来自 广东
AlexZodiac 发表于 2025-5-30 17:01
所以spl独家的120v高压运放用于低通滤波非常的猛,在低噪声、低失真、宽带宽以及驱动能力这块儿做的很好, ...

我是玩升频dsd配合nos解码路线的。格式最低要求是升频到dsd256。不过我一直想不明白一件事情,dsd大神meitner的emmlabs旗舰解码明明是把所有源文件升频到dsd1024再进行解码的,但为什么格式最高接受到dsd128?同理大神 koch的playback也是升频到dsd1024,但格式最高接受到dsd256?难道是因为源文件过大时计算负载太重?还是时钟在输入高码文件升频时处理不了,在升频后解码dsd1024时就处理得了,整不明白
回复

使用道具 举报

您需要登录后才可以回帖 登录 | -注册-

本版积分规则

Archiver|手机版|粤icp备09046054号|耳机网-耳机大家坛

粤公网安备 44030602000598号 耳机大家坛、www.erji.net、网站LOGO图形均为注册商标

GMT+8, 2025-6-1 01:03

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表