耳机网-耳机大家坛

标题: 【回归理性】对话Thorsten Loesch(解读PCM vs DSD)翻译 & 曾颂勤博士谈“高清 [打印本页]

作者: redgt    时间: 2014-5-21 20:12
标题: 【回归理性】对话Thorsten Loesch(解读PCM vs DSD)翻译 & 曾颂勤博士谈“高清
【回归理性】对话Thorsten·Loesch(解读PCM vs DSD)翻译 & 曾颂勤博士谈“高清音频”



----------------------------------------Part1------------------------------------------


【翻译】与AMR/iFi 索斯滕·勒施 的对话
附录:PCM vs DSD


原文地址:http://www.audiostream.com/content/qa-thorsten-loesch-amrifi-audiostream-addendum-pcm-vs-dsd

       原生DSD还是原生PCM已经变成了实质性的问题。如果我们观察PCM和DSD数字化波形的原始数字输出,就能很清楚地看到PCM和DSD是两种完全不同的格式。



    每种格式都有各自的优缺点。当我们把一种格式转换成另一种格式时不可避免的会产生一些损失。更糟糕的是,在转换格式过程中我们往往去除了一种格式的优异性并把另一种格式的限制强加在其身上。所以实际上我们得到的是两种格式的糟粕而不是两种或者其中一种格式的精华。

    或许接下来要解释的还有很多。请多多包涵。

    数字音频开始于PCM(主要是日本EIJA标准14与16位PCM,也有如Decca所使用的非标准体系)和与DSD大体相似但在dbx700形式上稍显逊色的比特流系统。

    原始CD标准的PCM系统每隔22.7微秒(44.1kHz采样率)把音乐信号转换成65536个值中的可接受单一值(2^16—16二进制加权位)。所以就像在模拟系统的情况,在每个时间点都有一个绝对定义值作为参考。重要的区别在于它并没有连续的波形,而是一个与原始波形近似的阶梯状波形,修正的模拟低通滤波把阶梯状波形变平滑了。

    如果我们取1秒44.1kHz/16Bit的PCM音频将其可视化为图像,我们将得到一个44100*65536(宽*高)像素的图像。PCM的振幅拥有高度的精密性和分辨率。再看其不足之处,我们必须将通过低通滤波将模拟信号严格重新编码,随之而来的是相位和时间域的误差和相当粗糙的时域分辨率。


附录:44.1kHz PCM 数字音频系统(如:Sony PCM F1)


附录:施勒先生所拥有的索尼PCM F1便携录音系统原本是艾伦·帕森斯的。

    相比之下,DBX比特流系统每1.55微秒测定一次(664kHz 取样率,大约是DSD的四分之一)信号是否比上一个样本上下变动了。所以,每个点上都没有绝对值,对于一段22.7微秒长的视窗(这是PCM44.1kHz的视窗)只有14.6个值能被描绘出来,而PCM有65536个值能被描绘。

    “噪声整形”技术可以让更多的值得以描绘,但平均要求更长的时间视窗。DSD的高取样率在一定程度上改善了这一情况。

    如果我们取1秒的644kHz dbx比特流系统将其可视化为图像,我们将得到一个644000*2(宽*高)像素的图像。单比特/比特流系统的振幅域精确度和分辨率往往不高,但具有较高的时域精度。再看其优点,尽管依然需要低通滤波器,但比特流系统并不需要PCM所需的陡坡防失真滤波器。


附录:传统的比特流数字音频系统(dbx700)


附录:dbx700比特流AD&DA 处理器

    任何一个系统在回放环节都要求某种形式上的低通滤波,这需要我们在压缩超声波噪音和段/时域误差之间进行全面的权衡。

    在这场PCM和比特流格式之争中,PCM成功地赢得了第一轮并成为了数字音频的业界标准,随后也成为了CD标准以及DVD音频系统的标准。索尼便携准专业机型PCM-F1和录音室用专业级别机型PCM1630成为了早期数字录制的业界标准,而dbx 700仅仅是一个历史的边注,几乎被世人所遗忘。


附录 :上世纪90年代后期数字音频系统 – 单比特ADC讯号传输到CD或DVD再输出至单比特DAC (16bit/44KHz 或24bit/96KHz)

    真正的PCM数字录制和录音回放使用多比特模拟/数字转换器(ADC)录制和多比特数字/模拟转换器(DAC)转换。这种多比特转换器操作十分复杂而且很耗时,因此非常昂贵,但它在数字音频发展的前十年占据了主导地位。

    相比之下,单比特流类型的ADC和DAC的结构简单很多,因此生产成本更低。20世纪90年代早期,硬件(ADC和DCA芯片)市场背离了真正的PCM而向单比特/比特流转换器发展。


附录:Crystal CS4303 Delta Sigma DAC与Asahi Kasei AK5327 Delta Sigma ADC

     然而也有例外存在。到20世纪后期,Pacific Microsonic Model 1(随后是差不多的Model 2)是最后还坚持生产的多比特ADC系统。尽管低端市场被廉价的单比特/比特流设备占领,但多比特音频DAC设法坚持了更久,时至今日也仍应用于很多顶级超高保真度的回放系统中。

    我们现在正处于这样的情况:大多数ADC和DAC都是单比特/比特流设备,而ADC单比特或比特流必须转换成PCM才能在CD上回放,而且CD上的PCM信号需要转换回单比特/比特流才可以在单比特/比特流DAC输出。这样的双重转换无疑是个下策:我们的信息遭受两次损失,声音质量也因此两次受损。随着类似所谓的‘音量竞赛’(指当时混音业调高母带音量的竞赛)的冲击,商业音乐录制的质量在上世纪90年代中到本世纪00年代中滑落至最低谷。

    因此,我们可以推测许多20世纪90年代中期后发布的“PCM”录音实际上来源于单比特ADC(DSD也类似这样),然后为了编辑、母带后期处理和回放而转换成PCM,它们甚至作为‘高清’PCM在市场上销售。


附录:雅马哈01V 单比特ADC数字混音器 和16Bit PCM音频输出成CD格式至马兰士单比特DAC CD播放器

    事实上,几乎只有通过Pacific Microsonics Model 1 或2制作的录音才认为是真正的高清PCM音频,而这种转换器非常少见,所以这种录音也是如此少见。因此很少有人真正听到过真正的“PCM”,更不用说“高清”PCM音频了。这真令人难过,但却是事实


附录:20世纪90年代末高清PCM数字音频系统 – 支持HDCD的Pacific Microsonic Model 2 录音室多比特AD/DA 处理机(24-Bit / 176.4KHz)

    鉴于上述20世纪90年代末出现的问题(更多是因为其他商业原因),索尼与飞利浦尝试采用一种行业内称为DSD的商业化比特流格式,一开始作为一种档案格式,后来作为CD的替代格式,称为Super Audio CD(SACD)。DSD淘汰了由单比特向PCM的转换,回归直接采用单比特或比特流录音。因此DSD / SACD是CD上的来源于单比特/比特流ADC的一个重大改进,并通过单位/比特流DAC回放。


附录:20世纪90年代后期的DSD数字音频系统– SACD

    然而比特流格式在市场上销售的尝试并没有成功。在这段时期内,即使黑胶碟的销量也持续高于SACD

    随着更高取样率和更长的记录长度成为DVD和电影的标准,硬件业界处于生产出能超越CD素质的ADC和DAC的压力下。他们发现单比特/比特流技术兼容性普遍很差,因此大量所谓的“混合”系统成为新的标准,在这样的系统中,多比特中最重要的6个比特的转换与比特流转换混合。

appx.2013 typical DSD revival digital audio system – “DSD capable DAC”
附录:2013典型DSD复兴数字音频系统 –“支持DSD格式的DAC”

    这些ADC和DAC使用的这项技术里面最好的已经完善得非常好,而且实质上如今这项技术被当做格式转换的新标准。这里当然有问题。我们现有的ADC以6-8Bit和256甚至512倍的超采样运行,DAC也是同样的规格。这或许不完全等于是一个好的能够真正支持24bit– 768KHz 的多位ADC或DAC,但在原则上其潜力超过传统的单比特/比特流设备。

    然而这些ADC和DAC之间的转换只在不同采样率的DSD或者PCM中是可行的。对于新系统来说,是没有“原生”格式的。这再度产生了与DSD曾经尝试解决的同样的问题,只不过这是在更高的质量水平上。为了回放录音,我们要把录音转换成DSD或者PCM格式,任何一种转换都会令原始录音损失其中一些独特品质。

    如果我们把24-Bit 352.8KHz(DXD-PCM)文件转换成1-Bit 2.822MHz (DSD) 文件,我们会损失近99.96% PCM格式支持的振幅信息,而我们只能得到12.5% DSD系统支持的时域信息。

    如果我们把DSD文件转换成DXD文件,也就是把1-Bit at 2.822MHz转换为24-Bit at 352.8kHz,我们将会损失87.5% DSD文件的时域信息,尽管理论上我们可以把这些重新映射成振幅域。

    所以实质上我们得到了两种格式的糟粕,而不是其中一种的精华。

    由于这些ADC/DAC部分一般都是针对PCM为主的市场而开发的,在PCM主导的市场中,录制、编辑、母带后期处理和回放都是基于PCM进行的,ADC输出PCM信号而DAC则用于PCM信号输入,这些基于PCM的运算往往得到最优化。

    现在的DSD经常只是一种为了提供“玄妙的专业术语”而被后期添加的东西。例如许多这类DAC都有一条完整的数字滤波和数字音量控制的PCM音频路径。在这些DAC中,DSD首先被转换成PCM,然后进行数字滤波(过程中会增添所有PCM转换成DSD数据流的问题),最终被转换成多比特ΔΣ。因此我们在黑匣子中心(即我们所说的DAC芯片)里有两次不良的转换

    最后,我们从过去回到现在,回到“原生”的DSD和PCM音频上。如果我们真的想要听到DSD最好的声音,把它首先转换成PCM,将其当做PCM处理,然后将其当做多比特ΔΣ调制播放,这实际上与把DSD立即转换成PCM并以PCM回放并没有区别,这就是许多所谓的“DSD DAC”上进行的。


支持以DSD本地传输协议在Mac/Audirvana上运行的单比特ADC和拥有混合功能DAC的“Brand X”“DSD DAC”

    我们用PCM和DSD转换器回放时听到的声音差异明确地告知我们这是算法的转换,而非格式本身的差异。相比原生未处理过的DSD流,这种音质损失是不可避免的。

    所以,理想情况下我们用真正的多比特DAC以PCM的路径重放PCM(无论其原生ADC来源是什么,我们总可以减少一个阶段的操作和损失)。并且我们以纯ΔΣ调制重放DSD,不对时域进行任何操作(无论其原生ADC来源是什么,我们总可以减少一个阶段的操作和损失)。如果这就是我们的需求,我们就会发现目前的“旗舰”DAC 非常不尽人意。它们既损坏了PCM,也损坏了DSD,。

    在***(此处省去Thorsten·Loesch设计的新品型号)我们会竭尽全力提供好的表现。找到一个现成可以同时处理好DSD和PCM的DAC芯片是一个挑战。供应商一般对芯片的内部结构介绍不多,所以常常必须进行详细的实际测试去判断芯片到底如何。

    我们在***(此处省去Thorsten·Loesch设计的新品型号)上使用的DAC芯片为我们提供了一条不同寻常的解决问题的途径。它使用了6bit 多比特DAC* 处理PCM音频里重要的6个比特,为PCM提供了Burr Brown品牌多比特DAC引以为傲的温暖而有力的声音。而上述6bit外的比特都会被一个低阶256速Σ-Δ调制器转换(实际为DSD256),使PCM的回放也有了DSD声音广为人知的柔美特性。


*附件:此为译者另外在TI DSD1793官网PDF介绍文档(http://www.ti.com/lit/ds/symlink/dsd1793.pdf)截取的信息。另外,经查阅,指标水平更高的DSD1972及DSD1794同样也具备这种特性。

    播放DSD时,相同的Σ-Δ调制器被用来直接将DSD流转换成模拟信号。当然,这对于DSD来说并没有可用的数字滤波和数字音量控制,所以我们必须在模拟信号的处理部分中添加这些功能。结尾,引用我们国家(英国)的说法–要知道布丁的滋味,最好亲口尝一尝。


如对上文观点有疑问,请与Thorsten·Loesch进行探讨。
如对文中翻译有疑问,欢迎与我联系。(翻译中难免存在未尽完美之处,欢迎指正交流)



主体翻译:bv
辅助翻译:redgt(Joy_c)@三耳工作室
校稿: 曾颂勤博士&redgt(Joy_c)



----------------------------------------Part2------------------------------------------


曾颂勤博士解读“高清音乐档案”


曾颂勤博士*寄语:

    很鼓励所有玩音响和发烧友看完以上这篇翻译文稿,让自己对DSD和PCM这两种不同的数字音乐格式有更充分的理解。自从SACD跟HDCD格式出现后,市场上出现不少胡乱使用24/96kHz;24/176.4kHz;24/192 kHz和DSD这些字眼,标榜高采样格式的数字音乐档案和CD碟片。这现象大概分为两类:1)原来的音源为旧式16/44.1kHz的CD格式,通过SRC升频成为高格式的数字档案或者格式转换为SACD再重新出版;2)录音的确以24/96kHz或者更高采样率的格式完成,但是在制作 CD母带的过程中还是无法避免16/44.1kHz频宽的瓶颈。

*(曾颂勤博士乃权威录音师,资深作曲家和唱片制作人,现任北京现代音乐学院客座教授。从1985年开始使用PCM数码录音,也是世界上第一个使用 New England Digital Synclavier Direct-to-Disk以100kHz进行高采样率数字格式录音的中国人,在国际上也是录音技术的先锋人物)

下面是曾博士使用Apple Logic Pro X软件对一些高格式音乐档案的检查结果。

以下我们就使用Apple Logic软件自带的FFT显示,检查国外高格式数字音乐网站HDtracks的Ultimate Download Experience这个24/96kHz的音乐档案,曲目名为:
Nikolai Rimsky-Korsakov: The Snow Maiden – Dance of the Tumblers
Minnesota Orchestra / Eiji Oue

正常速度播放,可以看见在10kHz到20kHz这段,音乐讯号非常丰富:



在4倍慢速播放,音乐讯号即以4倍频率数往图表左方移动,可以看见高频讯号是无缝延伸到30kHz (7.5kHz X 4)的:



检查“24bit/192kHz 金正传世玫宝极品音乐WAV高清音源”的贝多芬第五交响曲就会发现一个使用SRC升频上192k的例子。图一显示在正常速度播放,20kHz附近有一根独立的,跟音乐讯号脱离了的噪音。



放慢4倍速度播放就能看见这个噪音发生在大概(12kHz x 4)= 48kHz,就是升频过程所创造出来的Alias Noise,在慢速播放,耳朵会听到的是一堆破音。




    音乐最首要是好的演奏,出色的录音。高格式不一定表示音乐更好听,16/44.1kHz的CD已经成功为音乐爱好者提供超过30年的装载。只有在A/B比较下,高格式的频宽和声场还原的优势才会明显。至于有否必要为了格式而在设备上面提升,始终关键都在音乐软件的制作过程上。唱片和设备商刻意标榜高格式,更多是为了可以提供爱好者更多消费玩乐的选择。




----------------------------------------Part3------------------------------------------


辅助译者寄语:
    相信很多音频发烧友都与我(Joy_c)一样,长期以来都对PCM和DSD之间的问题感到疑惑。偶然机会中读到这篇由著名音频发烧媒体audiostream与Thorsten Loesch的访谈方为一解心中疑惑,随即迫不及待地让女友抽空完成本文的主体翻译,然后由我负责完成了对其中专业术语的翻译及对外传送,希望能帮到更多朋友解除疑惑。期间更遇上惊喜插曲,曾颂勤博士得知我在处理这份翻译稿件后主动提出协助校正,更热心地提供了他详细测试而得的数据希望能让烧友们更加远离“忽悠”,这里要特别对他说声感谢。而读到这里,一个不算是结论的结论应该是出来了,“现阶段而言,PCM和DSD其实并无绝对的优劣之分,目前我们更该在意的应该是行业从录音到最终回放的统一化流程和烧友自己需要远离‘假高清’”。只可惜,通过文章能了解到关于PCM和DSD的历史、现况甚至是一些技术原理,我们却依然在无奈地面对着目前市场上许多取巧的作品,无论音响器材抑或录音。如访谈中所述,上世纪90年代中到本世纪00年代中发生过诸如“音量竞争”这样的不良历史,到今天也尚有许多所谓DSD作品之类的故弄玄虚的产品存在…一直都有说法“再好的发烧器材都是为好的录音服务”,但是今日我们放眼全球的唱片业,或者只关注我们周围的华语唱片,似乎都已经越来越少新录音值得我们投入金钱及心思在回放设备上。最后,更多的期待其实并非单单希望回放器材能不断进步,而是在于希望将来能听到更多好的新唱片。


另外,欢迎朋友们关注@三耳工作室,参与更多互动。[s:52]


注:如需转载注明出处,欢迎分享。




Redgt (@Joy_c) @三耳工作室
2014/5/21





欢迎光临 耳机网-耳机大家坛 (http://erji.net/) Powered by Discuz! X3.2