找回密码
 -注册-
楼主: 一枚粘豆包
打印 上一主题 下一主题

采样率,位深,码率,无损音乐,写给小白的科普 (申精)

[复制链接]
21
发表于 2020-2-5 12:17 | 只看该作者 来自 上海市徐汇区
好贴,支持一下
回复

使用道具 举报

22
发表于 2020-2-5 12:28 | 只看该作者 来自 美国 弗吉尼亚州劳登县阿什本地区Verizon
ellison009 发表于 2020-2-5 11:48
所以,1bit和24bit哪个音质更好?

你的问题抽象一下其实是在问DSD和PCM那种采样方式更好,这个可以单独开贴吵一架了,因为持不同观点的人很多。二者各有千秋的同时也有各自的短板。纯理论的讨论其实对于购买器材来说意义不大,对于某一个器材到底是播放DSD还是PCM更好的具体分析才更有意义。
回复

使用道具 举报

23
发表于 2020-2-5 12:37 | 只看该作者 来自 山东省临沂市
注意,听区别的时候,24-96的可不能转置成16-44.1,会有SRC,音质劣化得厉害,24-96应该转置为16-48,再对比听区别。24-88.2可转为16-44.1听区别。
另外对比必须采用双盲法测试,否则听出的区别都是心理作用产生的结果,不可重现的。
回复

使用道具 举报

24
发表于 2020-2-5 12:47 | 只看该作者 来自 上海市
boxerlc 发表于 2020-2-5 12:28
你的问题抽象一下其实是在问DSD和PCM那种采样方式更好,这个可以单独开贴吵一架了,因为持不同观点的人很 ...

我个人感官体验是1bit的更冷静,解析更高。24bit的柔和,润。目前而言,我还是更接受24bit的
回复

使用道具 举报

25
发表于 2020-2-5 14:17 | 只看该作者 来自 广东省广州市
本帖最后由 tymyf 于 2020-2-5 14:18 编辑

非常有意义的帖子,补充一些内容:

CD一般来说是Compact Disc Digital Audio的简称,翻译成中文大概是紧凑型数字音频盘的意思。最初由飞利浦和索尼在上个世纪80年代初以红书(Red Book)的形式联合发布,在1987年被标准化组织IEC接纳为正式标准,编号为IEC 60908。这个标准最近一次修订是在1999年。飞利浦和索尼出版了一系列以颜色命名的标准,全部都是关于Compact Disc的,红书(Red Book)就是其中描述数字音频CD的一本。

IEC 60908整个标准还是挺繁杂的,我们只关注其中的编码部分。简单来说,存放于CD中的音频编码标准就是声音通道数为2、采样精度16位、编码格式为线性PCM、采样率固定是44.1KHz。

在红书(Red Book)发布之前的1970年代,还存在着一种录音设备叫做PCM适配器。故名思义,它把模拟的音频信号转换成数字的PCM编码,并提供录制到视频存储设备上的接口。为什么音频和视频搅和在一起?因为当时已有的音频存储设备带宽不够大,不足以提供16位的PCM数字音频的存取带宽,这个带宽大概在1M~1.5M bit/s,这在当时是一个相当“高”的带宽,只有视频存储设备才有如此高的存取能力。PCM适配器把音频数据按特定的视频格式打包,从而可以借助于已有的“高带宽”视频存储设备实现音频数据的存取。

当时大量存在的视频存储设备主要支持两种视频制式,一种是25帧制式(称为CCIR 625/50,也叫PAL),一种是30帧制式(称为EIAN 525/60,也叫NTSC)。当时世界上有电视普及的国家按这两种制式分为两个阵营。

首先看25帧(即50场)的PAL制式中,这种制式的一帧中,可利用来录制音频的视频行最多能有588行,分到每一场(Field)有294行。

30帧(即60场)的NTSC制式,这种制式的一帧中,可利用来录制音频的视频行最多能有490行,分到每一场就有245行。


PAL :294行
NTSC:245行


如果每行放2个数据:


PAL: 294行x50场x2=29.4khz
NTSC:245行x59.94场x2=29.351khz

放3个:


PAL: 294行x50场x3=44.1khz
NTSC: 245行x59.94场x3=44.05hkz


可以看出来如果每行放两个数据每秒视频携带的数据量是29khz 左右,这个数据量就是音频的采样率,这个采样率只能还原fs/2的音频信号,也就只能还原到15khz ,无法达到20khz的音频信号,所以每行需要放3个数据,这样数据量也就是44.1khz,这样音频采样率也就定在了44.1khz,这样的音频采样率可以保证对两种视频制式的最大限度兼容,并且一直沿用至今。


为什么数据量不继续扩大呢?也就是每行放4个数据,这样频率就能到58.5khz。因为音频视频的所有频率都是一个时钟源分频出来的,这个时钟源就是所有频率的公倍数,这样就要求每个频率尽量做到最小,可以使设备稳定同时功耗最低。

44.1kHz这个数字,给后人留下了很多麻烦。首先它不是整数,在SRC(采样频率变换)的时候,它不能简单地分频和倍频,这就给早期电脑的AC97音频规格,带来了SRC转换质素的问题。(这个有点像电影制式和PAL制式,每秒只差1帧,所以以前一般来说就直接一帧对一帧进行制作,这样PAL每秒会比电影多放一帧,也就是速度提高了1/24,而且声音的音调会升高。这就是当时一些DVD爱好者不喜欢PAL制DVD的原因之一。)而当时的电脑声卡都要遵循AC97规格,只支持48kHz输出,用电脑播放CD或者CD抓轨的音频文件,都要加以转换,转换的过程会有损失,曾经某些声卡就饱受诟病。至于DAT,没有这个问题,因为它的44.1和48kHz采样频率,都是原生的,不是转换出来的,不转换就不会劣化。

回复

使用道具 举报

26
发表于 2020-2-5 14:51 | 只看该作者 来自 北京市西城区
本帖最后由 处理器 于 2020-2-5 14:55 编辑

很好的普及,最后一句话关于升频。对于升频的问题,建议要结合噪声整形、数字滤波和量化噪声去理解,比如:升频以后高频噪声会往更高频带推,这为数字滤波提供了更好的条件,单纯讨论升频意义不大。HQPlayer被很多人吹捧也是其内置的升频和数字滤波器算法,否则和一般数字播放器没有什么太大差别,界面还特别LOW,升频滤波这部分无非是在解码器之前做还是内置在解码器FPGA做,当然最好是在解码器内部也做,两边都处理,结合DAC硬件、模拟滤波器的效果最好,这也是MQA的精髓所在。


回复

使用道具 举报

27
发表于 2020-2-5 15:04 | 只看该作者 来自 四川省成都市
楼主,我有支持DSD512的外置DAC,在FOOBAR里把44.1的文件升频成DSD512,播放时DAC显示也是播放的DSD512文件,听感不知是脑放还是怎么的,感觉更顺滑,少了点毛刺感,人声更平和细腻但略微少了“韵味”不知该不该这么表达,还是完完全全是我脑放所致?
回复

使用道具 举报

28
发表于 2020-2-5 15:15 | 只看该作者 来自 北京市西城区
thesyp 发表于 2020-2-5 15:04
楼主,我有支持DSD512的外置DAC,在FOOBAR里把44.1的文件升频成DSD512,播放时DAC显示也是播放的DSD512文件 ...

没有开脑放。升频会影响量化噪声,不同算法会有差异,只要算法好,升频对音质基本是正面的,另外,PCM转DSD以后,解码器处理也不一样,都会影响最后出来的声音差异。
回复

使用道具 举报

29
发表于 2020-2-5 15:25 | 只看该作者 来自 四川省成都市
处理器 发表于 2020-2-5 15:15
没有开脑放。升频会影响量化噪声,不同算法会有差异,只要算法好,升频对音质基本是正面的,另外,PCM转D ...

但我发现升频算法和对资源的占用各个软件都不同,而且差距非常巨大,FOOBAR升频DSD512对我CPU(4.5G的I7)的占用为10%左右,而HQPLAYER按照极端设置根本跑不了512,只能256,而且CPU占用率为100%……
回复

使用道具 举报

30
发表于 2020-2-5 15:54 | 只看该作者 来自 北京市丰台区
反正这些概念不会影响设备的挑选,播低码率音频不好听的设备,播高码率也不会好听。
回复

使用道具 举报

31
发表于 2020-2-5 16:05 | 只看该作者 来自 北京市西城区
thesyp 发表于 2020-2-5 15:25
但我发现升频算法和对资源的占用各个软件都不同,而且差距非常巨大,FOOBAR升频DSD512对我CPU(4.5G的I7 ...

什么配置的机器?什么用途,是只用来播放音乐吗?

回复

使用道具 举报

32
发表于 2020-2-5 16:34 | 只看该作者 来自 四川省成都市
处理器 发表于 2020-2-5 16:05
什么配置的机器?什么用途,是只用来播放音乐吗?

就是日常使用的台式电脑,i7 2600K OC4.5G,16G内存,1070TI……
回复

使用道具 举报

33
发表于 2020-2-5 16:36 来自手机 | 只看该作者 来自 北京市平谷区
一枚粘豆包 发表于 2020-2-5 09:26
pcm是脉冲编码调制,我们这篇帖子讲的采样就是pcm方法。wav也好,flac也好,都是pcm采样。相对应的是dsd。 ...

明白了 谢谢
回复

使用道具 举报

34
发表于 2020-2-5 16:41 | 只看该作者 来自 北京市西城区
本帖最后由 处理器 于 2020-2-5 16:45 编辑
thesyp 发表于 2020-2-5 16:34
就是日常使用的台式电脑,i7 2600K OC4.5G,16G内存,1070TI……

我是PC专机,win10,只用听来音乐Roon + HQPlayer不干别的,系统优化过,卸载了所有不想干的程序和服务,硬件配置没有你高。无风扇散热,I3 7100T  16G内存,SSD、集成显卡,没有无线只有有线网口,HQPlayer 升频到DSD512 用sinc-xtr-mp-2s算最复杂的算法,CPU占用率66%。


回复

使用道具 举报

35
发表于 2020-2-5 17:56 | 只看该作者 来自 四川省成都市
处理器 发表于 2020-2-5 16:41
我是PC专机,win10,只用听来音乐Roon + HQPlayer不干别的,系统优化过,卸载了所有不想干的程序和服务, ...

哦,我是头两个“poly-sinc-xtr-lp”和“ASDM7EC”,然后“44.1k *512”,这样就不太行了,卡顿,CPU占用100%……你试试呢?
回复

使用道具 举报

36
发表于 2020-2-5 18:11 | 只看该作者 来自 北京市西城区
thesyp 发表于 2020-2-5 17:56
哦,我是头两个“poly-sinc-xtr-lp”和“ASDM7EC”,然后“44.1k *512”,这样就不太行了,卡顿,CPU占用1 ...

降到DSD256 怎么样?CPU占用率多少?
回复

使用道具 举报

37
发表于 2020-2-5 18:44 | 只看该作者 来自 四川省成都市
处理器 发表于 2020-2-5 18:11
降到DSD256 怎么样?CPU占用率多少?

265也是100%,只是不卡顿,能听了……

回复

使用道具 举报

38
发表于 2020-2-5 18:45 | 只看该作者 来自 四川省成都市
处理器 发表于 2020-2-5 18:11
降到DSD256 怎么样?CPU占用率多少?

你那个“sinc-xtr-mp-2s”的设置应该不是最复杂的算法……
回复

使用道具 举报

39
发表于 2020-2-5 18:53 | 只看该作者 来自 北京市西城区
本帖最后由 处理器 于 2020-2-5 18:56 编辑
thesyp 发表于 2020-2-5 18:44
265也是100%,只是不卡顿,能听了……

试了256 不卡,CPU占利用率78%,512不行卡顿的没法听,升级CPU吧,不过我的DAC也不支持不了dsd512


回复

使用道具 举报

40
发表于 2020-2-5 22:44 | 只看该作者 来自 美国
ellison009 发表于 2020-2-5 12:47
我个人感官体验是1bit的更冷静,解析更高。24bit的柔和,润。目前而言,我还是更接受24bit的

这个看解码的,不同解码听出来的效果不一样。你只能说用你的设备,24bit更符合你的胃口。换一台机器,结论可能反过来
回复

使用道具 举报

您需要登录后才可以回帖 登录 | -注册-

本版积分规则

Archiver|手机版|粤icp备09046054号|耳机网-耳机大家坛

粤公网安备 44030602000598号 耳机大家坛、www.erji.net、网站LOGO图形均为注册商标

GMT+8, 2024-9-17 03:52

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表