找回密码
 -注册-
查看: 58908|回复: 87
打印 上一主题 下一主题

采样率,位深,码率,无损音乐,写给小白的科普 (申精)

[复制链接]
跳转到指定楼层
发表于 2020-2-5 01:45 | 只看该作者 |只看大图 回帖奖励 |正序浏览 |阅读模式 来自 美国
本帖最后由 一枚粘豆包 于 2020-2-5 01:50 编辑

昨天逛论坛时看到有同学 @GSM 问为什么mp3转成wav或者flac听不到音质变化。解释了一番以后感觉不如专门发一篇帖子来系统的讲解一下数字音乐的原理,遂有此文,有什么错误和遗漏还请不吝指教。

我们知道声音是由于物体振动产生的,而声音的传播必须发生在一定介质中,声音在介质中传播的形态是波,声波是一种机械波。

人们为了能够存储声波,发明了模拟介质。黑胶唱片和磁带,其本质都是通过电磁波来模拟机械波。如果把唱片的沟槽放到显微镜下,我们能看到声音本来的波形,这种波形是连续的。

模拟介质的缺点显而易见,体积大、难以随身携带、传播过程中抗干扰性差(模拟电视的雪花点, 广播的杂音等)。于是在上世纪80年代,索尼和飞利浦联合开发了CD。CD是一种全新的存储方式。它的原理是对连续的波形进行取样,也就是用波形上离散的点来代替连续的波(联想一下一张照片被放大很多倍后看到的一个个小颗粒,像素)。

采样过程中的概念主要有以下几点:

1. 位深

显然,我们放上去的点越多,采样就越精细,这个采样精度我们称为位深,用bit来表示(1个bit代表一位二进制)。我们可以这样理解,假设采样率是1bit,那么转换后的音轨只有0和1这两个点,也就是我们在用方波表示正弦波。毫无疑问更高的点,更低的点和中间的点就都丢失了,我们损失了动态范围。1bit = 6.02db的动态范围。而CD的采样率是16bit,也就是有2^16=65536个点,这样的音乐对于大部分人耳来说已经是难以分辨了,动态范围达到了96db。然而实际听音环境下因为有噪音等等,是达不到这个范围的。于是才有了24bit,甚至32bit的音乐。

2. 采样率

如果我们把波形放到坐标系里,位深相当于纵坐标的精细度。而横坐标的精细程度则称为采样率。想象一段每秒振动20000次的声波,如果我们每秒只能采集10000次,那我们就漏掉了其中的10000次振动,也就丢失了信息。人耳能听到的频率在20-20000Hz之间,根据香农的采样定理(也叫奈奎斯特定理),当采样率大于等于一段波形最高频率两倍时,我们就可以不失真的表示这段波形。CD的采样率44.1kHz = 44100 > 20000 * 2。至于为什么是44.1而不是40,一方面是留出一定空间给抗混叠滤波器,另一方面则是为了兼容PAL和NTSC视频制式。

3. 比特率

最后,用 位深 * 采样率 * 声道数 就得到了一段音频的比特率(码率),也就是每秒通过的比特(bit)数。以CD来举例,16 * 44.1k * 2 = 1411.2 (kbps)

我们平时的解码器(DAC),实际上就是把这个采样的模-数转换过程逆过来,也就是数-模转换。

至于音乐格式,wav是微软和IBM联合设计的存储波形的格式。标准的wav格式和CD格式相同,所以我们常称之为无损音乐(其实这个说法是不严谨的),当然wav也可以存放更低码率的音乐。

wav的最大缺点是体积太大,在早期存储设备容量偏小的情况下,wav显然是很不理想的。于是人们就开发了各种压缩算法,比如mp3, wma等等。mp3这种格式可以极大的压缩占用空间,但是压缩过程中去掉了一些信息,于是这个过程就叫做有损压缩,相对应我们管mp3叫有损音乐。(常见码率有128kbps和320kbps)

当大家的硬盘越来越大,很多人就不满足于mp3压缩的音质,但同时仍觉得wav太大,这时就出现了flac和ape等大家熟悉的无损格式。所谓无损,是因为wav在压缩成flac时并没有损失任何信息。这个过程是无损压缩,并且flac可以完好的解压缩成wav。想象一下我们把文件压缩成zip或者rar,解压缩过程显然不会损失任何信息。

这也就解释了为什么那位同学mp3转换成wav和flac听不出区别了,因为mp3已经丢失的信息是补不回来的。除此之外我们还常听到升频的概念,其实最简单的升频就是把我们采样后的每两点之间插入1点,也就是插值法,当然我们也可以插入更多的点。但是请注意,升频后多出来的点,是我们计算出来的,而不是原始信息,也不一定能够代表原始信息。所以升频是否能带来正面的作用见仁见智。

最后,欢迎大家讨论指教。

@流氓才子 大哥你看这篇文章可以申精吗?
87
发表于 2024-12-24 18:42 | 只看该作者 来自 中国
学习了
回复

使用道具 举报

86
发表于 2022-7-22 13:20 | 只看该作者 来自 湖北武汉
一枚粘豆包 发表于 2020-2-5 03:20
很少有同一曲子不同码率,不然对比起来应该容易很多

Erick Friedman-Violin Showpieces,至少见到4种不同格式,可以研究一下。
回复

使用道具 举报

85
发表于 2022-7-22 11:52 | 只看该作者 来自 湖南长沙
我想请教一下,在WIN系统中音乐,怎么自动设置输出与原文件一致,而不是固定在某个采样与位深。
回复

使用道具 举报

84
 楼主| 发表于 2021-6-2 23:22 | 只看该作者 来自 美国
adsmtony 发表于 2021-6-2 04:49
多谢楼主好帖,受教了!

帮到大家就好
回复

使用道具 举报

83
发表于 2021-6-2 04:49 | 只看该作者 来自 加拿大
多谢楼主好帖,受教了!
回复

使用道具 举报

82
 楼主| 发表于 2021-1-29 00:57 | 只看该作者 来自 美国
气泡水和洋芋片 发表于 2021-1-28 16:47
问个无关问题,lz是不是有一只小博美?

并没有。。
回复

使用道具 举报

81
 楼主| 发表于 2021-1-29 00:55 | 只看该作者 来自 美国
SuperNatur 发表于 2021-1-28 11:15
受教,一般流媒体的无损歌曲比特率最多也就八九百,酷我下的歌曲母带比特率也就44.1khz 24bit,更高的无 ...

是的,sacd碟主要都是古典音乐,市面上大部分dsd都是sacd碟抓轨的
回复

使用道具 举报

80
发表于 2021-1-28 16:47 来自手机 | 只看该作者 来自 中国
问个无关问题,lz是不是有一只小博美?
回复

使用道具 举报

79
发表于 2021-1-28 16:45 | 只看该作者 来自 江苏南京
感谢楼主分享,学到不少新知识
回复

使用道具 举报

78
发表于 2021-1-28 11:15 来自手机 | 只看该作者 来自 内蒙古
一枚粘豆包 发表于 2021-1-21 00:59
1400kbps就是cd音质,更高品质的文件有很多。常见的96Khz/192Khz, 24bit的文件就有更高的码率

受教,一般流媒体的无损歌曲比特率最多也就八九百,酷我下的歌曲母带比特率也就44.1khz 24bit,更高的无损音源不太好找,流行歌曲码率一般都不太高吧?更高品质的是不是常见于古典、大编制一类?
回复

使用道具 举报

77
 楼主| 发表于 2021-1-21 00:59 | 只看该作者 来自 美国
SuperNatur 发表于 2021-1-20 13:21
小白看完受教了,还有个问题想请教,我看了下我这里的flac无损音源的比特率都是在1400kbps以下,那么使用蓝 ...

1400kbps就是cd音质,更高品质的文件有很多。常见的96Khz/192Khz, 24bit的文件就有更高的码率
回复

使用道具 举报

76
发表于 2021-1-20 13:21 来自手机 | 只看该作者 来自 内蒙古
小白看完受教了,还有个问题想请教,我看了下我这里的flac无损音源的比特率都是在1400kbps以下,那么使用蓝牙耳机的时候蓝牙解码抽样率达到48khz,位深16bti的话,理论上的蓝牙传输也是无损传输了吧?
还有,搜索了一下有人说无损格式的音频文件比特率最高也就1400,只需要解码达到48khz、16bti就可以,再高的解码率对于音质的提升是不是也没有任何作用了?
回复

使用道具 举报

75
发表于 2020-12-27 17:35 | 只看该作者 来自 中国
EJoYLiBeRtY 发表于 2020-2-5 10:25
假设音频信号是一个函数的话,PCM就是把每个点的值给你,
DSD就是把每个点的导数给你。
PCM和DSD是信号 ...

学习了
回复

使用道具 举报

74
发表于 2020-2-26 17:17 | 只看该作者 来自 浙江
采样频率跟声波频率有什么关系?24/96是为了还原48KHz声波频率?24/192、384是为了还原96、192KHz声波频率?即便有接近蝙蝠听力的人也没有这么高频率的换能器吧(次奥100KHz出头)?更何况DSD2.8MHz起步是为蝙蝠的准备的?
回复

使用道具 举报

73
 楼主| 发表于 2020-2-8 00:11 | 只看该作者 来自 美国
膜法少女江借时 发表于 2020-2-7 14:29
不懂就问,为什么dsf格式文件大多是1bit

不是大多, dsd都是1bit的。 原理和pcm不一样

你可以看看这篇文章

http://jandan.net/2018/08/05/dsd-vs-pcm.html
回复

使用道具 举报

72
发表于 2020-2-7 15:27 | 只看该作者 来自 美国
GSM 发表于 2020-2-6 01:53
从网盘上下载了索尼精选 2020新年音乐会的音频 索尼精选的初始格式是flac 96khz 24位 我把他分别升频成24位 ...

32位单精度浮点
回复

使用道具 举报

71
发表于 2020-2-6 21:52 | 只看该作者 来自 北京西城
脑洞略大 发表于 2020-2-6 20:26
我从来不管别人能不能听出来,也不管器材之间到底有没有区别,我自己盲听是为了测试自己能否分辨。
就算 ...

音响是系统工程,变量很多,很多变量差异很细微,盲听很难区分,细节和变量多了累计起来声音差异就大了。
能AB差异就很专业了,还要盲听?太难了,好吧,hifi就是自己和自己较劲,喜欢就好。


回复

使用道具 举报

70
发表于 2020-2-6 20:38 | 只看该作者 来自 广东中山
本帖最后由 la2ygoo2 于 2020-2-6 20:39 编辑
处理器 发表于 2020-2-6 11:52
别想多了,普通发烧友去搞盲听自找没趣,一般人就是自娱自乐,发烧友器材玩的多的,自己AB对比,能听出来 ...

不盲怎样关掉脑放?
那么明显的一句话,你都能无视掉?




回复

使用道具 举报

69
发表于 2020-2-6 20:26 | 只看该作者 来自 美国
本帖最后由 脑洞略大 于 2020-2-6 21:49 编辑
处理器 发表于 2020-2-6 11:52
别想多了,普通发烧友去搞盲听自找没趣,一般人就是自娱自乐,发烧友器材玩的多的,自己AB对比,能听出来 ...

我从来不管别人能不能听出来,也不管器材之间到底有没有区别,我自己盲听是为了测试自己能否分辨。

就算如你所说,差异是肯定的;甚至绝对点说,两条同品牌同型号的线材,也一定是有区别的。

但这些区别,不盲听我怎么知道我能否分辨?我不能分辨的差异对我又有什么意义?

你所谓的有趣和自娱自乐发展到最后很可能就是花钱升级脑放。我拒绝当那样的普通发烧友。

回复

使用道具 举报

68
发表于 2020-2-6 13:32 | 只看该作者 来自 亚太地区
脑洞略大 发表于 2020-2-6 10:59
不盲怎样关掉脑放?
非盲听一耳朵区别,盲听直接抓瞎,我自己就经历过。

小心别被带入不可知论的陷阱里。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | -注册-

本版积分规则

Archiver|手机版|粤icp备09046054号|耳机网-耳机大家坛

粤公网安备 44030602000598号 耳机大家坛、www.erji.net、网站LOGO图形均为注册商标

GMT+8, 2024-12-28 06:43

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表