找回密码
 -注册-
查看: 901|回复: 7
打印 上一主题 下一主题

为什么音频工程师避免使用高采样率?

[复制链接]
跳转到指定楼层
1
发表于 2024-11-13 08:30 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式 来自 浙江杭州
https://www.audioapp.cn/thread-226822-1-1.html
音频采样率是一个复杂且经常被误解的话题。在本文中,我们将探讨 44.1kHz 和 48kHz 这两种最常用采样率的起源,并思考为什么许多工程师至今仍选择使用这些采样率,以及为什么更高的采样率(即 88.2kHz 及以上的采样率)往往是负担而非好处。

什么是采样率?
在继续深入讨论之前,我首先简要介绍一下什么是采样率。数字音频由大量的快照或样本组成。采样率是指每秒发生的快照数量。它的单位是千赫兹(kHz),正如我们即将看到的,采样率决定了可以准确表示的最高音频频率。那么,我们的听觉究竟能检测到多高的频率呢?



人类听觉的频率响应
一般认为,我们听觉的频率响应大致为 20Hz 至 20kHz。实际上,只有幼儿才能听到 20kHz 的上限。年龄越大,听力的上限频率响应就越低。这种情况会随着年龄的增长而自然发生,但如果我们长期暴露在高声压级环境中,听力会在数年内加速受损。内耳中的微小毛细胞--立体定向毛会受到损伤并死亡,从而导致高频听力反应减弱。立体纤毛是不可再生的,因此,在你的一生和职业生涯中,最好通过使用听力保护装置和尽可能避免接触过大的声音,来尽力避免不必要的损伤。




目前有多种采样率。大致可分为以下几类:

CD 采样率

44.1kHz

88.2 千赫兹

176.4kHz


视频衍生费率:

48kHz

96kHz

192 kHz

确实存在比这更高的采样率,例如 384kHz。但它们很少使用,而且大多数软件都不支持。让我们来看看 44.1kHz 和 48kHz 采样率的由来。



44.1kHz 的起源
在 20 世纪 80 年代初期 CD 的发展过程中,其中一项要求就是格式必须能够重现高达 20kHz 的整个可听频谱。



当以数字方式表示声音时,根据Nyquist-Shannon采样定理可知,采样率必须至少是你想要重现的最高音频频率的两倍。这是因为每个波周期至少需要两个采样才能准确重现任何给定的频率。

官网视频链接:https://youtu.be/-jCwIsT0X8M



当Sony 和Philips 共同开发光盘格式时,他们的目标之一是能够重现整个可听频率范围。这意味着光盘必须使用 40kHz 或更高的采样率,才能覆盖 20kHz 以下的频率范围。在早期的数字音频时代,由于硬盘容量有限,在硬盘上存储相当于一张 CD 唱片的数字数据是不可能的。因此,录像机被重新利用,将音频采样存储为黑白视频信号。


在美国,这些录像机以每秒 30 帧的速度运行,每帧有 490 条可用线(不包括消隐线)。根据决定,每行视频应存储 3 个音频样本:

每行 3 个样本 X 490 行 X 每秒 30 帧 = 44 100。

在英国,录像机的分辨率和帧频略有不同。同样,如果每行视频存储 3 个音频采样,计算结果仍然是:每行 3 个采样 X 588 行 = 44 100:

每行 3 个采样点 X 588 行 X 每秒 25 帧 = 44100。

由于每行只能存储整数个采样点(1,2,3,4,5 等),因此 44.1kHz 是可能的最低采样率,以满足 Nyquist-Shannon 的要求,并允许在录像带上存储 CD 母带。这也是选择 44.1kHz 作为 CD 格式的原因。
48kHz 的起源
48kHz 采样率实际上早于 44.1kHz。48kHz 通常与基于视频的应用联系在一起,它可以追溯到 1978 年。当时还没有标准化的采样率,但有五种:45、48、50、52.5 和 54kHz。最终,欧洲和 NTSC 电视都选择了 48kHz,因为它既能满足奈奎斯特要求,又不会过高,还能很好地与基于帧的视频系统配合使用。48kHz 采样率的奈奎斯特频率确实略高于 44.1kHz,48kHz 能够捕捉和再现高达 24kHz 的音频频率,而 44.1kHz 则高达 22.05kHz。就实际感知质量和保真度而言,这一点并不十分重要,但它确实让我想到了下一点......

抗锯齿

抗混叠是用来防止高频信号采样率过低而无法准确捕捉其细节时产生的失真。当频率超过奈奎斯特频率(采样率的一半)折回到可听范围时,就会出现这种失真,即所谓的混叠,从而产生不必要的伪影。为了避免这种情况,在采样前需要使用抗混叠滤波器(通常是低通滤波器)来去除高于Nyquist-Shannon频率 。这可确保采样音频与原始信号保持一致,不会产生混叠伪音。在 44.1kHz 采样中,滤波器从 20kHz 左右开始(有时略早于 20kHz),到 22.05kHz 时完全切断。滤波器之前的频率范围称为通带。滤波器工作的范围是过渡带,而过渡带以外的部分则是停止带。实际上,以低成本制造极陡的滤波器并不容易,一些廉价的音频接口可能会在通带的高频出现纹波。这是滤波器设计不够完美的副作用,会在可听范围的上半部分造成一定程度的非线性。这个问题通常很微妙,但可以测量。48kHz 采样率使用的滤波器陡度稍低,仅在 24kHz 时达到完全截止,从而减少了通带中可能出现的纹波。当设备中使用了不太理想的滤波器时,人们可能会认为 88.2kHz 及以上的采样率比 44.1 或 48kHz 的音质更好,因为更高的采样率使用了更渐进的滤波器设计,而且无论如何,任何预设的波纹都会在超声波范围内。



过采样
在处理数字音频时,某些处理过程会产生超出原始录音中实际存在的谐波内容。使用饱和插件就是一个很好的例子。为了避免产生混叠和啁啾假象,一些插件会使用过采样。这是一种在处理之前通过在原始样本之间添加额外样本(通常使用插值方法)来提高音频采样率的过程。然后对音频进行处理,再将其降低采样率,使其恢复到原始采样率,从而消除处理过程中出现的任何失真,因为由于采用了过采样,这些失真大多出现在可听范围以上。这比一开始就以更高的采样率运行项目要有效得多。

高采样率的问题

根据目前听到的情况,以 88.2kHz 及以上的采样率录音和混音究竟有哪些主要缺点?首先,最明显的可能就是 CPU 占用率。采样率越高,意味着电脑处理器的负荷越重,因此,与使用 44.1kHz 或 48kHz 时相比,你将使用更少的音轨和插件来达到电脑的极限。此外,较高的采样率会占用更多的硬盘空间。将采样率提高一倍,任何给定文件所需的硬盘空间都会增加一倍。这一点相当明显,但也有其他缺点。

的确,在出现明显的混叠之前,较高的采样率会给你更多的谐波空间。但是,当音频遇到非线性因素(如饱和或中度到重度压缩)时,谐波内容就会产生,并很快达到或超过奈奎斯特频率,以混叠的形式反射回可听范围,并产生低频互调失真。

说到非线性,回放时模拟领域也会出现问题。高采样率材料包含我们听不到的超声波频率。在 192kHz 的采样率下,音频频率最高可达 96kHz。这本身似乎并不是什么大问题,但通过放大器等设备重放时,就会造成听觉失真,因为这些设备的设计并不能重现如此高的超声波频率。这些频率的存在,再加上模拟舞台设备的非线性特性,可能会成为失真的根源,如果没有预设超声波内容,听起来会比原来更糟糕。因此,坚持使用 44.1kHz 或 48kHz 的采样率通常是更好的选择。


何时使用高采样率

根据我前面所说的,使用 48kHz 以上的采样率似乎没有任何意义,但我要告诉你几个原因,为什么在某些情况下使用高采样率会非常有用。

在录制随后需要进行时间拉伸的音频时,使用 2 倍或 4 倍于预定传输采样率的采样率可以提供更密集的采样,因此在出现明显的怪异人工痕迹之前,可以更灵活地对音频进行减速或时间拉伸。这在 ADR 录音或某些声音设计工作流程中非常有用。以 96kHz 甚至 192kHz 的频率录制音效,可以让音效以更高的分辨率放慢和降低音调。此外,如果你需要录制超声波频率,然后将其下移到可听范围,高采样率是唯一的解决方案。处理完成后,音频可转换为传输速率(电影和电视内容通常为 48kHz)。

为什么需要这么多采样率?
很明显,44.1kHz 完全是由于 CD 发展时的技术限制而产生的。其衍生产品 88.2 和 176.4kHz 的存在只是因为它们是其数学倍数。现在,我们已经摆脱了物理格式的束缚,进入了一个大部分内容都以电子方式传送的时代,那么还有什么理由保留 44.1kHz 吗?显然,我们需要保留以该采样率处理传统内容的能力,并在该格式仍然存在的情况下制作 CD 母带,但我们现在难道不应该转而使用 48、96 和(必要时)192kHz 吗?至于任何高采样率的优点,两方面都有争论。 我很想听听你们的观点,请在评论中与我分享。
2
 楼主| 发表于 2024-11-13 08:31 | 只看该作者 来自 浙江杭州
一句话概括,高采样率的主要作用是用于后期音频制作
回复

使用道具 举报

3
发表于 2024-11-13 11:51 | 只看该作者 来自 广东
一句话搞掂的事居然码那么多字
回复

使用道具 举报

4
发表于 2024-11-13 11:56 来自手机 | 只看该作者 来自 北京
数字文件编辑过程中会用到24/96级别。
回复

使用道具 举报

5
发表于 2024-11-13 12:24 来自手机 | 只看该作者 来自 北京
感谢老师给予的指导
回复

使用道具 举报

6
发表于 2024-11-13 12:30 来自手机 | 只看该作者 来自 中国
太长不想看
回复

使用道具 举报

7
发表于 2024-11-13 19:07 来自手机 | 只看该作者 来自 中国
挺好,终于看到了一点有用的知识
回复

使用道具 举报

8
发表于 2024-11-14 08:19 来自手机 | 只看该作者 来自 陕西西安
苹果音乐常听到的有44.1,48,96,别的不常见,以为新歌无损都是能到192,还是48居多
回复

使用道具 举报

您需要登录后才可以回帖 登录 | -注册-

本版积分规则

Archiver|手机版|粤icp备09046054号|耳机网-耳机大家坛

粤公网安备 44030602000598号 耳机大家坛、www.erji.net、网站LOGO图形均为注册商标

GMT+8, 2024-11-22 07:45

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表