转载：音箱耳机的本质是还原而不是“美化“

sin4423 · 发表于 2022-1-30 09:47

转载的目的很简单，就是给大家参考下，不要被所谓的发烧大神忽悠，少交智商税。
对Hi-Fi的再思考：音箱耳机的本质是还原而不是“美化”

文：刘陆伟（音乐制作人、唱作人、录音混音师、吉他手、释魂乐队主创）

作为一个热爱音乐的听众，同时也是音乐制作人、录音混音师，有感于所谓的hi-fi界、发烧界长年累月充斥着各种谣传谬论，看到萌新小白被各种不负责任的错误观念所误导，所以写下这个系列连载长篇文章，希望能尽量拨乱反正、去伪存真，让热爱音乐的朋友少走弯路。只欢迎比较理性客观、愿意讲道理的人来讨论，至于那些不讲道理的、感觉自己利益受到了威胁来找茬的，我没太大兴趣跟你们争论，也没抱希望你们能改变。如果有朋友觉得文章对您有所帮助或启发，也欢迎留言支持。有什么疑问也可以留下，我会挑合适的或者力所能及的来帮您解答。

音箱耳机的本质是还原而不是“美化”（1）

文：刘陆伟（音乐制作人、唱作人、录音混音师、吉他手、释魂乐队主创）

事先声明，本文不是学术论文，所以较少使用专业术语，尽量用大家易于理解的词语。本文所说的音箱指的是重放音乐、影视剧等用的音箱，俗称高保真音箱——Hi-Fidelity，简称Hi-Fi，国外也有另一个词来描述这类设备：FRFR（Full-Range,Flat-Response），即频响范围足够宽、频响足够平直的音箱。本文所说的音箱不包括电吉他音箱之类的某类乐器专用音箱，那属于用途完全不同的另一类音箱，关于电吉他音箱我有专门的文章论述。另外本文所讲的关于音箱的道理，大部分对于耳机也同样适用，例外的部分后面会讲到。

音箱耳机作为声音重放设备，一开始本来没有“民用”和“监听”的区别，只有“指标更好（更贵）”和“指标较差（便宜）”的区别。同样级别的音箱耳机，如果非要分出哪个是“民用”的，哪个是“监听”的，那也不应该是主要通过声音来选择，而是应该根据应用场景，在其他附加功能方面去选择。说到音质，所有音箱耳机其实应该都是朝着同一个大方向努力，那就是：频响范围更宽、频响曲线更平直、时域响应更准确更迅速、动态范围更大、失真更小、声像定位更准确等等，用一个词简单概况就是：高保真。当然，这也是Hi-Fi这个词的本意。

然而有一种广为流传的说法，将两者割裂开，把“Hi-Fi”一词和民用设备划上了等号，同时把监听设备当做异类给排斥出去，结果就出现了各类打着“Hi-Fi”旗号的商家、玩家、媒体讨论的不是高保真，却是追求各种“声染”的奇葩现象。而且他们长年累月向大众灌输“监听音箱耳机声音直白、清淡、干冷，只适合专业人士工作使用，不适合欣赏音乐，只有民用音箱耳机才适合欣赏音乐”的谬误观点，遗毒甚广。

人们对于音箱耳机最大的误区就是以为它们的主要作用是“美化”声音，其实只需举个简单的例子，稍加思考，我们就很容易意识到其谬误之处。假设有一段音乐，本身由于录音混音的原因导致高频过多，你用了一个高频较少的音箱耳机去听，或许那段音乐的缺陷会稍稍得到缓解，显得不那么突出了，但难道您买这音箱耳机就只听这一段音乐么？每段音乐都是不一样的，肯定还有更多的音乐，它本身的高频是正好，或者偏少的，那么你用这个高频较少的音箱耳机去听，岂不是就问题更严重了？声音更失衡了？按照那种理论，岂不是每听一张不同的专辑，都得换对不同声染的音箱耳机去“美化”？

我通过和持这类观点人士的交流，发现了他们之所以抱有这种错误观点或者很容易被这种谬论影响的一个重要原因，就是：他们对唱片制作的过程，对音乐制作的理念、设备、方式方法等方面知之甚少。

真正美化声音的是在声音重放之前的环节，也就是从演奏、演唱、到录音、混音、母带处理等音乐制作环节，在这些环节有无数个专业的技术手段和设备来美化声音，要比在音箱耳机环节再去美化声音要更有效率千万倍，更有针对性千万倍。

不同的音乐风格、不同的音乐人、不同的专辑、不同的曲目、一首曲目里的不同声部，它的音乐内容和频率分布等等都是不一样的，而且它是实时动态变化着的，你又如何只靠一款重放设备的笼统的声染，去对做出有意义的美化呢？

至于一个音乐该被美化成什么样，其中的每个声部、每个音符该美化成什么样，某个声部的音色该多“干”或者多“湿”，该多“冷”或者多“暖”，该多“清淡”或者多“重口”，该加什么效果，加多少效果，效果的诸多具体参数该如何设置……等等所有的一切，都是在唱片制作的过程中就已经做好了的。

凡是对自己的作品负责任的音乐人、制作人、录音混音师，都会追求更好的演唱演奏技巧，更好的乐器和效果器，更好的录音棚或声学空间，更好的录音设备和技术，更好的混音设备和技术。绝大多数正式发行的专辑，都是音乐人和制作团队在当时的经费水平、制作水平和审美水平下所能做到的最好，他们已经用了他们能用的所有手段，从各个角度和各个细节上美化了这些声音，达到最接近他们的艺术理念的程度之后，才会发行出来。

举个例子方便大家理解。比如想要一个人声的音色多“暖”，在重放环节之前有多少手段可以使用呢？首先是作曲在调式和定调等方面的安排考虑，然后是歌者的人选，他本身的嗓音特征，演唱方式技巧处理，然后选择用什么样声染的话筒和话放来拾音，录音信号链上的其他设备也可以按照音乐人的需求来选择不同的声音特点，到了后期混音环节，用什么效果器去处理，均衡该怎么调，压缩该怎么加，混响该怎么加，要不要过summing加模拟设备声染等等，经过创作者、音乐人、制作人、录音混音师等专业人士一系列的美化、修饰，最终达到他们认为最合适的那个“暖”的状态。

这只是冰山一角，每个声部的处理方式都是不一样的，都要根据各自具体的特点去做不同的处理，甚至往往是天差地别，比如有的声部需要加很大的混响，而有的声部则完全不需要加混响。而且，把单独一个声部的音色调到满意了，当有其它声部加进来之后，因为声音的掩蔽效应等因素，听上去就不一样了，没有单独听的时候那么令人满意了，于是它们的音色又都需要再做调整。任何一首有多个声部的音乐，都要考虑它们之间的互相掩蔽和互相影响，混音师同时既要考虑个体又要考虑整体。而且随着歌曲的进行和展开，不同段落的声部的疏密在不断变化，音乐表达的内容也在变化，对各个声部的调整处理也要不断随之变化。可想而知，这是一个多么复杂、精细的过程！相比之下，只是靠重放音箱耳机那点笼统的声染又能做多少“美化”？……

总之，当一个音乐已经制作完成，将所有声部美化、修饰、处理后合并成一个双声道立体声的音频文件之后，到了重放环节，就根本无法再对其做出什么有效率的、有针对性的美化。退一万步说，如果您真的对某首歌某个地方的音色和处理不满意，那抱歉，除非你能拿到原始的分轨素材去找人重新混音制作之外，没有任何办法，这根本就不是通过买一对儿有如何声染的音箱耳机就能解决的问题。

所以，音箱耳机作为重放设备，从本质上来说就不应该承担对音乐进行美化的义务。

所以，音箱耳机应该看的是它的技术指标够不够高，能不能完整地、平衡地、忠实地还原音乐本来的面貌。

所以，听众应该要做的，是用尽可能在品质上接近音乐人、录音混音师在制作音乐时所用的专业监听音箱的重放设备，来听到这音乐本来应该呈现的面貌。

所以，当您从之前用的比较差的音箱，升级到了更好的音箱，听到了更完整的频段、更平衡的比例、更丰富的层次、更清晰的细节、更紧凑的音头、更结实的低频、更立体的空间感、更准确的声部定位等等，觉得同一段音乐听上去比以前更动听了、更震撼了、更感人了，精神享受更深刻了，这一切并不是因为它美化了这段音乐，只是因为它更接近这段音乐本来的样子了，而您之前一直没机会感知到那些内容，错过了那些本就存在的音乐信息。

音箱耳机的本质是还原而不是“美化”（2）：Hi-Fi一词是如何被扭曲的

文：刘陆伟（音乐制作人、唱作人、录音混音师、吉他手、释魂乐队主创）

当然，一说“还原”这个词，大家会觉得它没有“美化”这个词听上去那么带劲、高级。比如我们看百度百科对“监听音箱”的解释：监听音箱是没有加过音色渲染（音染）的音箱。这个“加”字很容易让人们误会，因为一般的认知里，但凡是“加”了什么东西，那一定比“不加”要更好、更高级。

但实际上，在音箱耳机的设计制造上，“还原”才是最难达到的，是那个永远不可能百分百达到、只能逐渐去靠近的终极目标。具体点来说，就是如何让频响范围更宽、频响曲线更平直、时域响应更准确更迅速、动态范围更大、各种失真更小、离轴响应更好、最佳听音范围更广、声像定位更准确等等。

自然界中一切声音——不管是风雨雷电声、人声还是小提琴声，其本质就是物体振动引发的空气振动。话筒、唱片、音箱这些东西发明出来的目的就是为了拾取、记录和重放自然界中的声音，话筒是把这些空气振动转化成电信号以便进行记录、修改和放大，音箱是把这电信号转化成空气振动再给重放出来，唱片则是中间的储存媒介。

如何让大家能比较直观地理解重放设备的“还原”呢？假设有两个形状、体积、声学特性完全一致的房间A和B，互相之间完全隔音，让一个人在A屋的某个位置进行木吉他弹唱，用话筒拾取他的声音，将其转化成电信号，传到我们听音者所在的B房间，用某个音箱重放出来（音箱相对于B房间的所在位置和那位弹唱老兄在A房间所站的位置也是一样的，我们听音人相对于B房间的所在位置也和那个话筒相对于A房间的位置是一样的），假设拾取和传输环节信号没有任何损失，那么如果这个音箱足够“还原”，那所有拾取到的声音信息、频率分布和比例、所有动态和音色变化的细节都会再现出来，那身处B房间的我们闭上眼睛，会感觉他仿佛真的就在B房间里，在我们面前弹唱。

可想而知，想要音箱能做到这一点，是非常难的（尤其是在以前的时代），只有随着科技的进步，我们才能一点点向这个方向逼近。

最早的音箱，大家在年代片里会见到的那种大喇叭，虽然外观很美观很复古，但是各项技术指标都是非常糟糕的，重放频段极窄不说，底噪很大，频响极其不平直，失真也很严重，当然那时候也没有双声道立体声技术，所有声音都是一个点出来，毫无声像展开、声场宽度等可言。正是人类为了追求更还原的声音重放，才有了“高保真”这个理念，才有了Hi-Fi这个词。

随着电声学、材料学等方面的科技不断进步，喇叭、放大器、分频器、箱体等的设计水平和生产工艺不断改进，音箱能够重放的频段越来越宽、频响曲线越来越平直、底噪更小、动态范围更大、失真更小、声像定位更准确、瞬态反应更好、离轴响应更好、最佳听音范围更广、转换效率更高。上世纪二十年代有声电影问世，电影产业成了推动音箱音质提升的重要动力。WW2时期，相关技术主要为junshi服务。WW2后，人们对音乐娱乐的需求逐渐恢复并越来越强，促使着录音技术和重放技术（以及唱片工业和音乐产业）的快速发展。实际上一直到了差不多六七十年代，人类才能批量制造出价格让中产家庭能够承受的、在各项音质指标上能达到比较“高保真”的音箱，“高保真音箱”这个概念才逐渐在发达国家中产及以上家庭逐渐普及。

然而随着市场的发展，越来越多的商家想挤进来分一杯羹，行业竞争加剧，各种幺蛾子也就越来越多，Hi-Fi这个词逐渐被很多商家、媒体（以及被他们误导的发烧友）扭曲了，偏离它的本意越来越远，甚至成了它自身的反义词。在巨大商业利益的驱使下，Hi-Fi领域各种智商税产品越来越多，为了给其编造出卖点，各类玄学开始大行其道。最典型的一个谬论就是把真正的高保真（也就是“还原”）说成是“清淡”、“白开水”，而声称自己的设备能如何“美化”、“修饰”输入信号。把“Hi-Fi”和“监听”对立起来，以达到其不可告人的目的。

大众缺乏对相关技术和原理的了解，音乐听力也没有得到训练和开发，很少有机会听过好的原声或扩声的音乐演出现场，更少有机会试听对比过一些比较好的重放设备，没有建立起基本的声音审美，于是面对商家媒体的各种似是而非、夸大其词的说法，缺乏分辨力和抵抗力，极易受到谬论的误导。再加上人类主观心理听觉的特性，很容易受到产品的外观、价格、名气、营销话术等音质以外因素的心理暗示，也就是所谓的“脑放”。这也造成音频领域的玄学比起视频领域要严重得多，各种枉顾基本科学理论和客观事实的奇谈怪论层出不穷，以至于让Hi-Fi一词逐渐沦为了很多人眼中的笑柄。

音频领域很悲哀的一个现象就是，近些年来大众对音乐重放品质的追求停滞不前，甚至可以说是倒退，尤其是和视频领域相比起来，这种停滞倒退显得非常扎眼。原因很多（后面我会一一分析），但这些无良商家、媒体和“老烧”的谬论误导也是“功不可没”。这些谬论典型代表如：“用带有不同声染的音箱听音乐，是对音乐的二度创作”（照此歪理，是不是买个偏色的、分辨率低的显示器看电影，就是对电影的二度创作了？……）；“重放设备的音质好坏没有标准，完全看个人喜好”（嗯，把水搅浑了，才好浑水摸鱼……）；“音质好坏无法用技术参数衡量，参数好的不一定好听，好听的不一定参数好”（意思是只能看他们那些主观听评文章咯？那些充斥着夸大其词、不懂装懂、奇特脑洞的玄幻文字……）；“几十年前的古董音箱、电子管功放声音比现在技术参数更高的音箱还要好，磁带、黑胶这些唱片载体比高精度数码音频还要好”（那技术干脆别进步了呗，大家都开倒车呗……）。

但同时这些商家、媒体和老烧又会在在边边角角的辅助环节上大做文章，炮制出价格高昂但其实对声音重放质量影响甚微的产品，声称换根天价线，换个天价电源，换个天价音箱架，甚至换个天价的“HI-FI专用”交换机，就能瞬间让声音变得如何如何优美动听。他们声称自己的金耳朵能听出专业仪器都测量不出的声音差别，然而却连基本的声学、建筑声学、电声学的常识都不具备，比如房间声学这种对声音重放质量影响更大的方面，他们却很少讨论，看他们晒听音室的照片，房间往往都没做什么像样的声学装修，很多人甚至连立体声音箱该怎么正确摆位都不知道……

他们那些似是而非的谬论对于大众的误导比大家想象的还要深远。虽然诸如“核电水电的音色区别”之类过于明显的扯蛋言论现在已经成为大众调侃的段子了，但也造成“Hi-Fi”一词被妖魔化了，导致大众容易走向另一个极端，就是干脆不追求音质了，把“追求音质”这件事本身也给否定了。

难道人类真的对于重放设备的好坏没有一个基本标准、完全看每个人不同的个人喜好？（其实就是那些商家、媒体和老烧们的个人喜好……）然而其实相关的学术研究已经很多，学术界曾经做过多次受控双盲听测试，选择不同年龄、性别、教育背景、文化背景的人作为受试者，尽可能排除品牌、外观、价格等非听觉因素的干扰后，实验结果证明，绝大多数人依然更喜欢更平衡、更还原、更高保真的声音重放。

重放设备的音质随着科技的进步一直在进步，总体来说，新的要比旧的好。无论在哪个时代，专业大型混音棚、母带棚里所使用的主监听音箱，基本上就是当时指标最高，最先进，最准确，最平衡，最还原，最高保真的音箱。其实前面我假设的那个弹唱的例子，用当今最顶尖的录音设备和监听音箱，已经可以很接近地实现它了，虽然还达不到百分之百吧，但这世界上本身就没有百分之百的东西。如果说一百年前人类最好的音箱的还原度还不到百分之十，那么现在最好的音箱的还原度相比之下能达到百分之八九十了。

我再举一个例子，历史上有些经典的双声道立体声古典乐录音，后来要出5.1环绕声重制版，其新加的环绕声道（也就是左后、右后声道）里的主要信息就是音乐厅的混响反射声，实现方式要么是用人工混响效果器——这样和当时录音所在的那个音乐厅的真实自然混响肯定是有较大出入的，要么是请交响乐团到那个音乐厅再演奏一遍，用环绕声制式话筒重录一遍，这样做的话混响倒是真实自然了，但就算能把当年的交响乐团和指挥家原班人马请过来，无论是乐器的音色还是演绎肯定都不可能和原版一模一样，那怎么办呢？其实很多环绕声唱片是这么做出来的：用顶级的监听音箱，在音乐厅舞台上播放原来的双声道录音音频当做声源，然后用环绕声制式话筒录下的后方混响作为左后、右后环绕声道的内容，被发烧友津津乐道的环绕声重制版就这么做出来了，而且效果很好。如果不说明的话，那些发烧友根本听不出声源是音箱而不是真人演奏……

音箱耳机的本质是还原而不是“美化”（3）

文：刘陆伟（音乐制作人、唱作人、录音混音师、吉他手、释魂乐队主创）

一说到“还原”，又有些发烧友认为“还原”的目标就是还原现场，这其实也是片面的。我发现还是必须回归到音乐制作、唱片录音混音的发展历史，才能更好地帮大家讲明白这个问题。

录音技术出现之前，那时的音乐我们可以称之为原声音乐（Acoustic），使用的都是原声乐器，在自然的厅堂或者环境里，靠乐器本身物理振动发声，音量和音色等都完全靠乐器和演奏者本身控制，还没有电声学技术的介入。那时的音乐类型主要是交响乐、民间音乐、教堂音乐、爵士乐等，其中只有交响乐团的声部间比例平衡能够达到比较好的程度，其他的很多音乐风格和乐队形式都达不到这么好的平衡度。交响乐团里的那些乐器都是经过长期实践后挑选出来的，它们需要在音色上和数量上进行合理的搭配，以使得合奏起来能够得到平衡的音响效果。作曲家在编曲配器的时候就得考虑实际合奏出来会是什么样，指挥则要按照他对总谱的解读指挥着乐手们，乐手也都是万里挑一的精英，他们要能够精准地控制自己的乐器，在指挥的指导下通过反复的排练，让作曲家的意图准确再现出来。古典音乐的录音师要做的就是把这种经过几百年的发展的、在原声现场演奏状态下就比较平衡的音乐给忠实地记录下来。

早期的录音基本都是现场录音，在乐队演出的现场摆好话筒、开录就行了。最初就是用一只话筒拾取声音，录下来的声音用一只音箱重放，这可以理解为所谓的单声道（mono）。后来出现了双声道立体声录音技术和双声道立体声重放系统（stereo），用两只话筒按照立体声拾音制式来拾取声音，录下来的声音分为两个声道，分别让两只音箱重放，如果一切都按照立体声理论的要求来正确设置和摆放的话，听音人就能听到在前方左右两只音箱间形成了一个“声场”（准确的说应该叫立体声虚声源定位），声音的重放开始有了方位和宽度。

但那时候后期处理的技术极其有限，就算有，也是迫于记录和重放设备的性能局限而不得不做一些妥协处理，例如，压缩效果器发明的初衷，主要是因为黑胶和磁带动态范围不够大，承载不了交响乐的动态范围，所以不得不把录到的声音信号的动态范围压缩小一些，再灌录到唱片上。而今天，动态范围早已不是问题，压缩效果器的用途也发生了巨大变化，更多是被当成一种美化音色、修饰音色的手段。

随着录音技术、音频处理技术的发展，出现了多轨录音机、分轨录音技术、以及越来越多的效果器种类，人们早已不再仅仅满足于“用一对立体声话筒录下现场演奏演唱，不做任何后期处理”这种“原始”的方式了。事实上，这种方式的确也往往难以达到令人满意的效果，即使是对古典乐而言。因为虽然西方的交响乐团经过几百年的发展，已经达到了声部间的比例比较平衡的状态，但依然没有真正达到完美，现实中很多音乐厅的声学环境也谈不上完美，各种因素加起来，经常会有主奏乐器被伴奏声部盖住，主奏乐器、主唱或者某些solo乐器不够突出，清晰度不够，直达声和混响比例不理想等等情况。所以就连崇尚“自然、原声”的古典乐现场录音，后来的录音师也经常会使用主话筒和点话筒配合的多轨录音技术，并且后期使用效果器去美化、修饰声音。

而现代音乐绝大多数是在强吸声的录音棚里，通过分轨分期录音、后期混音合成的方式录制的。效果器的使用越来越多，混音的作用越来越重要。

现代音乐所使用的乐器，大多数个性太强，不像古典交响乐团里那些乐器适合多把同款一起齐奏。近现代乐器发展历史太短，其中很多乐器自身的声学特性还不够成熟。例如，如果你听过架子鼓的原声演奏就知道，架子鼓自身的各个部件之间其实是无法获得令人满意的音量比例的（镲片的声音会非常大，而最能体现歌曲节奏律动的底鼓则显得音量偏小，一旦有其他乐器加入进来，底鼓则可能完全听不见了）。这些现代乐器之间的合奏、搭配就成了个新问题，如果架子鼓和民谣吉他一起演奏，民谣吉他会完全被鼓盖住。而且没法像交响乐团那样，通过增减乐器的数量来控制声部间的平衡。

除了原声乐器，现代流行音乐还会使用各种电声乐器（电吉他、电贝司）和电子乐器（合成器、鼓机），电声乐器需要通过各自的专用音箱来正常发声，电子乐器则默认应该是以FRFR音箱来发声。它们倒是可以通过音箱来调节音量。但问题是，如果没有一个像指挥一样的角色站在全局的、观众的角度来指导，每个乐手都只希望自己的声音越大越好，最后就会变成一团糟。

所以现代音乐基本都是用话筒对每个乐器拾音，输入进混音台，混音台可以单独调节每一路信号的音量，来调节声部比例平衡。为了让后期混音有更大的处理自由度，前期录音要尽量不带空间信息（混响要少），尽量清晰干净（杂音要少），这催生了现在我们所熟悉的那种强吸声、强隔音的录音棚。乐手歌手们也不用像古典时期一样非得在一起同时演奏了，而是可以各自分别录好，后期靠混音来合成。混音师呢，就起到了类似指挥的角色。

现在我们能听到的音乐，无论是流行、爵士、摇滚、电子等，里面几乎每一轨、每一个声部都是经过很多效果器处理过的，而不是乐器本来的原始音色，更别说合成器所制造出的声音，那根本就是自然界不存在的声音。那么问题来了：对于自然界中原本不存在的声音，我们如何判断它在重放环节是否足够“还原”？当然就更应该以专业监听音箱为准了，因为这些声音在制作时就是用监听音箱来听的。

唱片的制作早就不再局限于还原现场了，音乐人和录音混音师有更多的手段对声音进行美化了，可以按照自己的艺术理念去追求完美的声音呈现，音乐制作有了更大的艺术想象空间。唱片的声音审美早已经超越了现场的声音审美，成为一套独立的审美体系。

事实上，对于现代音乐来讲，现场的声音审美是以唱片为指导标准的，而不像很多人想象的、唱片的目的就是越还原现场越好。现在绝大多数的音乐现场演出，都是需要扩声的，经常都要把原声乐器、电声乐器、电子乐器混合使用。原声乐器要用话筒拾取之后再用扩声设备重放出来，电声乐器和电子乐器则可以直接走line in再用扩声重放出来，那么这样的一个现场演出，它们的声部比例的标准是什么，它的音色应该要处理成什么样，基本上就是以这首歌的录音室唱片版本为标准的。但是现场演出由于种种条件限制，没法做到像在棚里做唱片那样细腻、精致、完美。

所以有些发烧友认为声音重放“还原”的目标就是还原现场演出，这是不对的。实际上，重放设备应该还原的目标是唱片，更严格来讲，是母带（因为唱片在从母带变成批量生产的、可供销售的唱片的过程中，音质还会有一定程度的损失）。很多发烧友只知道“母带”精度最高、音质最好，市面上也有各种打着“母带”幌子忽悠发烧友的产品，但很多人并没有真正理解母带的含义。母带是一个音乐创作出来之后，经过录音、混音、母带处理等一系列美化之后的、交付唱片生产工厂去大批量复制之前的那个音频文件，它代表了作曲家、音乐人、制作人、录音师、混音师们对这个音乐作品应该以什么样子呈现的最终定论。

母带就代表着成品，代表着美化的尽头，自此之后的环节只需要还原。如果还有人不同意，那我只好请您再把我之前的文字认真看看，再好好理解一下这句话：大千世界的每段音乐成品都是不一样的，而且音乐都是实时动态变化着的，重放环节根本没法对不同的风格、不同的专辑、不同的歌、不同的段落去做出什么有针对性的、有效率的美化。

耳机的问题我后面的文章会讲到。耳机和音箱差距很大。耳机因为它本身的特点决定了没法有统一的测量标准。一，声场没法正确还原，头中效应。二、同一个耳机压得紧一点还是松一点，频响就会有极大的差别，所以没法进行准确的测量，业界也一直没法有一个统一的标准，所以专业录音混音根本就不能以耳机为主，而是音箱为主，耳机偶尔辅助用一下。所以耳机根本就不能被拿来说事，耳机是个更加没有标准，玄学更多，智商税产品更多，更容易浑水摸鱼，更加混乱不堪的市场。所以那么多资本纷纷涌进这个领域想要浑水摸鱼捞一把。

至于某款音染严重的产品销量高，这些只是表象。我分析的就是表象背后的本质，而不是只停留在描述表象。你们最大的一个误区就是觉得消费者买了音染严重的设备是他自己真正的追求，是他自己严格对比后理性选择的结果，用脚趾头想想这也不可能，事实根本不是这样。

大部分人买耳机哪有什么像样的试听啊……就算偶尔有，能做到严格的双盲对比实验么？做不到的话即使有所谓的试听能说明什么？对于一个本来就没有听音经验，没有建立基本正确声音审美的个体，如果不能做到严格的双盲对比，他更多受到的是产品的外观，品牌，名字、价格，他人的评价、推销文案的影响而已。所以音频领域乱象才这么严重，发展才多年停滞甚至倒退。消费者最大的错觉，就是以为自己做的每次选择都是理性的，都是自己真正想要的，其实日常环境下，他们太容易受音质意外的因素的干扰，以及各种主动被动的心理暗示，只有严格的双盲对比试听，才能揭示出人们真正的喜好。其实相关的学术研究已经很多，学术界曾经做过多次受控双盲听测试，选择不同年龄、性别、教育背景、文化背景的人作为受试者，尽可能排除品牌、外观、价格等非听觉因素的干扰后，实验结果证明，绝大多数人依然更喜欢更平衡、更还原、更高保真的声音重放。

音箱耳机的本质是还原而不是“美化”（4）

文：刘陆伟（音乐制作人、唱作人、录音混音师、吉他手、释魂乐队主创）

民用音箱耳机、音乐播放器、音乐播放平台总是给消费者提供一些“特殊音效”，而且往往会起一些特别玄妙唬人的名字，其实原理都非常简单，不过是制作音乐、录音、混音里所常用的最基本的几种效果器罢了，只是在此基础上的傻瓜化而已。

最常见的是图式均衡器（Graphic EQ）。图式均衡器是一种很古老也局限性很大的均衡器，频点、Q值等参数都被固定死了不能调节，只能在厂家规定好的某些频点上做个简单的提升或者衰减，没法像参量式均衡器那样能声音信号做出灵活、精细的调节。但是由于其相对造价低廉、使用简单，所以民用设备上提供的均衡器基本上都是图式均衡器。厂家往往会预制一些均参数，美其名曰“古典”、“流行”、“人声”、“重金属”、“舞曲”等，然而，如果您看过了我的第一篇文章，就应该能明白了，这么做其实根本没意义。就不要说很多歌曲根本无法被简单归为某种风格，就算某种风格里最有代表性的作品，互相之间在频率分布上的特点也不一样。

事实上，不同的音乐风格、不同的音乐人、不同的专辑、不同的曲目、一首曲目里的不同声部，它的音乐内容和频率分布等等都是不一样的，而且它是实时动态变化着的，某个声部你对它在歌曲这一段落里的处理，到了下一个段落很可能就不适用了。而且，不同的声部它们的频段不是泾渭分明的，而是互相重叠的，对于一个所有声部已经被混合导出的音频成品来说，比如你想衰减一下贝斯，你衰减了一下贝斯主要所在的某个频段，然而其他很多声部比如吉他、人声、鼓、钢琴等也都在这个频段有重叠的部分，一动就所有声部都要受影响，往往根本起不到某些老烧所幻想的“二度创作”“美化修饰”的结果。

现实中这种均衡器被滥用、错用的例子很多。我就曾有个亲身体验，一位平时挺热爱音乐的朋友，看他也会花钱买很多磁带CD，有次我去他家，第一次用他家的民用家庭影院放了张CD听，声音一出来我就震惊了，低频极其臃肿，整个音乐已经是轰隆隆的一片浑浊低频，其他很多声部几乎都被掩盖住了，我一检查才发现是他功放上有个EQ，而EQ被调节成了极为夸张的参数，我惊讶地问他难道你一直是这样来听音乐的吗，他说他也不知道那个是谁调过，反正家里人一直都这么听，似乎感觉也跟别的地方听到的音乐不一样，但也说不上来哪儿不对劲……我帮他都恢复到零，一开始他还有点不高兴、不适应，但过了段时间跟我说感谢我帮他解决了这个问题，现在听音乐比以前清楚多了，舒服多了。

除了均衡器，民用设备上常见的画蛇添足的东西还有混响效果器。很多民用音箱耳机、音乐播放器、音乐播放平台提供诸如“大厅”“房间”“教堂”“舞台”之类的混响效果给音乐成品。且不说，一个音乐在制作的时候，混响该怎么加就已经处理好了，就算想后期加，也不能笼统加啊，一首歌里不同的声部要加的混响的量不都是一样的，有些声部通常要加很大的混响，而有些声部（如贝斯和底鼓）通常是不加混响的，否则会让整个低频变浑浊、拖沓。对于现代音乐来说，往往一首歌里不同声部要加的混响的类型都会不一样，完全看音乐人、混音师的艺术追求。音乐制作中所用的专业混响效果器，有非常多的调节参数，比如reverb time，reverbtype，reverb width，earlyreflection，pre delay，decay，damp，diffuse，hi cut，lo cut，crossover等等，非常复杂，怎么用好它是一门精深的学问。所以民用设备上的混响效果器，除了让整体声音浑浊拖沓，清晰度降低，破坏原本声像定位之外，也没任何益处。

这些商家试图给普通消费者营造一个假象，就是能让他们也可以体验一把“像音乐人一样美化音乐”、“二度创作”的快乐，让自己的产品显得很厉害，好定出更高的价位。但这一切真没什么意义。如何用好效果器，对于一个职业混音师来说，需要经过多年的学习，大量的工作经验，建立起成熟稳定正确的声音审美，才有可能使用得当。相比之下，普通消费者缺乏相关的知识，也还没有建立起一个基本正确的音响审美，让他们自己去调节，只会适得其反。

更何况效果器这种东西也是有质量差别的，而且差别很大。专业音乐制作中使用的，高品质的、声音自然、可调节性强的效果器，无论是硬件的还是软件的，都非常贵，随随便便就抵得上高档音箱或耳机的价格。而那些民用重放设备、音乐播放器、音乐播放平台提供的效果器，基本上都是成本非常廉价、品质非常低的，会引入各种失真，严重劣化音质。

音箱耳机的本质是还原而不是“美化”（5）：聊聊所谓的声场

文：刘陆伟（音乐制作人、唱作人、录音混音师、吉他手、释魂乐队主创）

对于声音重放，大众很关注的一个方面就是所谓的“声场”，究其根本无非主要是三个方面，一是左右方向上的总体宽度，二是在这个宽度内的各个声部的定位，三是前后方向上的纵深感。

录音技术一开始只是用一只话筒拾取声音，用一个喇叭重放出来，所有的声音都挤在一起，从一个点发出来，没有舞台宽度展开、没有环绕、空间感很差，这就是所谓的单声道（mono）。但人们肯定不满足于此，因为现实中听到的声音都是来自各个方向的。后来科学家研究了人耳到底是如何感知声音方向的，在此基础之上提出了双声道立体声录音技术和双声道立体声重放系统（stereo）。

注意，“双声道立体声”包含两个环节，缺一不可。也就是说，如果你的重放系统是满足双声道立体声规范的，但播放的音乐却是单声道格式的，也出来的效果也只是单声道。反之，如果你播放的音乐是双声道立体声格式的，但你的重放设备不满足双声道立体声重放系统的规范，那也无法得到最佳的立体声感受。

那么双声道立体声录音技术是什么？简单来说。录音技术的早期，分轨分期的录音技术还没出现，那时候的音乐录音都是类似古典乐这种现场一次性录音合成的方式录制的音乐。用一对立体声制式话筒（主要有AB制式、XY制式、MS制式等）录下现场音乐，其中一只话筒拾取的信号送给左声道，另一只话筒拾取的信号送给另一个声道。

双声道立体声重放系统是什么？简单来说，用两只相同的音箱放在听音人前方左右各三十度，和人头形成一个等边三角形，分别重放左声道和右声道。而左右声道信号必须是在录制过程中就具备了立体声相关性，具备一定的时间差、相位差、音色差等信息，这样就会在两只音箱间产生虚声源，通过控制某个声部在两个声道间的时间差、相位差、音色差等信息，就可以让它定位于两只音箱之间的某处，所以这是一种虚拟定位。

双声道立体声是在当时技术条件和成本限制下，最经济实惠的一种能让声音有一定宽度的方式。因为乐队位于听众前方的舞台，乐队的声音都是来自正前方，后方侧方的声音相对不那么重要。至于引入后方、侧方声道，那是后来5.1、7.1等多声道环绕声的事儿了。

对于用双声道立体声录音技术录得的音乐（绝大多数古典乐之类的现场一次性合成录音）而言，每个声部，每个乐手的位置该在哪儿，一是看他现场真实的位置在哪儿，二是录音师在架设立体声制式拾音话筒的时候，通过拾音制式的选择，角度、距离等的选择，就决定好了重放的时候乐队的宽度如何，声部在横向上展开的疏密度如何。如果需要给某个声部架设单独的点话筒，也可以通过拾音制式的选择和调整，来让它的声像窄一些或者宽一些。

而现代音乐绝大多数是在强吸声的录音棚里，通过分轨分期录音、后期混音合成的方式录制的。这种方式下每个声部的在声场中的声像定位，从横向上讲，完全是通过混音台上每个通道的Pan（声像电位器）来决定的。

至于一个声部的纵深感，也就是距离听音者多远多近，主要是由它的直达声和混响的比例，它和其他声部在响度上的对比，以及音色的明亮度多种因素综合影响的。

所以说，所谓的声场，它的各个方面其实基本上都是由录音师、混音师控制的，听众如果用越接近他们的设备和声学环境去听，就能听到越准确的声场。再好的音箱也不能无中生有。所以在一些发烧友的音箱主观听评里，那些对于声像定位、所谓“声场”的夸大其词、玄之又玄的描写，很多只是他自己的脑放罢了。

比如所谓的声场的总体宽度。其实当你按照立体声重放系统的规范要求摆好音箱，坐在最佳听音位后，声场的总宽度就已经定死了，就是从左音箱到右音箱这个宽度，正常情况下声音不会比这个宽度更宽。但是当声音中有了反相成分，会破坏正常的相位和声像定位，会让听音者主观感觉声音的位置好像飘到音箱的宽度之外了，某些民用设备、音乐播放器和音乐播放平台就会提供类似的功能，起个玄妙唬人的名字，“3D立体环绕水下天上太空宇宙音效”之类的玩意，其实就是在相位上动动手脚而已，原理其实非常简单，录音混音师如果想要玩这个，分分钟就能玩，但这是以牺牲正常的声像定位、清晰度、层次感、纵深感等为代价的，这种相位上的异常是所有具备专业知识和素养的录音混音师要避免的。

音箱耳机的本质是还原而不是“美化”（6）：监听音箱和民用音箱的主要区别

文：刘陆伟（音乐制作人、唱作人、录音混音师、吉他手、释魂乐队主创）

前面说了，音箱想要达到真正的“还原”和“高保真”是非常难的，所以真正的监听音箱没有几百块钱这么低价位的——除了某些专业音频品牌的最低端入门产品，但其实这种更应该算作打着“监听”幌子的民用产品。越是高保真的，技术指标越高的，分频也必须越多，体积也越大，构造也越复杂，对零部件的要求越高，研发生产成本越高，当然也就越贵。很多人对待音乐欣赏这件事很随意，不愿花那么多钱，听个响就行了，所以价格便宜，小巧便携，有蓝牙等功能是他们主要考虑的，所以民用音箱也有自己的市场和存在的价值。

当然不是所有的民用音箱都是廉价的，高端民用音箱动辄几万，十几万甚至几十万的“天价”，似乎它们的技术指标也应该是最好的，可专业录音棚里又几乎不会用它们。那么“民用”和“监听”的区别到底在哪？

我们所说的专业监听音箱，指的是在各大专业录音混音棚使用的那些，这么多年下来，也就是为数不多一些牌子（大多历史比较久，有着深厚的技术背景，即使是新牌子，几乎也都是从原来老品牌里出来的一些技术人才另起炉灶做的），各家几乎都有一些为了提升音质而研发的技术。专业监听音箱由于要经历全世界最专业的用户们的考验，所以在重要的技术指标参数上不能作假，否则没法在这个行业里长期混下去，可以说它们最主要的卖点就是音质。

另外，监听音箱使用的接口大多是更加专业的、指标更高的、成本造价更高的接口，例如XLR、TRS平衡接口，这也是连接其他专业设备如专业声卡、混音台等必需的接口。而民用设备上常见的则是指标更低的、成本造价更低的接口，如小三芯双声道接口、莲花口等非平衡接口，这类接口不适合长距离传输，抗干扰性能较差。数码接口方面也是类似。

监听音箱一般也没有蓝牙之类的功能（当然几十块钱加个蓝牙接收器就可以轻松实现）。蓝牙虽然方便，但很多蓝牙设备其音频压缩传输技术是有损的，如果你是网上在线听mp3之类的有损压缩格式，再用蓝牙的话，那音质是劣上加劣。

近些年监听音箱有一些新的发展方向，大到房间声学测量校准系统、IP网络、延迟补偿、相位对齐等功能，小到自动待机、数字接口、D类功放等。

外观上呢，监听音箱大多都比较朴素或者“工业感”，它在外表上的一些设计也是出于声学考量（比如波导凹面），而不像民用音箱有各种天马行空、放飞自我、甚至哗众取宠的外观，有些民用音箱其实更多是当做客厅家具或者装饰品来卖的，造型搞得跟现代派的雕塑一样，很抽象，很文艺，但大量的成本都花在了这些外观上，至于音质如何就难说了，其中当然不乏技术指标也很高的（有些大品牌既做专业监听音箱，也做高端民用音箱，就像我一开始就说的，从声音的终极目标来说，两者本来并不应该有什么区别），但民用消费领域太过鱼龙混杂，金玉其外败絮其中的、收割智商税的东西太多了。毕竟，不是所有商家都会潜心搞研发，水平达不到又不想付出那么多，又想进入这个行业赚钱，那就做一些低端的产品，价格便宜点，卖给相应的客户，这本来也没任何问题，但很多商家会把低质量的产品夸大宣传，用一些似是而非具有迷惑性的话术来忽悠大众，诋毁那些真正踏实做品质的产品。

为什么某些民用音箱商家会视监听音箱为大敌，到处散播诋毁谬论呢？最大的动机当然是利益冲突了。因为监听音箱其实也不是都很贵，也有比较入门、尺寸比较小的型号，一般的家庭听音面积不是很大，也不需要多大的音量，所以也没必要买太大太贵的，如果会挑会选的话，现在五千到一万元左右就能买到很不错的监听音箱了，这个对于一般正常收入的家庭来讲算不上多贵吧。

然而，关于监听音箱的种种谬论却成功地误导了很多人，阻止了他们去买性价比更高的监听音箱。这些谬论最典型的就是“监听音箱声音直白、清淡、干冷，只是给专业人员用的，不适合老百姓用来听音乐”。可惜的是，大部分人没有听过比较好的音箱，更没有条件在一个比较专业的声学环境下去AB对比不同的音箱，对于那些谬论误导缺乏分辨力和抵抗力。尤其是在互联网时代，往往是谬误反而更容易传播，如果一开始有人给出个错误的解答，很多人就会拷贝过来再去给其他人“解惑答疑”，以讹传讹，遗毒甚广。（类似的非黑即白的谬误还有什么“黑胶的音质比CD好”之类的，以后有机会我再一个个拨乱反正）。

音箱耳机的本质是还原而不是“美化”（7）：监听音箱为“辅助监听音箱”背黑锅

文：刘陆伟（音乐制作人、唱作人、录音混音师、吉他手、释魂乐队主创）

“监听音箱声音直白、清淡、干冷，只是给专业人员用的，不适合老百姓用来听音乐”这类谬论的另外一个渊源，或许可以追溯到一类特殊用途监听音箱上。

sin4423 · 发表于 2022-1-30 09:47

很多人不知道，监听音箱从用途上来分，其实可以分为两大类，一类就是我们前面说的，追求“频响范围更宽、频响曲线更平直、时域响应更准确更迅速、动态范围更大、失真更小、声像定位更准确等”的，也是录音混音师最主要使用的音箱，我们称之为“主监听音箱”（main monitor）。还有一类呢，是仅在某些环节使用，针对某些频段或者声部使用，作为辅助使用的监听音箱（auxiliary monitor），国内有些人把其称作“挑错箱”，我觉得不太严谨，因为主监听音箱当然也能用来挑错，只不过辅助音箱提供了另外一种参考视角而已——模仿民用低质量音箱的视角。

这类音箱比较有代表性的有Auratone 5C Sound Cube（以及后来向它致敬的Avantone mixcube等），就是一个单喇叭、封闭箱体的小箱子，从欣赏音乐的角度它基本上没有价值，因此也有“Horror tone”的“美誉”，之所以在专业混音工作中会用这类产品，是因为混音师们发现，在用高品质的主监听音箱上做到挺好的作品，放到民用低音质音箱上听，根本不是那么回事了，好不容易调好的声部比例不对劲了，很多声部（如贝斯、底鼓）可能几乎听不见了，所以后来，混音师为了照顾这部分听众，不得不在混音的时候做一些妥协，也就是在用主监听音箱做混音做得差不多之后，再把作品用各种廉价民用音箱（比如汽车上拆下来的音箱）放来听听，看需不需要做一些妥协和微调，让自己的作品在这类低质量民用设备上听起来也不至于损失太严重。

Auratone 5C这类设备就是用来模仿收音机音箱、电视自带音箱、汽车音箱等民用低质量音箱的声音特点的，当然如果你去国外专业音频设备网站看，这些音箱也被归在studio monitor类别下面，但读完上文你该知道它们根本不是用来欣赏音乐用的，也不是音乐制作中主要使用的监听音箱，只是在混音的某个环节作为辅助用途的特殊音箱。或许其实应该这样说，如果普通听众都有高质量的音箱听音乐，录混音师也就没必要非得用这类辅助参考音箱了。

然而很多时候监听音箱的名声却在为这些辅助音箱背黑锅，使得“监听音箱声音干、冷、直白、只是给专业人员用的，不适合老百姓用来听音乐”这种谬论更有影响力。这其中最具代表性和戏剧性的，或许就是大名鼎鼎的Yamaha NS10M的神奇历史，在国内它有一个更加朗朗上口的名字——“老白盆”。

Yamaha NS10M七十年代问世，可以说是老古董了，本来是一个民用音箱系列中的比较廉价的一款，技术指标上来看总体是比较差的，低频下潜差、量感少，中频1kHz-2kHz频段非常突出，超高频延展又不够，但时域响应很迅速，以上综合起来的主观听感就是单薄、干冷、硬、声音很“靠前”。于是它并不受消费者待见。然而到了八十年代，有录混音师偶尔发现由于它的这些缺陷，反而使得中频1kHz-2kHz附近的瑕疵用它听起来会格外明显，由于人声的主要能量也在这个频段，而且人声通常是流行歌里最受关注也是最重要的声部，那么NS10M反倒挺适合用来给人声“挑错”使用，一方面也可以模仿市面上类似特点的民用音箱来检查混音，看用不用做些妥协调整。有一种说法是，最早这样“变废为宝”使用NS10M的那位录混音师，之所以用NS10M是因为它是他身边能够找到的最难听的音箱……他觉得如果一首歌的中频调得用NS10M听都不那么难听了，放在其他音箱上听这个频段也不会有太大的问题。另外还有一个历史背景是，八十年代正是录音混音技术高速发展的时代，音乐的后期制作的份量越来越重，各类效果器和后期制作手段越来越复杂，录混音师对于一张专辑的影响力和重要性也越来越大，其中一些人也逐渐有了明星式的待遇，受到各个唱片公司和音乐人的邀请去各大录音棚“跑场干活”，这就需要随身带一些自己熟悉的设备，而那些主监听音箱由于极大极笨重，有些甚至是直接在录音棚建造的时候安装在墙面里的，所以是没法跟着录音师随身带走的，而相对小巧的NS10M则可以，方便作为辅助音箱用，而且NS10M有个醒目的外观——它的低频喇叭是白色的，在一堆黑漆漆的专业监听音箱堆里很容易“脱颖而出”，于是搞笑的一幕出现了：在很多录混音师的访谈和专业棚的照片里，录混音师微笑着坐在混音台前，后面的表桥上放着赫然两个抢眼的白色小喇叭，而真正的主要功臣，那些录混音师大部分时间真正在用的、镶在后面墙壁里的黑漆漆的巨大的主监听音箱则入不了画或者很不起眼……。一时间，廉价的“白盆”成了录音圈的“标配”，各大录音棚恨不得人手一对，没有这个你都不好意思给前来跑场干活的录混音师打招呼，呵呵（您来我这儿干活就不用自带白盆了，我们这儿就有）。而商人灵敏的嗅觉自然不会放过这个机会，雅马哈很快就把这个本来已经几乎被民用消费者市场抛弃的产品换了个马甲重新推向市场，就是NS10M studio，后来还陆续出过很多个NS10的版本，再后来更是借口制造白盆的原材料稀少，把它停产了，于是NS10在一波波的以讹传讹加上饥饿营销下，一度更是被吹得神乎其神，美其名曰“行业标准”，炒上了高价。而且不少音箱厂商也推出了模仿它声音特点的产品。

尝到了甜头的雅马哈，后来又出了新白盆HS系列，这次一开始就声称是针对专业监听使用，声音保留了一些老白盆的特点，实际上依然是个非常不平衡、不准确、不还原的音箱，刻意突出中高频的某些频段，甚至有些刺耳，尤其是小尺寸的型号，低频下潜差，显得更加单薄、干冷。但是因为老白盆的巨大名气，以及它非常低廉亲民的价格，依然有着巨大的销量，是无数萌新小白入坑一番摆渡搜索后的首选，所以，新白盆也就依然为“监听音箱声音直白、清淡、干冷，只是给专业人员用的，不适合老百姓用来听音乐”的谬论增砖添瓦，依然败坏着监听音箱在大众心目中的名声……

所以这是一段“本来是低质量的民用音箱，混音师为了照顾用这类民用音箱的听众，用它作为辅助参考使用，却阴差阳错张冠李戴被认为是专业监听主要使用的设备，甚至被以讹传讹成了专业监听音箱的代名词，进而被那些冲着这个名头的听众买回去当好音箱来欣赏音乐用，结果发现声音难听于是认为专业监听音箱不能欣赏音乐用”的乌龙事件，真是让人哭笑不得。

然而，那些追求“频响范围更宽、频响曲线更平直、时域响应更准确更迅速、动态范围更大、失真更小、声像定位更准确等”的监听音箱，凡是我听过的，都是声音很好听的，都完全适合欣赏音乐用，完全没问题，而且总体来讲，价格越贵的，技术指标越高的，就越好听。当然，在其中再横向比较的话，总会有一些更有性价比的品牌型号，或者更符合个人主观喜好的，这就是另一个话题了。

回到第一集的观点，总结一下的话就是：监听音箱和民用音箱本没什么区别，如果有也不应该是声音上的，而是其他辅助功能上的。仅从声音角度考虑，如果某款带着“民用”标签的音箱，声音足够完整、还原，那它当然也可以被用来当做制作音乐用的监听音箱。反过来，任何非“辅助监听”类的监听音箱，当然也适合普通听众用来欣赏音乐，而且显然比那些声染较重、技术指标较差的音箱更适合。

音箱耳机的本质是还原而不是“美化”（8）：聊聊耳机吧

文：刘陆伟（音乐制作人、唱作人、录音混音师、吉他手、释魂乐队主创）

我说的关于音箱的道理，大多也都适用于耳机。但专业混音主要还是用音箱，耳机只是在某些情况下作为辅助使用。原因有很多，比如声像定位不自然，头中效应等等，但最重要的一个原因是，耳机本身的特点决定了它没法有一个统一的测量标准。头戴式的耳机，耳罩压得紧一些或者松一些，你听到的频响就会有很大的不同，尤其是对低频而言，压得紧就低频多，松就低频少，而每个人的头的尺寸形状都不一样，耳罩的耳压也没法统一。入耳式的也一样，塞得紧点或者松点，频响会有很大的偏差。对于耳机，行业根本就没法形成统一的测量标准，也就很难评判其指标高低，基本上就是各个厂家各玩各的一套标准，其提供的技术参数更加没有权威性和参考性，看着玩玩就行了。

另外就是，对于声像定位而言，耳机会有“头中效应”，也就是会感觉声音是来自你脑袋中间而不是你的正前方，这是一种不自然的体验。那些原本以音箱为准来录音混音制作的音乐，用耳机来听的话，其声像定位也会发生一定程度的扭曲变形。尤其对于声像被pan到极左极右的声部，用音箱来听的话不会有什么问题，但用耳机来听的话，声音只在一只耳朵里有，另一只耳朵里完全没有，这也是一种不自然的体验。但由于越来越多的人用耳机来听音乐，所以混音师也不得不为了照顾这些情况而做一些相应的调整处理。

所以专业混音不会以耳机为主。而是音箱为主，耳机为辅。所以某种程度来讲，“监听耳机”其实是个伪概念，我并不是否定耳机在混音中的辅助作用，而是说，真正专业的混音并不会完全以耳机为最主要的参考标准。

那有人会问了，耳机不也有一些所谓的“录音行业标准”吗？比如Sony 7506不就是最著名的监听耳机之一吗？其实，这是和前面我讲的雅马哈老白盆的故事类似的一个乌龙事件。的确，Sony 7506在录音棚比较常见，但它并不是用来做混音的主要工具。它的频响一耳朵就知道是不平衡的，4kHz以上的高频偏多，200Hz左右有个很大的波坑，这使得音色整体偏“亮”、“瘦”、“冷”，不过它100Hz以下超低频的下潜和量又比较足，所以并不至于太过“单薄”，底鼓听着很明显。由于是封闭式结构，音头反应比较迅速。另外，它隔音效果不错，防止漏音的效果不错，比较舒适，比较适合长时间佩戴；高频较多会让歌手的齿音更突出，有助于歌手下意识地控制一下录唱时的齿音；音头反应迅速、底鼓听着很明显，也有利于把握好节奏，最重要的是，价格相对便宜……以上种种特点导致了7506在录音棚里被大量使用，但你现在明白了，它的用途主要是给歌手录唱的时候用，而不是混音师拿来混音用的。但和老白盆被误解的故事一样，很多人不求甚解，听说这是“专业监听耳机的行业标准”就买来欣赏音乐用，结果也让“监听耳机”背上了“声音直白、清淡、干冷”的黑锅……

现在的年轻Hi-Fi一族大多都是烧耳机而不是烧音箱，的确，耳机和音箱相比更加便利：对声学空间的要求低，相对便宜，小巧便携，不用固定坐在一个位置上等等……但再好的耳机还是和没法和好音箱相比，这个您如果有过体验自然就会明白我说的。声音的本质是空气的振动，尤其是对于低频，人不光是靠耳朵去感知，也有靠身体感知声波的振动。当一对高质量音箱在你的面前，推动气浪扑面而来的那种震撼和爽感，是耳机永远无法达到的。

另外，耳机目前也没有很成熟的多声道环绕声技术，也就是5.1、7.1等多声道环绕声格式的音乐和影视，还没法在耳机上有很好的重现解决方案，而音箱的环绕声重放早已经从5.1、7.1这样的“平面环绕声”走到了“全景声”的程度，也就是不止局限于水平面，也有了高度上的因素，所以我开玩笑说，当初把Stereo一词翻译成“立体声”的人，把“立体”一词用早了，引入高度信息的全景声才应该是真正的“立体声”，相比之下，Stereo（国内翻译为双声道立体声）只能算作是个“平面声”了呵呵……。

当然，耳机也有自己专属的、在音箱上无法欣赏到其精髓的音乐格式，就是用人工头录音方式得到的现场录音，这种录音只有用耳机来听才能得到最好的效果，有很好的临场感，不过用这种方式录制的唱片种类数量非常非常少，而且基本上只局限于现场录音。

我一直感到很可惜的是，Stereo（双声道立体声）的概念诞生都快一个世纪了，现在现实中还有很多人都没有好好感受过双声道立体声音箱，我见到太多的人，虽然买了一对立体声音箱，但是摆位是乱摆的，也不知道要坐在正确的位置来听（人头和两只音箱成等边三角形的顶点位置，高度和高音单元齐高），所以用耳机的话最起码还能让大家对双声道立体声有个基本的认知概念。

这个时代虽然物质更发达了，人们更有钱了，但却更浮躁了。各种三俗快餐下半身的娱乐方式太多了，都在拼命抢占大众的注意力，大众对好音乐和高音质的追求反而在退化。与之相对应的是，大众对视觉的要求还在提升。一般家庭里的电视、电脑显示器不知道都更新升级了多少代，但很多家庭还用着几十年前的旧音箱，或者干脆就用电视、电脑、手机自带的破喇叭，这些喇叭可以说这个星球上最廉价、音质最差劲的放音设备。新一代的孩子很多都是听着这些破喇叭长大的，要么就是那种一体式的蓝牙便携小音箱，毫无立体声声像展开可言，其他指标也是一塌糊涂，所以他们自然也就对好音乐、好声音没什么概念了。

更加讽刺的是，网络出现之后，免费试听和下载把传统唱片业几乎摧毁了，本来最大的受益人应该就是普通听众，以前需要花很多钱去买的磁带CD，全都可以免费下载到了，现在，只需动动手指，就能免费听到人类历史上最伟大的音乐，以及世界任何一个角落的音乐，人们应该能够更好地享受音乐了，而大众却没了那个耐心，甚至都没了那个意识。

在这样的大背景下，能够烧烧耳机的都算是难得了。也难怪各大音箱厂家也都纷纷出耳机了。在这里我并没有贬低耳机的意思，各自根据各自的情况来选择吧。只是耳机圈的水也深，坑也多，回头有机会再专门撰文讲讲吧。

音箱耳机的本质是还原而不是“美化”（9）：音箱在现实使用中要考虑的一些其他方面

文：刘陆伟（音乐制作人、唱作人、录音混音师、吉他手、释魂乐队主创）

前面讲了音乐在制作的时候其实就已经完成了最大限度的美化，而且是以监听音箱为基准而做的，所以让重放设备通过笼统的所谓的声染是不可能做出什么有意义的“美化”的，所以这种“美化”是个伪概念，所以我在修改完善本系列文章的时候给它加上了引号。当然这只是先给大家理清楚一个总的基本原则，现实的情况要更加复杂。

音箱本身只是整个故事的第一部分，对最终听音效果还有重大影响的，还有房间的声学特性，音箱的摆放方式和位置，人的一些主观听觉特性现象，以及所谓的个人喜好等等，后面的章节我会一个个聊到。

几乎所有音箱在设计时都要考虑到终端用户的使用场景，以及现实中的声学环境的影响。比如一款目标是放在桌面上使用的音箱，它就要考虑桌面反射对声音的影响，很多厂家会在设计时就提供一些补偿的手段。

比如监听音箱背后几乎都有均衡调节功能，那个是用来补偿由于你的听音室的房间声学环境、音箱摆放方式位置而产生的声染问题。例如音箱被放置在角落、离墙太近、房间太小等等造成的低频驻波，低频能量堆积的问题，所以监听音箱会有一个低频搁架式均衡，来让你对音箱的低频做个衰减。这种EQ的调节范围比较宽，幅度却不会很大，它的目的是为了找回平衡，而不是为了打破平衡，专业监听音箱基本上也会告诉你这个均衡器的具体参数，比如影响的是哪个频点以下的部分，数值是多少dB等。当然这种手段只是个大概补偿而已，无法针对每个不同的房间声学情况作出精细、具体的调节，想要从本质解决还是要从房间的声学装修入手。

近些年也有一些高端专业监听音箱研发了新的功能，用户可以用配套的测量话筒和设备来自助测量房间声学问题，音箱内置的DSP据此来做出相应的均衡曲线补偿，以使得在最佳听音位置处听到的频响更平衡一些。

很多民用音箱也会提供均衡调节功能，但往往就是Treble、Middle、Bass三个钮，也不告诉你它们各自的频点、Q值、衰减提升的单位刻度等，其实就是延续它们“音箱是用来美化声音”的逻辑，让你用这几个钮来自助“美化”声音……。有些民用的功放甚至会给你一个多段图示均衡器（graphic eq），里面可能还有一堆预制参数，什么“古典”、“流行”、“重金属”……很多播放器上也提供类似功能，包括现在一些在线音乐平台app也提供一些所谓的“VIP音效”什么的，其实都是噱头大于实际用途。您得知道，均衡器的质量和价格有着天壤之别，专业音乐制作使用的均衡器，一台的价格都够一个音箱的价格了，而低质量均衡器的则可以便宜到白菜价，你能指望那些本身就没多贵还要留出巨大利润空间的民用设备所提供的均衡器的音质能好到哪里去吗？当然，加个低质量的均衡器，成本又低又能让声音有明显的改变，让普通消费者觉得“很值”，这可谓是个很好的商业卖点，不过这种改变真的有多大意义吗？真的能起到“美化”“修饰”的作用吗？您如果认真看过我之前的文章，相信已经很清楚答案了。

另外一个需要考虑的重要因素，就是听音乐时的音量。大家可能有这样的生活体验：某段音乐在较小音量听的时候觉得高中低频比较平衡，把音量开得很大之后，会感觉高频和低频比中频变多了，高频变得太炸，低频变得太轰，这其实是人耳的一种主观听觉特性，很多年前有学者专门针对这个现象做了研究，绘制出了著名的等响曲线。等响曲线揭示出：人类对于频率的敏感度是随着响度的变化而变化的。当一个声音的响度比较小的时候，人类对于其低频和高频的敏感度要比中频低得多，当把这个声音的响度逐渐提高，人类对于低中高频的敏感度才会逐渐接近平衡。响度大概在80分贝到85分贝左右时，人对频率的感知比较平衡，音量再增大的话，虽然这个曲线会更平直，但会更容易造成听力疲劳和听力损伤，所以业界对于混音时的响度标准建议值也差不多就是这个值。但普通听众的大部分听音乐的场景下，音量是达不到这么高的响度的，所以，如果一个音箱的尺寸和功率比较小，是为近距离听音、较小音量使用而设计的，把它的频响曲线做的“两头翘”一些，也就是常说的所谓“微笑曲线”，的确可能会更讨喜一些。

但很多民用音箱之所以这样做，恐怕并不是出于对等响曲线的了解，而只是单纯觉得多数人在对比两个音箱的时候，第一印象会更倾向于“两头翘”的，多数人乍一听会觉得那样的声音更刺激（或者更讨喜），但长期听这样的声染也更容易导致听觉疲劳，而且如果设计不当的话，也破坏了音乐本身该有的平衡，因为一个音乐低频的量该多大、高频的量该多大，是在录音混音母带处理时就权衡好了的。尤其如果是一个大尺寸大功率、默认应该在大空间里用大响度使用的音箱，也把频响曲线做得很“两头翘”的话，那用它来听大部分音乐，都是高频过于刺耳，低频过于臃肿的。

总之我觉得大家应该明白一个原则：类似于音箱功放上提供的均衡器之类的手段，其最终目的都应该是为了让最终到达听者耳朵的声音是尽量平衡的，是为了趋近平衡，而不是加剧失衡。

帐号		自动登录	找回密码
密码			-注册-

转载：音箱 耳机的本质是还原而不是“美化“

浏览过的版块

转载：音箱耳机的本质是还原而不是“美化“