音频引擎与DAW战争

2015.05.31 / 阅读：1738

前言

在水果官方论坛看到的好贴，非常精彩，非常“解毒”，虽然是FL Studio地盘的文章，但它的主要目的并不是要吹捧自己的引擎牛B，而是要证明——所有工作站的音质都差不多。另外里面所提的每一点几乎都是我培训时会遇到的，例如“64 Bit 工作站的音质是否更好”？这是我上月去解放军艺术学院讲课时那些军官问的问题。文中还有一些观点甚至是我也搞不懂的（例如“有些插件闹脾气”..），这里都给出了答案。

由于时间有限，我只能每天翻译一点点（至少一两段），英文好的可以直接看原文。原文有几处笔误，我也改正过来了。（DAW是Digital Audio Workstation，数字音频工作站）

下面开始：

在大家回帖“高谈阔论”之前，你可能觉得 FL Studio 的声音是与众不同的（可以先参考下我写的《音质争霸赛》——飞飞），如果你想大声宣告 FL Studio 音质比其他 DAW优越，请先仔细阅读本文及其链接。

你或许已经发现，或者觉得自己已经发现，在 FL Studio 中，有不同的设置与选项，它们会影响你实时播放与导出音频的质量，其他DAW也是如此。请先确保你理解这些设置与选项的作用，如果你横下心与我们争辩，请准备好音频文件来证明你对下文中每条观点的异议。

音质，永恒的话题

关于音质，你需要先知道三件事：

· 一个针对550人的听力测试实验表明，人类无法准确分辨16 bit/44.1 kHz (CD标准) 与24 bit/192 kHz 的音频；
· 年轻人总有很多“诡计”来对比两个工作站的音频，你要知道这些诡计是什么，下文我们也会讨论这些问题；
· 广告都试图说服你，说好设备与高科技可以代替你的才能与努力，你知道，那些只是广告...

音质，永恒的话题

无论哪个论坛，只要讨论到DAW（Digital Audio Workstation，数字音频工作站）或者音乐制作，你会看到很多人主观地谈论这个与那个工作站的音质。主角们通常会说某某工作站比其他工作站更干净、更好听云云。说实话这些都是无稽之谈，任何采用 32 Bit 浮点内部处理精度的工作站，其处理出来的音频品质都远远高于人类的听力极限。从“音质”方面来透视当今的所有数字音频工作站，无论 32 Bit 还是 64 Bit 工作站，不同“音频引擎”给我们的听觉效果与音质其实都是一样的。是的，64 bit 工作站确实有用，但作用仅仅是让你能力使用更大的内存去处理工程，对你的音质没有半点提高。

那为什么有人都说不同工作站出来的声音不一样？尤其是你会看到很多“著名”制作人与录音师不停地吹捧某个工作站的音质，或者吹捧更高精度的音频格式（我见过国内有大师必须用24/192来录音的——飞飞）。这些大师当然知道自己在说人话，不过原因还是有点复杂：

首先，录音工程师与知名制作人从未在同样的条件下听出不同DAW和音频格式的区别。必须在完全平等的音频环境中进行盲听，所做出的强制选择才有统计上的意义。通常，一个公司会将产品免费赠送给业内的名人进行试听，其中一部分人认为产品的音质“比其他产品更好”，这些人说的话就会出现在产品的广告上（而认为不好的言论不会出现）。不要误解我们的意思，大明星并没有说谎，他们真的以为这些产品音质好，但都是主观印象。这些主观印象很难被量化，无法实事求是地证明产品的音质更好。

第二个原因，任何DAW的设置与选项对实时播放与音频导出都有影响。任何两个DAW如果设置完全一样，是不会出来两个差别很大的声音的。

下列清单将助你理解这些设置与选项，让你能了解更多的、真正影响音质的要素，希望它们能将你从广告机器的狂轰乱炸中拯救出来：

真正影响音质的要素（上）

实时混音插值 - 运用于采样通道中对非根音（原始音符，一般是C5）的处理，至于虚拟乐器，它们有自己的插值方式。当采样率变动时（如变调），那么DAW就需要根据现有采样来计算新的采样数据。“插值”的目的就是对电平与音调做出准确的预计，减少“量化错误”（quantization errors）所带来的“混叠”（aliasing）与“量化噪音”（quantization noise）。

音频导出设置 - 包括波形位深设置、Mp3/Ogg比特率设置、以及采样插值（Sampler interpolation）设置。波形位深（或者叫精度：16、24与32bit）并不会对你听到的声音有太大影响，但是，有损格式如mp3和ogg，确实会导致听觉上的“错乱”与“水底声”，尤其使用低于 190 kbps 的比特率。有损格式确实会导致音乐失真，虽然 240 kbps 以上的比特率听起来也不错。采样插值原理与上文第一点一样，但这里是针对音频导出。如果你听到实时播放与导出的音质有区别，请确保你实时播放与导出的插值设置一致。

你的混音水平 - FL Studio 手册里有一章《Levels and Mixing》专门讨论这个问题，混音是个魔术。无论DAW的技术规格如何，只要你混得好，音乐就更好听。不过混音这门手艺需要多年的学习，就像你学乐器一样。如果你混的歌没有流行歌的音质好，那么...99.99% 都是你的原因。DAW不会骗你，骗你的是你自己。同样要注意的是，插件并不是越多越好，你只需要一个好点的EQ、压缩/限幅器、以及基础的调音台知识。一些“母带”插件也很有用，但绝对取代不了你的混音经验和方式。至于你如何将各种声音混在一起，这与DAW的技术规格无关。不过我们总是很难将DAW的技术因素和对歌曲的主观感受分开，因此，一首好歌、一次好的混音、一个好的音色，通常被人误解成取决于DAW的产品设计和规格。

响度问题 - 对比起来，响一点当然比静一点更好，响度的增加会让歌曲听起来低音更足、高频更干净。没办法这是我们耳朵的工作原理，不能怪罪音频本身。除了你的混音水平，还有大量的因素导致 FL Studio 导出的声音比其他DAW导出的更小声，或者更响，看你怎么设置了。

有些插件很糟糕 - 我们有个专门的帖子《表现糟糕的插件》讨论这个话题。有些插件音质不太理想，如果设置不当还会直接给你增加噪音。FL studio 里面有很多Wrapper的设置让你避免这些烂插件的影响。

有些插件闹脾气 - 有些朋友用两个DAW导出一段合成器音色并分析频谱，发现两者不一样，就以为他们找到结论了。其实合成器通常有一些随机化的处理，还有些振荡器比较“自由”（它们会根据音符的起始时间改变波形的相位），因此大部分合成器都不会连续产生两次“完全一样”的波形。为保证合成模块的准确性，你可以把随机化的功能关掉，用同样的音符、同样的力度再试试看。不过如果你一定要用合成器来做测试，建议你先把合成器导成波形再继续你的测试。

真正音箱音质的要素（下）

广告会影响你 - 当然影响你了，数字音频其实只是一堆数字。电脑只是计算这些数字并作出预测。我们这里讨论的是最基本的数学计算（加减乘除），不是魔术，没有任何一个DAW厂商能拥有别人没有的技术，没有秘密。抖动与插值是大家都拥有的技术，每个DAW里面你也能对它们做丰富的调整。不过要记住，无论专业还是民用数字设备厂商，它们都会想办法说服你去升级最新版本的设备与格式，否则它们就没钱赚了，以技术指标销售设备是最基本的销售技巧。其实在内部处理精度达到32 bit 浮点运算时，谈论DAW的音质区别已经没有意义。不过在广告力量如此强大的情况下，我们就针对位深和采样率，分三点来讨论一下：

DAW 位深 - 使用过计算器的朋友都知道，当你做除法除不尽时，小数点后会有一大堆数字显示不出来（屏幕不够长..你可以将屏幕长度看成是精度），如果你忽略那些看不见的数字，以当前的数字继续计算时，就会导致轻微的计算误差，处理数字音频时同样会有这种情况。如果你有一个16 bit的数字（代表你的音频）去计算，发生误差就会影响到音频的真实度，尤其是在音乐中比较安静的地方。不过，一个32 bit 浮点的格式，可以让这些误差达到不可听的程度。在你提问之前，我可以回答你：64 bit 不会有明显的优势。有人会捏造一些例外因素解释 32 bit 浮点格式的弊端，不过这些情况对 64 bit 同样起作用，它们并不足以作为影响“音质”的主要因素。在DAW的内部处理方面就是如此，下面我们再谈谈导出时的音质问题。

最弱的一环 - 是人类的听力。24 bit/96 kHz 的波形文件真的比CD的16 bit/44.1 kHz 好听吗？做好心理准备，以下的消息对你可能是个打击：根据最近的大规模研究显示，“顶级”音频格式（24 bit/192 kHz）与 16 bit/44.1 kHz（CD标准）并没有听觉上的区别。你可以看看这可研究的链接：《Emperor 最新采样率研究》。他们对554名实验者进行测试，这554人包括音频专家、普通人、年轻人（高频听力优秀），能正确区分更高级音频格式的人为276名，大概49.8%。如果你用554只猴子来做这个实验，得到的比例也是一样的。总之，16 bit/44.1 kHz 音质与24 bit/192 kHz 并无区别。是的，32 bit 浮点算法对于DAW的音频处理而言非常重要，但只要将音频导出到发行与消费市场，比CD格式更高的规格已经没有意义。

电子芯片 - 目前最好的、被广泛运用于所谓“专业”音频设备的模/数芯片（A/D，模拟信号转数字信号），最高只有 20 Bit，动态范围在120dB左右。是的，所有24 Bit的数字录音，最后被导出到真实世界时，只剩下18到20 Bit，无论你买多好的、多昂贵的转换器。即使你打开一个24 Bit 的音频文件来听，我们的电子芯片已经无法准确地去重现它了，之后的事情都只能交给电路中的电容和电阻。另一方面，对于采样率，你也可以设置得很高很高，但如同我们上文所描述的一样，高于44.1 kHz 都是浪费。赶紧停止你对DAW那些技术规格的幻想与担忧，它们不是“品质”的决定因素，你应该关心真正影响品质的东西，例如混音和编曲。

影响音质的心理因素与结语

自己也会影响自己 - 你的确无法客观地分辨出两个信号源音频的区别，如果一开始就知道哪个信号源出自哪个DAW，你就再也不会忘记，100年前的认知心理学家已经知道这一点，并且采用了很多方法去避免这一点。尤其是“盲听”测试，你可以叫一个朋友随机地给你播放两个信号源，然后你就做二选一的决定，就这么简单。如果你能从10次随机播放的信号源中准确区分A与B，至少8次，那么恭喜你——你确实能听出什么。如果到不了这个水准，你丫就猜的吧。这其实是音频工程师的必修课，这种方法你能清楚地认识到自己的听觉与听力。不过通常，我们比自己想象中要更迟钝。为了让你认识到这一点，我们给你推荐一个实验：导出两段5秒的波形，分别以320 kbps的mp3格式以及16 bit/44.1 kHz 的波形格式（CD标准），然后做30次A/B盲听对比。你的助手不能预先告诉你这是mp3还是wav，而且你应该蒙上双眼，中途不能知道结果，直到听完30次。如果累了你可以中途休息一下，但不要与助手交流，你要做的只是去认真听。为了能说服科学家、证明自己能听出区别，你必须能从这30次对比中准确听出至少20次，我们拿猴子做24 bit/96 kHz 试听时，它们能够准确地区分出15次（巧合），因此，在做mp3与CD对比测试时，你至少也要比猴子强吧？

你的声卡、Windows 控制台与播放器 - 确保你的播放器和声卡面板没有加入任何EAX效果、压缩以及EQ设置，仔细研究一下，有时它们会藏在“高级菜单”里面。

上世纪90年代后期，对于我们音乐制作行业，“音质”的保真度从技术上来说已经没有任何进步。另外，在2000年的响度战争之后，人们反而接受了低比特率的mp3作为音乐发布标准这个事实，很明显，现在音乐的音质反而是有些倒退，但人类依然喜欢听音乐。

最后，我们想用摄影师 Vernon Trent 的名言来总结一下：