音频引擎与DAW战争
前言
在水果官方论坛看到的好贴,非常精彩,非常“解毒”,虽然是FL Studio地盘的文章,但它的主要目的并不是要吹捧自己的引擎牛B,而是要证明——所有工作站的音质都差不多。另外里面所提的每一点几乎都是我培训时会遇到的,例如“64 Bit 工作站的音质是否更好”?这是我上月去解放军艺术学院讲课时那些军官问的问题。文中还有一些观点甚至是我也搞不懂的(例如“有些插件闹脾气”..),这里都给出了答案。
由于时间有限,我只能每天翻译一点点(至少一两段),英文好的可以直接看原文。原文有几处笔误,我也改正过来了。(DAW是Digital Audio Workstation,数字音频工作站)
下面开始:
在大家回帖“高谈阔论”之前,你可能觉得 FL Studio 的声音是与众不同的(可以先参考下我写的《音质争霸赛》——飞飞),如果你想大声宣告 FL Studio 音质比其他 DAW优越,请先仔细阅读本文及其链接。
你或许已经发现,或者觉得自己已经发现,在 FL Studio 中,有不同的设置与选项,它们会影响你实时播放与导出音频的质量,其他DAW也是如此。请先确保你理解这些设置与选项的作用,如果你横下心与我们争辩,请准备好音频文件来证明你对下文中每条观点的异议。
音质,永恒的话题
关于音质,你需要先知道三件事:
· 一个针对550人的听力测试实验表明,人类无法准确分辨16 bit/44.1 kHz (CD标准) 与24 bit/192 kHz 的音频 ;
· 年轻人总有很多“诡计”来对比两个工作站的音频,你要知道这些诡计是什么,下文我们也会讨论这些问题;
· 广告都试图说服你,说好设备与高科技可以代替你的才能与努力,你知道,那些只是广告...
音质,永恒的话题
无论哪个论坛,只要讨论到DAW(Digital Audio Workstation,数字音频工作站)或者音乐制作,你会看到很多人主观地谈论这个与那个工作站的音质。主角们通常会说某某工作站比其他工作站更干净、更好听云云。说实话这些都是无稽之谈,任何采用 32 Bit 浮点内部处理精度的工作站,其处理出来的音频品质都远远高于人类的听力极限。从“音质”方面来透视当今的所有数字音频工作站,无论 32 Bit 还是 64 Bit 工作站,不同“音频引擎”给我们的听觉效果与音质其实都是一样的。是的,64 bit 工作站确实有用,但作用仅仅是让你能力使用更大的内存去处理工程,对你的音质没有半点提高。
那为什么有人都说不同工作站出来的声音不一样?尤其是你会看到很多“著名”制作人与录音师不停地吹捧某个工作站的音质,或者吹捧更高精度的音频格式(我见过国内有大师必须用24/192来录音的——飞飞)。这些大师当然知道自己在说人话,不过原因还是有点复杂:
首先,录音工程师与知名制作人从未在同样的条件下听出不同DAW和音频格式的区别。必须在完全平等的音频环境中进行盲听,所做出的强制选择才有统计上的意义。通常,一个公司会将产品免费赠送给业内的名人进行试听,其中一部分人认为产品的音质“比其他产品更好”,这些人说的话就会出现在产品的广告上(而认为不好的言论不会出现)。不要误解我们的意思,大明星并没有说谎,他们真的以为这些产品音质好,但都是主观印象。这些主观印象很难被量化,无法实事求是地证明产品的音质更好。
第二个原因,任何DAW的设置与选项对实时播放与音频导出都有影响。任何两个DAW如果设置完全一样,是不会出来两个差别很大的声音的。
下列清单将助你理解这些设置与选项,让你能了解更多的、真正影响音质的要素,希望它们能将你从广告机器的狂轰乱炸中拯救出来:
真正影响音质的要素(上)
实时混音插值 - 运用于采样通道中对非根音(原始音符,一般是C5)的处理,至于虚拟乐器,它们有自己的插值方式。当采样率变动时(如变调),那么DAW就需要根据现有采样来计算新的采样数据。“插值”的目的就是对电平与音调做出准确的预计,减少“量化错误”(quantization errors)所带来的“混叠”(aliasing)与“量化噪音”(quantization noise)。
音频导出设置 - 包括波形位深设置、Mp3/Ogg比特率设置、以及采样插值(Sampler interpolation)设置。波形位深(或者叫精度:16、24与32bit)并不会对你听到的声音有太大影响,但是,有损格式如mp3和ogg,确实会导致听觉上的“错乱”与“水底声”,尤其使用低于 190 kbps 的比特率。有损格式确实会导致音乐失真,虽然 240 kbps 以上的比特率听起来也不错。采样插值原理与上文第一点一样,但这里是针对音频导出。如果你听到实时播放与导出的音质有区别,请确保你实时播放与导出的插值设置一致。
你的混音水平 - FL Studio 手册里有一章《Levels and Mixing》专门讨论这个问题,混音是个魔术。无论DAW的技术规格如何,只要你混得好,音乐就更好听。不过混音这门手艺需要多年的学习,就像你学乐器一样。如果你混的歌没有流行歌的音质好,那么...99.99% 都是你的原因。DAW不会骗你,骗你的是你自己。同样要注意的是,插件并不是越多越好,你只需要一个好点的EQ、压缩/限幅器、以及基础的调音台知识。一些“母带”插件也很有用,但绝对取代不了你的混音经验和方式。至于你如何将各种声音混在一起,这与DAW的技术规格无关。不过我们总是很难将DAW的技术因素和对歌曲的主观感受分开,因此,一首好歌、一次好的混音、一个好的音色,通常被人误解成取决于DAW的产品设计和规格。
响度问题 - 对比起来,响一点当然比静一点更好,响度的增加会让歌曲听起来低音更足、高频更干净。没办法这是我们耳朵的工作原理,不能怪罪音频本身。除了你的混音水平,还有大量的因素导致 FL Studio 导出的声音比其他DAW导出的更小声,或者更响,看你怎么设置了。
有些插件很糟糕 - 我们有个专门的帖子《表现糟糕的插件》讨论这个话题。有些插件音质不太理想,如果设置不当还会直接给你增加噪音。FL studio 里面有很多Wrapper的设置让你避免这些烂插件的影响。
有些插件闹脾气 - 有些朋友用两个DAW导出一段合成器音色并分析频谱,发现两者不一样,就以为他们找到结论了。其实合成器通常有一些随机化的处理,还有些振荡器比较“自由”(它们会根据音符的起始时间改变波形的相位),因此大部分合成器都不会连续产生两次“完全一样”的波形。为保证合成模块的准确性,你可以把随机化的功能关掉,用同样的音符、同样的力度再试试看。不过如果你一定要用合成器来做测试,建议你先把合成器导成波形再继续你的测试。
真正音箱音质的要素(下)
广告会影响你 - 当然影响你了,数字音频其实只是一堆数字。电脑只是计算这些数字并作出预测。我们这里讨论的是最基本的数学计算(加减乘除),不是魔术,没有任何一个DAW厂商能拥有别人没有的技术,没有秘密。抖动与插值是大家都拥有的技术,每个DAW里面你也能对它们做丰富的调整。不过要记住,无论专业还是民用数字设备厂商,它们都会想办法说服你去升级最新版本的设备与格式,否则它们就没钱赚了,以技术指标销售设备是最基本的销售技巧。其实在内部处理精度达到32 bit 浮点运算时,谈论DAW的音质区别已经没有意义。不过在广告力量如此强大的情况下,我们就针对位深和采样率,分三点来讨论一下:
DAW 位深 - 使用过计算器的朋友都知道,当你做除法除不尽时,小数点后会有一大堆数字显示不出来(屏幕不够长..你可以将屏幕长度看成是精度),如果你忽略那些看不见的数字,以当前的数字继续计算时,就会导致轻微的计算误差,处理数字音频时同样会有这种情况。如果你有一个16 bit的数字(代表你的音频)去计算,发生误差就会影响到音频的真实度,尤其是在音乐中比较安静的地方。不过,一个32 bit 浮点的格式,可以让这些误差达到不可听的程度。在你提问之前,我可以回答你:64 bit 不会有明显的优势。有人会捏造一些例外因素解释 32 bit 浮点格式的弊端,不过这些情况对 64 bit 同样起作用,它们并不足以作为影响“音质”的主要因素。在DAW的内部处理方面就是如此,下面我们再谈谈导出时的音质问题。
最弱的一环 - 是人类的听力。24 bit/96 kHz 的波形文件真的比CD的16 bit/44.1 kHz 好听吗?做好心理准备,以下的消息对你可能是个打击:根据最近的大规模研究显示,“顶级”音频格式(24 bit/192 kHz)与 16 bit/44.1 kHz(CD标准)并没有听觉上的区别。你可以看看这可研究的链接:《Emperor 最新采样率研究》。他们对554名实验者进行测试,这554人包括音频专家、普通人、年轻人(高频听力优秀),能正确区分更高级音频格式的人为276名,大概49.8%。如果你用554只猴子来做这个实验,得到的比例也是一样的。总之,16 bit/44.1 kHz 音质与24 bit/192 kHz 并无区别。是的,32 bit 浮点算法对于DAW的音频处理而言非常重要,但只要将音频导出到发行与消费市场,比CD格式更高的规格已经没有意义。
电子芯片 - 目前最好的、被广泛运用于所谓“专业”音频设备的模/数芯片(A/D,模拟信号转数字信号),最高只有 20 Bit,动态范围在120dB左右。是的,所有24 Bit的数字录音,最后被导出到真实世界时,只剩下18到20 Bit,无论你买多好的、多昂贵的转换器。即使你打开一个24 Bit 的音频文件来听,我们的电子芯片已经无法准确地去重现它了,之后的事情都只能交给电路中的电容和电阻。另一方面,对于采样率,你也可以设置得很高很高,但如同我们上文所描述的一样,高于44.1 kHz 都是浪费。赶紧停止你对DAW那些技术规格的幻想与担忧,它们不是“品质”的决定因素,你应该关心真正影响品质的东西,例如混音和编曲。
影响音质的心理因素与结语
自己也会影响自己 - 你的确无法客观地分辨出两个信号源音频的区别,如果一开始就知道哪个信号源出自哪个DAW,你就再也不会忘记,100年前的认知心理学家已经知道这一点,并且采用了很多方法去避免这一点。尤其是“盲听”测试,你可以叫一个朋友随机地给你播放两个信号源,然后你就做二选一的决定,就这么简单。如果你能从10次随机播放的信号源中准确区分A与B,至少8次,那么恭喜你——你确实能听出什么。如果到不了这个水准,你丫就猜的吧。这其实是音频工程师的必修课,这种方法你能清楚地认识到自己的听觉与听力。不过通常,我们比自己想象中要更迟钝。为了让你认识到这一点,我们给你推荐一个实验:导出两段5秒的波形,分别以320 kbps的mp3格式以及16 bit/44.1 kHz 的波形格式(CD标准),然后做30次A/B盲听对比。你的助手不能预先告诉你这是mp3还是wav,而且你应该蒙上双眼,中途不能知道结果,直到听完30次。如果累了你可以中途休息一下,但不要与助手交流,你要做的只是去认真听。为了能说服科学家、证明自己能听出区别,你必须能从这30次对比中准确听出至少20次,我们拿猴子做24 bit/96 kHz 试听时,它们能够准确地区分出15次(巧合),因此,在做mp3与CD对比测试时,你至少也要比猴子强吧?
你的声卡、Windows 控制台与播放器 - 确保你的播放器和声卡面板没有加入任何EAX效果、压缩以及EQ设置,仔细研究一下,有时它们会藏在“高级菜单”里面。
上世纪90年代后期,对于我们音乐制作行业,“音质”的保真度从技术上来说已经没有任何进步。另外,在2000年的响度战争之后,人们反而接受了低比特率的mp3作为音乐发布标准这个事实,很明显,现在音乐的音质反而是有些倒退,但人类依然喜欢听音乐。最后,我们想用摄影师 Vernon Trent 的名言来总结一下:
“老鸟们关心设备,专家们关心金钱,大师们关心光线,我只关心相片。”