AoIP 音频设备到底是什么鬼?

/ 阅读:35790
作者: 飞飞

有些创新被接受得很慢,例如汽车,1865年英国《机动车道路法》规定车速不得超过步行速度;还有些创新,被接受得飞快,十年前市面还没有大屏触摸手机,现在都是。

今年的 Namm Show 上,我们发现网络接口的设备突然满大街都是,包括“网口声卡”、“网口话筒”、“网口调音台”、事实上在 Dante 官网的产品分类中,光是 Dante 协议的产品已经具有几百款,覆盖20多个品类,并来自我们熟悉的各大品牌。

连我们觉得不可能的监听音箱都有用,先是 ADAM 创始人弄的 HEDD 监听、然后 KRK 创始人弄了个 Klawitter 监听、真力刚刚推出了 8430A,也就是“第4代”8000 系列,比起第3代的 8330A,增加了“以太网接口”,直接取消了 AES/EBU 接口,可以看出:

模拟接口不会很快淘汰,但 AES/SPDIF/ADAT 有点悬...

从今年开始,我们可能会频繁面对一些新词:

AoIP、AVB、Dante、SoundGrid...

而扩声圈和广电圈还会遇到 EtherSound、Aviom Pro64、Livewire、Q-LAN...

搞了这么多年音乐都没听过,这都是什么鬼!!

其实音乐人可能听过一个名字:mLAN,2000年由 YAMAHA 推出,物理接口就是以太网口,里面走的 IEEE 1394 串行母线(就是大家熟悉的 “Firewire/火线”),可惜 mLAN 叫好不叫座,2008 年被 YAMAHA 取消了...

---

为了解释这么多概念,我们先...

假设没有网络,我们要把电脑上的一首歌“发”给远方的朋友,这时你有很多选择:

一、“封装”你的音乐,选择很多

     • 例如把歌曲录到磁带上、刻录到 CD 上

     • 例如拷到硬盘或 U盘上...

二、选择一种物流方式,选择也很多

     • 快点儿的有快递和自营配送(例如京东)

     • 慢点儿的有货运和邮政,同城还可以自己步行送一趟

三、选择一家物流公司

     • “快递”里面你可以选顺丰、圆通、中通...

     • “货运”里面可以选中铁、德邦、等等...

四、物流公司选择要走的道路

     • 例如空运、海运、陆运...

     • 光陆运也有很多选择,例如免费的村道、少量费用的省道、或者高速

五、物流公司车辆在路上要遵守一些规则

     • 例如在英/日是“右舵车”,中/美是“左舵车”

     • 例如货车不能驶入快车道、匝道和拐弯处减速、进京要办证等等...

---

以上各方式都有自己的长处,以及各自的“时代性”,新时代有新的需求、和新的解决方式,赶时间你可以选“次日达”快递,不赶时间你也可以有“情怀”地写封信走邮政~

大部分的方式,相互都可以“兼容”,你可以用顺丰发几十公斤的电钢琴、也可以用德邦发一张 CD,而京东的车根据情况走村道、也可以走高速。

---

现在我们可以讲主题了...

一、模拟音频传输

最原始的声/电转换方式,这种原始的传输就像“走路”,100年来只是提高了转换效率(例如骑个马)和传输品质(例如黄土路变成水泥路),这种方式很难被淘汰,因为即使你每天开车上班或坐地铁,你始终都要走上几步的。因此这种方式相当于:

“走路给同城的朋友捎一盒录音磁带”

---

二、“半模拟”数字音频传输

很多音频设备带有“数字接口”,专业设备上称为 AES/EBU 或 AES3,民用设备上称为 SPDIF(其实是 AES/EBU 的“非平衡”版),它用了一种新“封装”:PCM(脉冲编码调制,Pulse Code Modulation),可理解为将音频“像素化”,录音带升级为了 CD。

然而 PCM 音频的“电脉冲”依然通过“模拟线”传输,很多朋友说 SPDIF 不是要用 75Ω 的同轴线吗?——短距离时用普通莲花线就行,而 AES/EBU 用普通的 XLR 卡农线就能代替,这个 75Ω 和 110Ω 是“特征阻抗”,不是电阻抗,说白了就是——做工很好的音频线,例如芯线直径达到 18AWG(1.02mm)的莲花线就可称为同轴线,一句话:

封装方式变了,但路不变,因此小编称为“半模拟”。

那有什么卵用?——传输距离,通常 RCA/TS 等“非平衡模拟”最好不超过 5米,“平衡模拟”的 XLR/TRS 可到 15米,SPDIF “非平衡数字” 的上限是 10米,而 AES/EBU “平衡数字” 传输可达 100米(见维基百科 SPDIF 词条),交通工具从白龙马升级为摩托。

还有一点是脉冲编码可以包含左/右声道,一根两芯非平衡线就可以传立体声,“带宽”增大一倍(还可以传输压缩过的 DTS 5.1 环绕声),因此我们把这种方式称为:

“骑摩托给郊区朋友捎两张 CD”

---

 

三、真数字音频传输

新时代的需求来了:除了你要给朋友带 CD,还有其他人也要给朋友带 CD,虽然都可以独自去送,但群体的效率不高,这时有人跳出来对大家说,“要不你们给我点钱,统一把 CD 给我,我再把 CD 派给你们的朋友”。

于是“物流公司”——多通道数字音频传输出现了。

这便是90年代开始陆续出现的 ADAT、USB 与 Firewire,交通工具从摩托升级为容量更大的“面包车”,但早期的数字传输存在短板——传输距离,像 ADAT、USB 2.0 最大距离都是 5米,Firewire 1394 是 4.5米,虽然现在标准有所提高,例如 USB 3.0 最大也可以到 15米,不过这依然让这些设备局限于室内使用,它们其实是“同城物流”。

为了提高效率,物流公司先走“环线”或者“京通快速”将 CD 派送到“网点”(电脑连接多通道声卡或 AD/DA 解码器),然后由网点的快递员走路或骑摩托派送给终端客户(就像声卡用模拟或“半模拟”连接音箱)。我们或许可以把这种方式称为:

“同城物流公司给同城用户送 CD”

---

四、Audio over Ethernet(AoE)

问题来了,骑摩托只能带很少的物品,而物流公司只能送同城,我们怎么给其他城市的多个朋友寄多几张 CD 呢?再举个栗子,MIDI 音乐节的主舞台,FOH(混音师位置)起码离舞台 50米,ADAT、USB 和 Firewire 都做不到这么长;而大舞台的标准最低 64路音频,难道要接 64 条 AES/EBU 卡农线?

是的,当年真的用成百上千辆摩托车...

---

幸好全国性大型快递公司出现了——网络音频

快递公司先把你要寄的 CD 进行“二次封装”,顺丰有顺丰的袋子、圆通有圆通的盒子,这种便是不同的“标准”,尽管快递的性质都一样,但大家知道顺丰和圆通在价格、速度、品质上会有轻微差异,各有优劣。

比起 ADAT、USB 和 Firewire,90年代的网线除了速度和便利性相差无几,“管理能力” 也很出色(拓扑结构),拥有“多级网点”,先将快件汇集到通州区网点、然后汇集到北京总网点,再发到其他城市总网点,再一级级分下去。就像 MOTU 公司的示意图:

很早就有公司打网线的主意,Gibson 在 1999年与 3COM 联合推出 MaGIC 标准:

一条 CAT5 百兆网线能传输 32 路 192kHz 音频,距离长达百米

然而不是谁都能“号令天下”,最后 MaGIC 主要用在 Gibson 数字吉他,同样 YAMAHA 的 mLAN 也失败了,乐器圈的厂商要说服录音圈、广电圈、扩声和 HiFi 圈很难...

上图的 MOTU 采用广电圈主流的 AVB(IEEE 1722),这是电子领域最权威的 IEEE 协会 2012 年推出的标准,不限制通道数(取决于带宽)!普通 CAT5 网线下支持百米传输,而且支持光纤网线,“多模光纤”下可传 2 公里,相当于城市总网点之间走“空运”,非常适合电视台或影视基地的好几栋楼之间组建局域网。

录音圈的朋友可能听过一个叫 SoundGrid 的标准,这是 Waves 公司和扩声巨头 DiGiCo 联姻的产物,支持千兆网线的 1km 传输,延迟低至 1ms。其实厂商的标准有两种:开放或不开放,SoundGrid 属于非开放标准,而 MaGIC、mLAN 和 AVB 都是开放的免费标准,免费只能保证覆盖度,某些厂商有信心收费,说明它能在某些领域做得更好。

我们总结下 “网络音频” 的模式:

“通过大型快递公司给很多外地朋友送 CD”

---

五、Audio over IP(AoIP)

外地的朋友需求又高了:1 张 CD 只有10首歌,但他要听十年的 Billboard TOP100,也就是 1000 首歌,这意味着你要寄 100 张 CD... 快递公司给你出个主意:CD 只是载体,你朋友要听的是歌,我们可以先把你的歌拷到 U 盘,然后我再拷给你朋友,快递费与你寄 1 张 CD 一样——大家都省事,快递小哥也轻松了,这招听起来简直...

这个“U盘”就是 IP(Internet Protocol,网络协议)

通用网络协议有 7 层,小编找到一篇比较简单的《白话以太网 7 层协议》,上文 MaGIC 属于 Layer 1(物理层)、AVB 1722、SoundGrid 属 Layer 2(数据链路层),数据不压缩传输。随着 2013 年美国录音师协会 AES 67 标准的制定,我们进入了 Layer 3(网络层)时代,随后多种“网络层”标准陆续出台,开放的有 AVB 1733、NetJack;非开放的有 Dante、Q-Lan、Livewire...可理解为不同品牌的“U盘”。

AoIP 我们暂称“IP 音频”,它属于 AoE 网络音频,只不过是第三、四层的网络音频,但延迟、通道数、传输距离都更出色,AVB 1733 和 Dante 延迟可到 250μs(0.25ms)和 150μs,貌似只有 Dante 还限制通道,但 1024 通道也是海量,它们还支持光纤网络超远距离传输、支持“热拔插”(快递随叫随到),而网络的拓扑结构还可以干一件事:

“音频接口/声卡”可能会被淘汰

Dante 刚推出的 Via 服务提出了一个“虚拟声卡”的概念,主电脑连接多台子电脑,并且可以控制子电脑所连接的 Dante 设备,例如子电脑连接了真力 8430A,你可以让它直接播放主电脑上的歌,这时音频接口的 “路由/Routing” 其实用电脑就能做到,轻松便可组建“小型企业云”,例如连接一个录音棚内的所有控制室。

最后我们总结一下 “IP 音频”:

“通过‘隔日达’快递,给很多外地朋友发音频U盘”

 

---

听起来 AoIP 确实高端大气,然而不是每个人都需要更高更快更强,

普通人只想懒着... 别跟我比懒,我懒得比...

AoIP 确实方便“音频系统”组建,并且可能“向下兼容”地吃掉 AES/EBU、SPDIF 等数字接口,但个人并不需要什么“系统”,因此它还有两个困难需要克服:

     • 目前制定的 AoIP 标准还不支持无线传输

     • 以太网物理接口太大,很多“超极本”都不带网口,最好能支持 USB-C

也许未来会有一种方式,朋友问你要 CD,你打开“任意门”就见到朋友了...

万一网络音频真的灭掉了 SPDIF 和 ADAT,我们可以想象发烧友们的问题:

德产网线和美产网线哪个音质好?

百兆网线和千兆网线哪个音质好?

镀金网头对音质有多大的改善?

在线等!急!

---

补充视频:Dante Via “虚拟声卡”技术简介

最新消息:2016年1月底,AES 协会公布了 AES67 的“升级版”AES70(也叫 OCA:开放控制架构),可以完美兼容所有 AES67、Dante、AVB、Ravenna 协议的设备。 

  • 请问ADAT可不可以算是“半模拟”数字音频传输?它与SPDIF的区别在哪里?在使用上有什么特别的注意事项么?谢谢
    shunyuyang 评论道
  • 数字始终是最可靠的传播、储存方式,其他的都是菜瓜!
    自杀机器 评论道
  • 本文没法详细展开谈 ADAT,否则写不完了。所谓的“半模拟”是我个人的叫法,指的是用模拟音频线走数字信号。ADAT 有点特殊,它是“光信号”,走 Toslink 接口、用光纤线,这需要先把 PCM 的 “电流脉冲”转为“光脉冲”,接收端再转一次,主要优点是热拔插、没有地线问题、零失真传输、超长传输距离等。缺点:线材不能折,另外在大棚最好用字时钟同步来减少“光/电”转换的 Jitter。
    飞飞 评论道
  • 吐个槽,以前的那些基本上都是二层协议,说白了就是厂商自己玩的,最重要的是,二层协议是不能跨网段的。。。只能在一个小网段里面里面运行,传输距离看介质,说白了只是把介质换成网线增加噱头,没有任何卵用。AoIP则是基于三层的,可玩性就大大提升了。Dante看了一下官网介绍是基于VoIP协议,这个协议发展了10年多已经非常成熟了,目前主要是做IP电话和视频会议,硬件支持可以说很完善了。不过目前国家对VoIP的政策压的比较狠···
    axiom 评论道
  • 走网线的话好处很多的,首先网络交换机是可以检测网线的状态的,误码、丢包、速率下降、线序错误什么的都可以测出来;再者就是传输速率,千兆的网络设备已经算不上贵了,要是还不够用还可以用万兆嘛;距离不够远就用光纤,使用单模光纤传输距离可达到10到80公里(需要传这么远吗?) 话说现在国内有那些使用AoIP的案例没有?
    Rorschach 评论道
  • 无论是数字还是模拟,尽量减少转换次数很重要。信号一旦数字化后,不到万不得已,不要时不时地转回模拟。
    Picker 评论道
  • 提出几个想法:1. 处在三层的AoIP协议可以允许使用无线网络作为传输方式。所以无需多说三层的AoIP协议都可以使用无线网络,问题只是无线网络的带宽不一定够,以及使用这样的网络传输方式有可能会严重增加传输的延迟。2.查了一下AES 67是一个兼容标准,旨在让AVB协议可以兼容Dante这样的3层协议。AVB类2层协议的核心问题在于它需要支持它的交换机/路由器才可以使用(也就是MOTU的AVB Switch,图中可见)。3.彻底取代声卡不知道需要多久,因为毕竟无论如何也是数字信号传输,数模转换依然不可避免。
    tukishiro 评论道
  • 搞监控的会发现,数字摄像头的视频并不是实时的,往往延迟一两秒,音频厂家如何解决?
    doom11 评论道
  • 除了纯模拟信号,这些基带信号接口实际上是采样率、编码方式、信号码率、信道带宽的差别,上面的比喻不是很严谨
    懒猫不睡觉 评论道