openal爆火,开源音频如何重构听觉体验

tmyb
广告

里的openal,第一反应估计和我半年前一样:是不是打错字了?应该是OpenAI吧?毕竟这半年OpenAI的GPT-4o、Sora轮番炸场,科技新闻全是它,谁能想到一个已经诞生24年的老开源技术,会在2024年突然爆火?我第一次注意到openal翻红,是今年4月逛国内最大的游戏开发者社区,热榜第一的帖子居然是《新版本openal做Quest 3空间音频太香了》,点进去上千条回复,全是开发者分享自己踩坑之后用openal爽到的经历,我当时还好奇,一个快25岁的老技术,怎么就突然把一群开发者给整激动了?翻了一下GitHub的更新记录才发现,原来从2023年底开始,openal的软实现仓库就陆续收到了来自全球开发者的提交,2024年3月的正式更新,一口气加了十多个实用新功能,直接适配了现在最火的苹果Vision Pro、Meta Quest 3这些空间计算设备,还支持了AI生成音频的快速导入,一下子就戳中了整个行业的痛点。

openal爆火,开源音频如何重构听觉体验

从被遗忘到翻红:openal到底解决了什么痛点

OpenAL的全称是Open Audio Library,本质是一个开源跨平台的音频应用程序接口,早在2000年就正式推出,最初的定位就是给3D游戏、交互式应用开发提供空间音频支持,就是让开发者可以轻松做出“声音从你左后方3米处传来”“隔着一层楼板声音会衰减”这种真实的听觉效果。

在诞生初期,openal其实是游戏圈的常用工具,但是后来随着各大科技厂商推出自己的原生音频方案:Windows主推XAudio,苹果有Core Audio,安卓也有自己的整套音频框架,openal慢慢就淡出了主流视野,成了很多老开发者电脑里躺着的“被遗忘的工具”,甚至不少新入行的开发者根本没听过这个名字。

那为什么2024年它突然就活了?核心原因就是新风口来了,旧的方案满足不了新需求,这两年空间计算、AI生成音频、VR/AR爆发,行业对免费、轻量、跨平台的空间音频方案需求暴涨,但是现有的方案要么太贵,要么限制太多,我自己作为VR爱好者深有体会:我去年双11入手了Meta Quest 3,平时最爱玩的就是VR大逃杀《Population: One》,这个游戏原来用的是Unity引擎自带的音频系统,我玩了快半年,最大的痛点就是分不清脚步声的方位——尤其是多层建筑巷战,敌人在楼上还是楼下,声音听起来几乎没区别,我好几次被人从头顶偷屁股淘汰,都想把耳机砸了。

今年2月底游戏更新,我进游戏之后瞬间就感觉不对:脚步声怎么突然清楚了?一看更新日志,原来全换成了新版openal的3D空间音频,那天我跳了一个城镇,刚进楼就听见细碎的脚步声,方位感清清楚楚就是在我头顶两层的阁楼,我贴着墙慢慢摸上去,抬手一枪直接淘汰了敌人,那个瞬间我真的被惊到了:同样的耳机,同样的设备,只是换了一个音频库,体验居然差了这么多,原来这个老东西这么好用?

对于开发者来说,openal的优势更是无法替代:商业空间音频方案比如杜比空间音频,给中小开发者的授权费一年最少十几万,还限制发布平台,很多独立团队根本掏不起;原生平台的音频方案,每个平台都要重新写适配代码,一个VR应用要同时跑在Vision Pro、Quest 3、PC端,光音频适配就要花一两个月,成本太高,而openal是完全免费开源的,允许任意商用修改,一次开发就能适配所有主流平台,现在更新之后还直接支持了最新的头相关传递函数自定义导入,开发者只需要简单调整参数就能做出符合需求的空间音频,成本直接降到原来的十分之一都不到。

不止开发者:普通用户早就享受到openal的好处了

很多人会说,openal是开发者的工具,和我普通用户有什么关系?其实不然,openal的优化,最终所有红利都落到了普通用户身上,你可能早就用过它的产品,只是自己不知道而已。

最直观的就是游戏体验,就拿今年最受期待的国产3A《黑神话:悟空》我今年年初参加了官方的线下封闭测试,玩了半个小时黑风山关卡,最让我惊艳的不是8K的画面,而是音频效果:你站在山脚下,能感觉到风是从背后远处的山头吹过来的,吹过身边的树林,左右两侧树叶晃动的声音,远近高低都清清楚楚,甚至你能听出哪一片叶子离你更近,哪一片更远,打黑风大王的时候,boss从你左侧扑过来,吼声的方位感完全跟着位置走,那种压迫感是原来平面音频根本给不了的,后来和负责音频的开发小哥聊天,他告诉我,黑神话的空间音频就是基于openal做的定制优化,原来他们试过好几个商业方案,要么对中低配电脑不友好,跑起来占太多性能,要么授权费太贵,对于本来就成本高企的国产3A来说,额外的百万级授权费也是不小的负担,用openal不仅省下了授权费,还能自己根据游戏需求深度修改,最终不管高配还是低配电脑,都能得到不错的3D音频体验。

openal爆火,开源音频如何重构听觉体验

不止3A游戏,中小创作者也靠着openal做出了原来只有大平台能做的产品,我认识一个在喜马拉雅做有声书的个人UP主,今年初他打算做一部3D环绕声的《鬼吹灯》,原来做3D有声书,需要专业的录音设备和昂贵的后期方案,个人根本玩不起,结果他用新版openal加上AI生成的背景音,只花了不到一个月就做出了第一季,戴耳机听的时候,胖子在你右边咳嗽,胡八一在你左边说话,棺椁开门的闷响就是从你身后传来,吓得我第一次听的时候差点把手机扔了,这部有声书上线半个月就涨了十万粉,现在已经接了广告,对他一个个人创作者来说,要是没有openal,根本不可能做成这件事。

还有现在火得一塌糊涂的VR看房、虚拟展厅,我上个月在小红书认识了一个三人小团队,专门给本地开发商做VR看房定制,去年接了一个项目,要求给样板间做匹配户型的空间音频:客户走到客厅,就能听到阳台的风声,走到卧室,就能听到窗外的鸟叫,不同空间的混响效果要不一样,一开始他们找商业方案报价,对方开口就要20万授权费,还限制运行平台,可他们整个项目的预算才15万,差点就要违约赔违约金,后来他们在开发者群看到有人推荐新版openal,抱着试一试的心态做了开发,结果不到两周就做完了,整个成本才不到两万,交付之后开发商特别满意,还给他们介绍了好几个新活,放到五年前,这样的小团队根本接不了这种活,现在靠着openal,直接就能和大公司抢单子,最终用户买房看VR样板间,也能得到更真实的体验,这是多赢的结果。

根据GitHub 2024年上半年的统计数据,今年1到6月,带openal标签的新增项目比2023年全年增长了120%,其中超过六成是空间计算、AI音频相关的新项目,这个增长速度,比很多热门新技术都高,足以说明openal现在的受欢迎程度。

openal翻红给我们的启发:开源的生命力从来不在热度

我做了快十年的科技自媒体,见过太多风口来了又走,很多新概念炒得沸沸扬扬,最后落地的时候才发现,连最基础的需求都满足不了,openal这次爆火,给我最大的启发就是:真正有生命力的技术,从来不是炒出来的,是熬出来的。

openal诞生24年,中间好几次被人宣布“过时死亡”,在最冷门的时候,GitHub上几个月才出一次更新,但是从来没有真正停止维护,一直有全球的开发者自愿给它修bug、加功能,一点点迭代,等到2024年空间计算和AI音频的风口来了,大家突然发现,原来早就有一个免费、完善、跨平台的基础技术放在这里,直接拿过来就能用,这不是捡宝是什么?反观很多现在炒得火热的新技术,看起来概念很新,估值很高,实际上基础功能一堆bug,还要收天价授权费,中小开发者根本用不起,最后只能是大公司内部玩玩,普通用户根本得不到任何好处。

我一直认为,开源技术的价值,从来不是看它一时的热度有多高,星标有多少,而是看它能不能真的解决未被满足的需求,能不能让更多中小参与者受益,openal这么多年,没融过资,没赚过钱,就是一群爱好者免费维护,但是它养活了几十万独立开发者、小团队,给成千上万的普通用户带来了更好的听觉体验,这个价值,一点不比那些市值几千亿的科技公司差。

还有一个很有意思的点:很多人看到openal,都会误以为是OpenAI打错了字,一个是闭源商业化大模型的代表,一个是开源免费的老牌基础技术,两者在2024年不约而同受到关注,其实刚好点出了未来科技行业的健康方向:上层的创新需要商业大模型这样的玩家推动,但是底层的基础能力,永远需要openal这样的开源技术托底,AI生成音频再好,最后也要输出到不同设备,要做空间定位,要适配不同平台,这些基础活,就是openal这样的开源技术最擅长的,两者配合,大模型做上层内容生成,开源技术做底层跨平台适配,中小开发者不用被卡脖子,不用掏天价授权费就能做出好产品,最终普通用户就能用更低的价格得到更好的体验,这才是可持续的科技生态。

很多人说现在开源技术就是蹭热点,老技术翻红就是偶然,但openal告诉我们:只要真的解决问题,老技术也能在新风口里发光发热,未来随着空间计算和AI音频的进一步普及,openal肯定还会有更多的应用场景,也会有更多像openal这样被遗忘的开源技术,重新走进大众的视野,给我们带来更多惊喜。