开档曾经攀到134美元/股的Roblox,上市之路已经走到历史最低的单股不到24美元。与上市时一人得道鸡犬升天的狂热景象相比,现在这消息像一颗酸草莓,除了刺激一下神经,没什么余味。
新鲜的是元宇宙,甚至元宇宙都已经不新鲜了。这股热潮已经一年,高涨又回落,还是无人拿到通往这座巴别塔的钥匙。这背后没多少人关心Roblox,于是当这个少儿在线游戏公司,在失去疫情红利之后光环一并丢失,一切显得平平淡淡。
但元宇宙的概念多少代表着人类进一步融入虚拟世界的必然想法,这个想法最终首先成型于一家游戏公司,本身也说明着某种倾向,比如元宇宙将首先促成娱乐方式的更迭。
很多技术的发展都是这样从一个峡口进入,经历许久才豁然开朗。比如黑火药的灵感最初掉落在炼金术士的炼丹炉外;比如现在带着人类进入虚拟世界的计算机技术,最初只是二战时洲际导弹的轨迹计算工具。
元宇宙也处在这样一个峡口,当宏大概念开始回归理性,一些底层技术和场景也已经做好铺垫,准备更进一步。
元娱乐解决方案发布
如果娱乐方式将是元宇宙首先繁荣起来的地方,实时互动技术的发展一定是其中底色。而一项技术结束野蛮生长开始成为一个行业,往往从一个通用准则的出现开始。
2021年1月26日,W3C Web 实时通信工作组发布WebRTC 1.0: 浏览器间实时通信(WebRTC 1.0: Real-Time Communication Between Browsers)正式推荐标准。文档定义了一组 JavaScript API,允许在实现了 IETF 定义的适当实时协议的浏览器或设备之间交换媒体内容和通用应用程序数据。
这是实时互动领域第一个通用标准,对于全世界的开发者来说,这意味着他们可以为包括游戏、社交、教育在内几乎所有应用场景添加实时音视频的能力,并且这种能力无论从开发者还是用户侧,都已经降维到了一种应用层面的基础设施。
对于长期积累实时互动底层技术经验的声网来说,娱乐领域的繁荣生态正在现出合力,开始成为元宇宙概念里一个可以撬动的支点。
5月16日,实时互动云服务商声网在线上虚拟空间举办“元力觉醒·元娱乐解决方案发布会”,正式发布了囊括语聊、直播、K歌以及互动游戏在内的元宇宙社交场景化解决方案,开发者与企业可以一站式接入相关场景功能,快速构建当下最火爆的元宇宙社交场景。
相比于传统的图文形式,将声音作为社交介质反而更加接近人类本能。很多人从Clubhouse开始真正了解到语聊作为一种社交方式的迷人之处,“屏幕”概念的弱化,也让用户得以更沉浸在一个虚拟的社交空间里。Clubhouse在风靡一时后逐渐降温,但这种新鲜的社交逻辑却被验证成立。好的社交产品永远不缺少拥簇,一组来自data.ai的数据显示,到2025年,社交应用的年度用户支出将达到177亿美元,5年复合年增长率为 29%。
作为Clubhouse底层技术服务商开始被外界关注的声网,此番首先推出了MetaChat的语聊解决方案。
对于开发者来说,MetaChat是一种更加立体的音频社交解决方案。它首先提供了创造虚拟形象的可能,虚拟形象的构建会使得以往缺失在沟通环节中的“身体”重新“在场”,于是声音信息之外的非语言符号、动作等得以具现进入这个虚拟空间。
再进一步,如何让一个主要由声音来构建的虚拟空间得以真正从二维向三维展开,声网给出的方案是3D空间音频。
图源:声网
图源:声网
声网表示,MetaChat所用空间音频采用纯软件算法方案,能够模拟头部球面区域立体声场,因此不受硬件的限制,用户使用普通耳机在手机或电脑上就能体验。当用户操作虚拟形象Avatar在场景里移动时,听到的音效会根据Avatar的头部及脸部朝向、声源角度和距离不同而变化。
MetaChat元语聊解决方案提供了多种3D虚拟场景,当你在酒吧里走动,你甚至可以像现实里一样听到现场乐队的音乐正在远离,然后更多不同方位的交谈声音在周遭出现。
你甚至可以同时听到乐队的音乐和隔壁桌真实的谈话。在MetaChat中,声网技术实现了房间内BGM与玩家音频的共存,这营造出一个更自然的虚拟空间。
同样的虚拟形象和空间视频元素也体现在声网MetaLive元直播的解决方案里。
直播正在成为社交甚至泛娱乐产品中的基础功能,但它仍然具有相对高的进入门槛,比如直播者需要足够自信来面对镜头,以及需要一直高密度的输出内容。MetaLive的解决方案中,仍然引入了虚拟形象Avatar。MetaLive的Avatar Show 玩法,支持虚拟形象和真实面貌的视频模式,用户可以根据自身需要在相应直播场景中一键切换出镜形象。虚拟形象模式通过摄像头驱动 Avatar 的头部动作和面部表情,可以做到与真人情绪(如惊喜、悲伤)、表情(如微笑、挑眉、吐舌头)、动作(转头时头发飘动)的实时同步。
图源:声网
图源:声网
在直播形式上,MetaLive提供了另一种融入跑图游戏元素的直播方式。在直播过程中,主播可以转变成Avatar在3D场景内完成各种特定线索任务,连线的观众也可以进入到同一个场景中,与主播进行实时互动,甚至一起做任务。对于直播者来说,这意味着直播内容的丰富,以及一定程度上直播门槛的降低。对于开发者来说,在MetaLive的框架内可以对社交产品中的3D场景做更多个性化的延展,直播形式的丰富最终将会变成直播用户体验和产品粘性的增长。
从聊天到泛娱乐
看起来,实时互动技术会很大程度革新“聊天”这个事,但实际上围绕这项技术,元宇宙的中对于泛娱乐领域的挖潜远不止于此。元宇宙的表现方式仍然十分不成熟,但对元宇宙本质的理解看上去已经达成了一致——一场基于真实世界的再造。于是虽然两者从技术实现上大相径庭,但在样貌上,真实世界中的娱乐方式往往首先成为元宇宙的灵感来源。
艾媒咨询数据显示,预计2022年,中国在线K歌市场规模将达到175.8亿元,用户规模将达到5.7亿人。而此次声网元娱乐的解决方案里,MetaKTV元K歌所面向的场景显得非常现实和具体。
声网在去年下半年发布了在线K歌房的解决方案,声网MetaKTV元K歌解决方案在此基础上打造了更具沉浸感的 K 歌场景。而通过与咪咕音乐达成合作,企业和开发者无需担心 MV 曲库质量,MetaKTV 解决方案 MV 曲库资源已覆盖 20W+ 正版 MV 资源,更有 MV 视频播放、歌曲打分、美声音效、录制分享等九大 K 歌场景化功能,完美还原线下 K 歌体验。
此次MetaKTV的解决方案中,线上K歌的虚拟“K房”进一步建成,声网提供了沉浸式的3D舞台布景,用户可以在一个虚拟舞台上走动、并与其他用户互动,也能够在舞台前方的大屏幕上看到其他用户正在演唱的歌曲、歌词甚至弹幕。配合空间音频技术提供的空间感,线下K歌多维度的体验正在向线上迁移。
今年年初,VR公司XRSPACE推出了多人线上音乐活动平台PartyOn,除了支持手机和平板电脑外,PartyOn已经集成了Meta Quest系列硬件,并且未来将会进一步集成Pico Neo系列VR头显和Rokid Air系列AR眼镜等更多设备。这成为MetaLive与开发者合作的一个成熟案例,而XRSPACE也是声网“声选计划”中的合作伙伴之一。
图源:声网Agora微信公众号
图源:声网Agora微信公众号
2021年3月,声网发布“声场”计划,开始从技术领先者转型成为一个行业的构建者。在这场“聚生态·扩声场”的发布会上,声网宣布拿出10亿音视频分钟数,并聚合生态内的50+合作伙伴、顶级创投基金、创业园区等机构,为实时互联网赛道的创业者提供创业初期几乎全阶段的支持。
疫情的助推下,RTE的生态迅速丰富,到2021年末声网发布“RTE万象图谱”,包含教育、IoT、金融、医疗等20多个行业赛道都已经可以看到实时互动技术的身影,具体的场景数量已经达到200多个,而其中占比最大的就是泛娱乐赛道。
此次发布会上,声网也发布了关于互动游戏的解决方案Meta Interactive Game,基于语聊房、秀场直播等当下热门的社交场景,开发者可以进一步将更丰富的游戏元素集成进实时互动的社交场景。目前Meta Interactive Game中提供了直播间游戏 PK、多人游戏同玩、1V1 游戏互动在内的三种玩法,已经适配超过30000+的终端设备,游戏轻量级,秒开即玩。除此之外,声网也在着力打造一个互动游戏开放平台,期待与更多游戏商携手,共建丰富的游戏资源和能力,打造更多创新玩法,繁荣实时互动游戏产业生态。
未被定义的时代
无论是社交还是游戏,都不会是这场革新的终点,但毫无疑问的是,这场革新里大多数的参与者将是在移动互联网的旧制度中困倦了的Z世代们。所有人都可以在Soul或者啫喱中看出这股热情,某种程度上,这又与发起元宇宙热潮的Roblox有着某种暗合,一个每月有1.5亿用户在线,主力用户是儿童群体的游戏平台,天然多一分对未来的敏感性。
而从声网的角度来看,元宇宙落在实时互动的支点上,将会展现出更具体的脉络。
“在社交娱乐应用持续增长的同时,娱乐场景的边界在逐渐模糊,社交、游戏、直播等单一场景不再具有明显吸引力。”声网元娱乐业务线负责人王奇在发布会上表示。
2021上半年,声网在音视频通信赛道的市场占有率达到43.4%,占比甚至超过第2-8位总和。截至2021年12 月31 日,声网全球注册应用已超40.5 万,声网实时音视频分钟数在2021年中月均用量超500 亿分钟。深耕实时互动技术的声网已在国内以及出海市场中聚拢到一批瞩目的合作伙伴,这些炮火中的声音使得它可以及时在丰富的客户场景中看到痛点,也让自身成为这场娱乐革新中最有感知力的公司之一。
这个曲折故事中仍然会不断出现泡沫与虚火,但最终实时互动会像水和空气一样,成为一个基于虚实融合的泛娱乐社交时代的底色。到那个时候,或许我们可以看到元宇宙令人信服的清晰面目。