智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 漠影

客人来访,你不需要走到门口透过猫眼才能确认是谁,和手机联动的可视门铃、可视门锁让你在任何地方不仅与客人视频通话,还能无缝语音聊天;当你出差、旅游时是不是担心家里的宠物没有人陪伴?现在能传递画面、实时与宠物对话的摄像头出现……越来越多能够实时与我们交互的设备出现在生活中。

音视频物联网行业起势,实时互动成智能设备的“硬指标”!

▲亚马逊旗下Ring的智能可视门铃

这些功能在几年前我们可能还无法想象,但现在实时音视频、实时互动等功能在诸如此类的智能硬件中已经成为标配

就在上周四,RTE 2022第八届实时互联网大会IoT分论坛落幕,我们可以看到,实时互动技术已经在智能家居、无人机、机器人、AR眼镜等多个行业内落地,并在不断拓展智能设备的新应用场景。

成立于2014年的声网,已经在实时互动领域积累了多年经验,作为底层技术的赋能者,能够帮助行业玩家在其应用内构建多种实时音视频互动场景。

那么,音视频物联网市场的发展空间有多大?实时互动技术能为物联网设备带来哪些变革?

带着这些问题,智东西和声网IoT行业负责人侯云忆进行了深入交流,从声网在音视频物联网领域的布局出发,以实时互动技术为核心,理清音视频物联网领域的发展脉络。

一、“物超人”时代到来,互动从准实时迈向真实时

如今,物联网产业正在飞速发展,工业和信息化部的数据显示,截至今年8月末,我国三家基础电信企业发展移动物联网终端用户16.98亿户,较上年末净增3亿户;代表“物”连接的移动物联网终端用户数首次超出代表“人”连接的移动电话用户数,占比已达50.3%。

我国已经正式迈入“物超人”时代,与此同时,音视频物联网也迎来快速增长期,智能家居、机器人、无人机等设备在互动过程中往往都需要实时音视频技术支持,来达到更加沉浸式的互动体验。

从其较为主要的连接和交互层面来看,侯云忆谈道:“从这个视角看,音视频物联网的演进可以分为三个阶段。”

事实上,随着硬件设备的智能化升级加速,第一个阶段已经离我们有一些遥远。早期以传统安防为代表的慢直播时代,只能做到事后分析、回述、查看,通信时延在2-5秒以上。

这之后,还是以安防为例,用户可以通过手机APP实时查看摄像头中的画面,并听到其中的声音。侯云忆谈道,这一阶段可以做到即时连接,时延在1-2秒。但这仍然不是完全的实时互动,原因在于,用户只能通过摄像头进行单向互动,也就是只能即时预览、边听边看,但无法做到与摄像头另一端的人进行实时对话、交流,因此,这一阶段被称为“准实时”。

不过,随着交互性在智能硬件中的重要性逐步提升,单向传输的“准实时”已经无法满足现有的用户需求。因此,完全的实时互动正在成为物联网领域各路玩家的必争之地。

在“真实时”阶段,就是让音视频设备实时互动,使得人和人、人和物之间都能实时、多人、跨端、以任意规模进行互动,侯云忆谈道,声网将其时延提升至全球端到端400ms之内。

音视频物联网正在从“准实时”向“真实时”演进

音视频物联网行业起势,实时互动成智能设备的“硬指标”!

可以看到的是,这一技术升级的成果正在不断涌现。诸如智能门锁、智能音箱等在内的物联网设备不断在实时互动方面迸发出火花。现如今,人们对于智能化生活的需求更加深入,能听、能说、能看已经成为其所需的智能硬件必备技能。

从宏观角度来看,各路玩家在物联网领域加码业务布局的同时,一个突出的趋势就是,实时互动已经成为智能硬件的“核心功能”。

二、实时互动成智能设备应用落地硬指标

事实上,音视频物联网领域不论是技术的进步,还是新应用场景的诞生都不是相互独立发展,而是相辅相成的,并不断驱动行业螺旋式上升。我们可以从一些具体应用场景来抽丝剥茧。

1、经典硬件设备智能化升级

比较典型的一类应用场景,就是经典IPC(网络摄像头)设备通过RTC(Real-time Communication,实时音视频)技术得到增强。

早期智能门锁多采用密码、指纹识别来解锁,现在这些识别方式已经逐渐“淡出”消费者选购的。今年4月,TCL发布3D人脸识别屏幕锁X10;9月,小米新款人脸识别智能门锁支持3D结构光人脸识别;10月,海尔智能3D人脸可视猫眼锁SV30发布,华为也在秋季发布会上主打了分布式可视猫眼功能……侯云忆补充道,头部品牌的数据显示,现在视频通话在智能门锁中的渗透率已经超过40%。

音视频物联网行业起势,实时互动成智能设备的“硬指标”!

▲华为智能门锁Pro

除此以外,小米智能硬件事业部产品总监梁浩说:“此前,我们对于智能家居的印象是相对比较冰冷的,它们只跟设备、控制相关,缺少了与人之间的情感连接。”而现在,音视频在智能家居中的应用增加了视频通话、远程看家和智能门铃,智能家居也变成了一个“温暖的伙伴”。

可以看出,这些玩家在智能门锁这一细分赛道中,已经开始在实时互动上抱团。这也预示着,以经典IPC设备为代表的产品,其智能化升级需求激增。

2、软件服务催生高黏性细分场景

还有一类是以“设备即服务”为逻辑涌现出的新应用。以远程陪伴产品为例,用户离家场景下,曾经家中的安防摄像头扮演的角色就是观察家中的状况,而现在,“更多通用硬件平台开始围绕着幼儿、宠物等深耕细分品类,面向用户的情绪价值和情感诉求来开发新产品。”侯云忆谈道。

基于此,家庭服务机器人这一新品类诞生。其中,陪伴就成为其中一项重要功能,作为全球智能家居硬件的风向标亚马逊,今年专门为其家庭服务机器人Astro进行了一项更新,该机器人兼容智能视频门铃服务和Alexa语音交互,让用户可以和家中的宠物实时对话。

音视频物联网行业起势,实时互动成智能设备的“硬指标”!

▲亚马逊家庭服务机器人Astro可以实时观察家中宠物情况

如幼儿、宠物陪伴这类细分场景,曾经可能只能通过手机才能实现,现如今,实时互动技术在智能硬件设备中的广泛应用,使得越来越多的高用户黏性细分场景出现。

3、视觉交互向弱需求设备普及

除了这些对视觉交互、实时对话功能需求较为显著的设备,摄像头等硬件的适用范围也在逐渐普及,如扫地机器人这一品类,它更多的功能是清洁、避障等,但为了提升用户的体验,部分玩家为其添加了摄像头,让扫地机器人的功能性进一步提升,从智能清洁助手升级为“智能管家”。

追觅机器人产品总监孟佳谈道,扫地机器人未来发展为更加智能化的机器人,比如说可以升级为未来家庭服务类的机器人是该品类的重要发展方向之一。

音视频物联网行业起势,实时互动成智能设备的“硬指标”!

此外,To B场景下,实时互动也在革新人们的工作方式和效率。如无人机、巡检机器人等。侯云忆透露,在无人机和机器人场景,通过声网RTC超低延时全链路优化,能实现高清多路视频传输和可靠性远程控制,可以做到端到端160ms平行驾驶和平行操控。

大疆IoT平台负责人刘翰林补充道,未来基于IoT和实时音视频技术应用,无人机技术将会深入到各行各业中。

这些案例都在向我们阐述一个事实,实时互动技术搭载于智能硬件设备中的必要性和急迫性都愈加明显。

因此,这一产业链背后的玩家都在积极推进,然而,物联网行业还有一个显著特点,就是产业链冗长,且碎片化特征明显,因此,需要上下游玩家的链接,才能加速这一产业在音视频领域的变革。

在这其中,声网扮演的角色就是应用层玩家的底层技术赋能者,但同时物联网产业的特征决定了其生态建设的重要性,因此,声网同样会基于其在实时音视频领域的技术积累,加速应用层玩家的产品落地。

三、音视频物联网发展脉络清晰,底层技术玩家起势

现在随着物联网产业发展加速,音视频物联网的发展趋势也逐渐明晰。侯云忆谈道,现在有三个比较明显的趋势。如今,用户对于沉浸式通信的需求不断迭代,技术层面上通过边端协同来完善硬件连接,使其在交互上释放更好地性能。

此外,现有的物联网设备正在走向互联互通,也就是从单品智能向场景化发展,实现多设备的协同、联动,以及一些物联网玩家的商业模式正在从更好地连接向更好地服务转变。不过,这些趋势的演进都离不开现有技术的迭代,其最核心的还是底层技术的可用性。

因此,作为在实时音视频领域积累了多年技术经验的声网,基于这几大发展趋势,确立了面向通用技术和场景化的两大聚焦点。侯云忆说:“这是因为我们看到了真实的市场需求有一些技术的空白。”

以此为核心,声网已经覆盖可穿戴、智能家居和出行等40多个品类,为开发者提供高可靠和低延时音视频流媒体和可靠信令消息的能力,以及端到端的解决方案,使其在产品上能够快速实现视频通话、远程协作、远程控制、紧急呼叫等功能。

其中,面向XR终端设备场景,声网也率先看到了这一市场的发展潜力,能够在这一场景中丰富数据传输种类和同步数据形式。

Rokid产品技术总监赵维奇谈道,人们通过AR技术将常见的起居、户外营地、交通场景产生变化,包含延展起居空间、AR和实时通信组合增加户外娱乐方式、AR技术帮助人们在路上正常工作,在实时互动、通信,在新技术的加持下,使我们曾经想象的场景不断落地。

谈及实时互动在这一市场中的重要性时,侯云忆认为,如果说世界是一个元宇宙的话,那么物联网就是感知层的最重要基础设施,实时互动就是其中的神经或者血脉,也是其中最重要的通讯基础设施,ARVR技术就是用户在元宇宙世界中重要的互动界面。

综合起来,以虚拟空间为代表的沉浸式互动方式必然会驱动实时互动技术的快速发展,未来,甚至会实现千人同频互动场景的愿景。

同时,为了让开发者能够更低门槛的使用相关解决方案,声网今年6月推出了灵隼物联网云平台。

音视频物联网行业起势,实时互动成智能设备的“硬指标”!

▲灵隼物联网云平台

侯云忆告诉智东西,灵隼物联网云平台的定位是aPaaS(应用程序平台即服务)应用级平台,其目的就是为开发者提供一站式解决方案。在这其中,“声网上不碰业务,下不落盘数据”。不仅在产业链路中起到了连接作用,并且其平台不会留存数据,能够保护用户数据安全隐私。

当然,构建这一开放、易用的物联网云平台,离不开声网此前的技术积累,以及其在生态建设上的理念。

其中,声网实时音视频技术和其构建平台式产品的端到端能力、云平台解决方案能力,是其最坚固的底座。此外,正如我们前文提到的,物联网冗长的产业链,也给产业玩家提出了考验,因此,作为全球化服务提供者,声网在安全合规的基础上,将目光聚焦到了实时互动技术本身,并以点带面,加速生态构建。

不仅如此,声网还加入了OLA(开放智联联盟)联盟,这一联盟对国内物联网玩家的意义重大,将有可能改善物联网碎片化难题,因此,为了加速音视频物联网行业的发展,声网在OLA发起成立了音视频小组,积极推动音视频设备互联互通标准方案落地。

一个产业的发展离不开行业标准的完善,随着相关标准的推进,关于实时音视频在物联网行业中无处不在的愿景将加速实现。

结语:音视频物联网行业势头正好

物联网行业发展加速,万物互联时代到来。实时互动的物联网设备已经在改变着我们的生活和工作,从其落地的产品形态、功能来看,实时音视频在物联网中的应用正在加速。

即便不同物联网设备间对于音视频的需求不同,但声网在其中扮演的底层技术赋能者角色,在为这些玩家打包解决方案的同时,让上下游的生态伙伴联动起来,促进实时互动在智能设备场景应用中的落地与普及。

随着物联网产业的不断成熟,音视频物联网行业玩家将会给我们带来更多新故事。