智东西(公众号:zhidxcom)
作者 | 江宇
编辑 | 漠影
智东西12月5日报道,今年9月,Insta360影石推出Wave AI全向麦克风,并搭载了腾讯天籁inside解决方案,双方在音视频生态共建上的又一次实现关键突破。借助腾讯天籁实验室的深度技术支持,Wave AI全向麦克风实现了300余种环境噪声消除、5米远距离超宽带清晰拾音。
前日在深圳,智东西与多家媒体共同采访了影石Insta360与腾讯天籁实验室团队。
在长达一个半小时的采访中,影石与腾讯团队详细分享了产品共创过程中的技术挑战、AI协同,以及双方对未来设备发展的讨论。
一、为什么是麦克风?AI浪潮下的场景重新洗牌
影石Insta360硬件产品经理郑进聪在采访一开始就谈到,大模型时代为“会议”创造了天然机会:“大语言生成式的产品在开会场景下有天然的优势,会后需要把长时间的会议语音转成文字……也是我们看到大模型比较大的机会点。”
选择会议室音频麦克风而非更流行的录音卡片,是影石基于应用需求做出的判断。远场拾音、多源人声区分、复杂混响等问题无法由便携产品承担。会议的行业对音频能力的综合性要求高于耳机,这也成为Wave项目立项的关键。
影石Insta360首席战略官袁跃进一步补充,影石从不以“追热点”来做产品规划:“我们是想将这个能力为我们所用,而不是追逐AI硬件的热潮去做一款所谓的AI硬件。”
二、腾讯与影石的共同追求:挑战、突破、极致体验
此次采访中,出现频率最高的词是:挑战、突破、极致体验。腾讯云副总裁、腾讯会议天籁实验室主任商世东坦言,与影石合作让他们多次突破了预设:“影石非常追求极致,近场要求很好跟耳机一样,远场希望听到1米和5米是一样的,这是以前做不到的。”
商世东还补充道,“我们在产品研发过程中,一直在不断突破原有技术边界……很多指标是互相制约的,但影石的要求是不允许有明显短板。”在混响房间的问题上,双方经历了大量反复:去混响做好了,降噪效果又差了;降噪好了,混响又不够。
最终,双方在算法结构、数据仿真、麦克风布局等多方面进行了深度共创。
商世东感触最深的瞬间是验收当天:“中间有过想打退堂鼓,但坚持下来终于有回报……内部评测给出的效果非常认可。”
三、AI让会议设备“进化”,从“听得见”到“听得懂”
Wave的产品逻辑并不是传统麦克风的升级。郑进聪将会议音频的需求分成三层:基础清晰度、自然度和沉浸感,以及AI识别与内容理解。
郑进聪谈道,“整个行业都会往AI方向发展,AI能显著提高会议或工作的效率。”袁跃也认为,AI会议麦克风更加智能,“可以实现开完会后,把信息从智能会议中心到实时会议转写和会议记录,包括AI总结问答。”
腾讯天籁AI技术的加入,也让Wave在多人会场、玻璃房、咖啡厅等复杂空间中仍能保持稳定语音识别能力,为AI会议纪要、实时总结与归档提供高质量声学输入。
四、从“软硬共创”到生态协同:双方都看到更大的未来
在谈到未来产品方向时,郑进聪提到,影石团队正在把AI能力与硬件深度结合:“原则上来说,我们作为智能硬件,希望能跟模型和AI更好协同。”
他进一步强调,Wave并不是单点硬件,而是一个在生态中不断优化的位置:“我们的核心是为了在软硬生态协同上不断优化。”
他还补充道,“我们长期来看,希望做到多模态下的软硬件和模型的高效协同,可以满足用户不同场景的设备。”
腾讯商世东也提及:“从广泛的理解角度来说,硬件产品不是我们擅长的,这是为什么我们跟头部厂商一起合作把硬件产品做好。我们更多的切入点是生态的力量,我们在底层技术的积累,让我们合适的合作伙伴,一起把最终用户体验做好。”
结语:软硬融合加速,办公与生活出现了新的可能
近几年,大厂与硬件厂商的合作正在变得越来越紧密。算法、模型和算力的能力不断提高,而硬件端的应用场景也在持续丰富。
对硬件厂商来说,AI提供了一条新的路径,让固定的功能变成更加灵活。对技术大厂而言,硬件也成为AI能力进入真实场景的起点,让模型有能力接触到人的语音、动作、空间和行为。
这些变化也正在影响办公与生活的许多细节。而这些趋势可能会继续推动下一代办公和生活方式的形成。