智东西(公众号:zhidxcom)
作者 | 云鹏
编辑 | 漠影

刚刚,国产版“贾维斯”,真的进家了!

辛苦一天,深夜推开家门,耳边响起:“加班辛苦了,早点休息,有需要随时叫我!”

当我在厨房一边煎牛排一边分心刷世界杯短视频忘记时间,语音提示随之响起:“油温即将过高,距离最佳关火时间预计还有20秒!”

出差在外,孩子在家看平板、电视,系统自动开始计时,到预定时长自动关机并给我手机上发来提醒;

AI摄像头看到父母在家忘记按时吃药,系统根据家庭档案中病史及时判断,通过音箱播报提醒吃药。

AI大管家不仅懂我的生活作息、知我的健康状况,会主动关心我,随时感知我在各类场景的状态,甚至还给全家人建立了专属档案。

今天,这样的体验,已经有机会成为现实。

就在昨天,小米正式发布并开源了Xiaomi Miloco 2.0,一套面向未来的全屋智能AI开源方案。直观来看,小米给Agent时代的智能家居装上了新的“AI大脑”,把超级AI管家带进了智能家居生态中。

客观来看,这也是目前业内第一个能够实现AI主动服务、有家庭记忆的智能家居解决方案。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

▲Xiaomi Miloco 2.0 GitHub首页

当前,以各类Claw为代表的Agent(智能体)成为AI赛道的核心焦点,其在生产力提效方面作用显著。然而在“AI进家”这一关键场景,仍然缺乏一个关键系统,把基于大模型、通用性极强、多模态交互能力极强的各类Claw与智能家居设备生态彻底打通、连接起来,让Agent可以真正“懂家”。

Xiaomi Miloco 2.0,就是这样一个核心系统,可以化作Agent的“眼睛、耳朵、记忆”,各类米家设备作为全模态感知入口,Miloco 2.0通过视觉、声音、环境感知实现全屋理解,将用户需求传达给Agent,真正完成AI在家庭场景提供服务的闭环,而所有用户数据都保存在端侧,原始数据与Agent完全隔离,数据完全由用户掌控,隐私安全问题得到妥善解决。

这背后不仅是小米大模型底层能力的升级,更是一套系统级全屋智能AI框架的成熟。Xiaomi Miloco 2.0真正成为了一个有记忆、能认人,还能流畅执行复杂任务的AI智能管家,全屋智能在Agent时代的拐点,已经来了。

一、四项核心能力升级,给家庭配上超级AI大管家,如何颠覆体验?

智能家居并非新概念,在Agent与Miloco 2.0智能系统的加持下,我们到底能够获得怎样的颠覆性体验?从多个官方演示视频中我们能清楚地看到:当Agent真正懂家、懂你后,家居场景所迸发出的AI应用价值空间是巨大的。

纵观此次小米开源的Miloco 2.0,多模态感知、主动智能、持续任务和家庭记忆是其四个最核心的功能升级。

多模态感知方面,案例视频中的“水烧开无人时主动提醒”令人印象深刻,从摄像头+传感器判断水烧开、检测人不在厨房,到最终通过距离用户最近到音箱播放语音提示,整个流程自然高效、符合逻辑。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

从单一视觉升级到多模态感知,系统能同时处理空间内的画面变化、人物变化、声音语调、温度等多维数据,感知更为精准和立体。

主动智能方面,当摄像头感知到主人回家,会结合家庭记忆进行判断,发现到家时间晚于平均,推测主人可能加班了,因此主动给予慰问。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

从规则驱动到主动智能,系统凭借大模型强大的常识推理能力,主动观察用户场景状态,基于用户的日常作息与设备使用习惯,自主进行判断并主动提供服务。

持续任务也是非常实用的一项升级,当系统收到生日提醒指令后,就会主动编排家中可以用到的设备,比如各类灯、电视、音箱,生成生日惊喜方案,随后就开始持续“待命”,当系统监测到家人归来,就会调动设备执行编排好的方案。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

从单点执行到长期任务,相比传统的“一句话一执行”,AI真正可以实现随时在线、多时段持续跟踪。

最后一项核心升级是家庭记忆功能,这也是贯穿许多能力的一项基础功能升级。

正如演示视频中所展示的,当摄像头识别到有人书房落座,就会根据其身份回溯家庭记忆,根据其喜好调整灯光,比如男主人喜欢在阅读电脑时用明亮暖光,女主人则喜欢在写笔记时用柔和的中性光。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

摄像头识别到女主人坐姿不佳的时候,也会根据家庭记忆联想到她腰部不适的病史,并即时提醒注意坐姿,在识别到女主人运动的时候,也会即时提醒她动作幅度要注意,避免腰部过度用力。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

从宽泛上下文理解到专属家庭记忆,AI直接“精准识别家庭成员身份信息”, 将通用常识知识与长期沉淀下来的专属“家庭档案”进行结合,针对性匹配其专属、个性化的智能服务。

从多模态感知、主动服务、持续任务到家庭记忆,这四大核心功能的升级,可以说构成了次世代智能家居体验的“基石”,而这些能力的持续迭代将带来巨大的应用空间,许多新场景亟待被发掘:

当AI综合摄像头、手环、声音传感器等各类设备指标察觉到你情绪低落时,就会主动为你播放一些轻松舒缓的常听曲目,并主动尝试与你聊天为你缓解压力,AI成为知你懂你的贴心朋友;

家中长辈从起床、吃饭、吃药到休息,在家中的状态时刻被摄像头以及各类传感器综合追踪感知,按需及时提醒,仿佛有一个24小时贴身健康管家;

小长假全家旅行前手忙脚乱,AI细心地根据家庭档案,把爷爷要吃的药、奶奶要带的护腰都提醒到位,并且根据家庭档案中孩子的身高,细心提醒家长不要忘了在旅游景点买全票,AI成为懂你全家的超级大管家。

所有的一切,理论上都在Xiaomi Miloco的能力范围之内,未来都有可能成为现实。

总体来看,在Miloco 2.0的加持下,曾经对家庭场景是一片“盲区”的Agent,终于可以借助新的眼睛、耳朵和各类感知能力,去懂用户、懂用户的家,懂用户在家的一系列复杂状态和需求,进而提供真正主动有温度的智能服务。

Agent时代的智能家居体验,被彻底革新。

二、深度拆解Miloco架构:让Agent真正“懂家”,掐紧隐私安全底线

通过这一系列出色的AI场景体验我们不难看到,Miloco 2.0的开源直接将智能家居的AI生态协同体验带到了一个新的高度,而今天距离Miloco 1.0正式开源仅仅过去7个月。

如果说1.0解决了AI与设备的联动,搭好了框架,那么2.0则真正实现了全屋智能的“Agent化”。

从架构上来看,端侧Miloco 2.0系统与主AI Agent之间实现了高效的协同配合:

Miloco部署在本地,利用米家设备作为入口,调用云端的omni(全模态)感知大模型进行视觉、声音、环境的全屋理解与身份识别,把感知、处理后的关键结构化信息发送给主Agent,随后主Agent调用云端大模型模型进行全局任务规划与决策,规划出执行步骤后,再向Miloco发起调用,最终Miloco联动全屋米家智能设备完成AI服务的闭环。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

值得一提的是,想要实现这一套看似极为超前的“次世代智能家居AI体验”,门槛已经大大降低,普通小白用户也可以很轻松的上手体验,完成部署。

你最少只需要:

·一台能跑OpenClaw的电脑(跨平台支持Mac/Windows/Linux);

·一个绑定了家里米家设备的小米账号;

·一台米家摄像头作为视觉感知入口;

·一个多模态大模型的API Key(当然小米官方推荐的是其自家的MiMo)

目前Miloco 2.0已经接入了Agent圈受众最为广泛的OpenClaw,根据官方信息,后续Miloco也会陆续适配更多Claw类产品。

对于用户来说,Miloco 2.0已经做了大量优化简化,你只需要给OpenClaw发送指令,它会自动帮你完成环境准备、绑定账号和模型,全程几乎不需要更多操作,可以说极大地拉近了AI前沿技术与消费级场景的距离。

虽然部署上大幅简化,但在用户最关心的安全方面,Miloco却一点都没省:

所有摄像头、各类传感器收集的原始数据“用完即弃”,数据完全本地保存,绝不留存云端,随时可清空,即便忘记,30天后也会自动清理。用户还可以给摄像头设黑名单、给家庭设白名单,可以说数据完全由用户掌控。

值得一提的是,这些原始数据与OpenClaw完全隔离,Agent能获取的信息只有Miloco系统判断完所给出的“发生了什么”的语义结果。

安全这道“底线”,小米狠狠掐住,不留任何风险。

三、抢先用AI Agent变革智能家居,下一个十年小米能否继续领跑赛道?

在今天的Agent时代,小米有望重新定义智能家居发展的新范式和方向。从Miloco 1.0到今天的2.0,AI时代、大模型和Agent加持下的智能家居到底要怎么做、如何跑通,小米已经交出了一份蓝本式的答卷。

而这份答卷的背后,是小米近年来AI实力的飞速增长。

小米旗舰大模型MiMo-V2.5-Pro在通用智能体能力、复杂软件工程以及长任务等维度上都达到了全球顶尖Agent模型水平,在Artificial Analysis大模型综合智能榜单上,Xiaomi MiMo-V2.5-Pro综合智能指数位列全球开源大模型并列第一。小米MiMo大模型也是此次Miloco 2.0的智能核心。

根据全球AI模型监测平台OpenRouter 6月10日数据,小米MiMo-V2.5模型单周调用量达到了2.19万亿,位列全球第二,仅次于DeepSeek。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

而就在最近,小米MiMo团队与推理系统团队TileRT联合宣布,Xiaomi MiMo-V2.5-Pro的UltraSpeed模式已实现万亿参数(1T)旗舰模型输出速度首次突破1000 tokens/s,实现10倍速度提升只需要3倍价格。

智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了

在“人车家全生态”战略下,AI是小米核心攻坚的技术领域,未来三年的计划投入约600亿元。这次Miloco 2.0的落地、与OpenClaw的强力结合,无疑是小米在“AI x 家”这个场景中迈出的关键一步。

小米在AI领域的技术实力已不容小觑。

与此同时,我们也看到,小米这家公司做“把Agent与智能家居结合”这件事时,展现出了行业其他厂商难以望其项背的“生态护城河”优势。

回望过去十几年,小米一直是智能家居赛道的生态王者,十年前,米家基于过硬的产品力、远超行业的统一互联体验,定义了智能家居领域的“互联互通时代”,而互联体验也一直都是小米生态的王牌之一。

当前小米生态中的AIoT设备连接数量已经接近12亿,小米有着全球独一无二的庞大用户生态,这样的IoT基座提供了极其丰富的硬件生态,让Miloco的成长天然有着最肥沃的土壤。

客观来说这是小米在AI领域几乎“不可复制”的生态护城河。

今天,Miloco 2.0到开源并不是一次简单的软件迭代,而是全屋智能向“系统级Agent”方向进化的一次关键技术迭代。领跑智能家居的下个十年,小米已经冲在了行业最前面。

相信在不久的将来,当十多亿设备真正接入AI时,智能家居领域真正的“GPT时刻”,或许就会到来。

结语:Agent加速进家,AI家居时代来了

智能家居发展了十几年,如果说此前的变化类似“线性积累”,那么Agent时代所带来的剧变可能会是一次“指数级爆发”,AI彻底突破了我们的想象空间,Agent、大模型与全屋智能设备协同联动,碰撞出新的玩法,大开脑洞。

而这一切的实现,都离不开类似小米这样的底层技术生态支撑者,唯有从硬件、系统、模型到应用生态的全面协同打通,才能让Agent进家有真正好的体验。

此次Miloco 2.0的开源,也必然会显著降低三方硬件厂商和开发者切入全屋Agent的门槛,吸引更多开发者加入到小米Miloco生态中,这也会进一步加速智能家居行业向Agent时代的全面进化。

展望未来,“贾维斯”式的超级AI管家必然会加速走进每一个普通用户家中,并且是以更亲民的价格和更低的部署门槛。“你不用顾家,家会顾你”不再是一句“玩笑话”,而是会成为看得见摸得到、享受得到的现实体验。