国内首个智能体可信互连工作组成立！超20家手机、大模型厂商组队

智东西（公众号：zhidxcom）
作者 | 程茜
编辑 | 云鹏

智东西12月19日报道，今天，国内首个智能体安全生态协作组织“IIFAA智能体可信互连工作组”宣布成立，中国信通院、荣耀、OPPO、小米、华为、智谱、字节、阿里、蚂蚁、京东、中国移动、高通等二十余家头部科技企业和单位是该工作组首批成员。

AI智能体已经成为大模型产业玩家的重点布局赛道。苹果、荣耀、vivo等手机终端厂商的智能体、智谱AI推出的AutoGLM、蚂蚁集团推出的AI生活管家“支小宝”等AI智能体产品层出不穷，这使得用户可以与设备或APP进行自然语言交互，快速实现订票、点餐、打车、查询附近吃喝玩乐等操作。

其中，多智能体系统协作的同时，会面临智能体之间如何打通、数据隐私安全保护、用户意图数据的共享等诸多问题。IIFAA互联网可信认证联盟秘书长郑亮提到，智能体之间的服务互联最终要完成用户指令，这中间涉及到意图数据的共享传递和复杂任务拆解等必经流程，这些流程在没有规范约束的情况下，就像开车没有红绿灯，非常容易滋生乱象。

未来，IIFAA智能体可信互连工作组将围绕智能体可信认证、服务可信调用、数据可信流转、用户隐私与权益保护，制定跨智能体交互的相关标准等形式，为智能体行业的发展提供更加规范健康的协作环境。

关于当下推动智能体可信互连的有潜力技术路线，IIFAA互联网可信认证联盟技术负责人万小飞告诉智东西，有潜力的几大技术场景包括应用于数据隐私流通中的匿名化技术、智能体业务之间的请求协同、端侧App之间的可信流通、智能体协同之间的可信计算、分布式数字身份技术等。

一、每天新增智能体2-8万个，多智能体协作面临四大风险

信通院泰尔终端实验室信息安全部副主任傅山谈道，AIGC构建的全新应用生态，变革了交互方式、产品形态、产业生态。

在交互方式层面，从人去被动接受App开发逻辑到机器适应人；产品形态层面，AI智能体具备强大的智能感知能力，AI手机、AI可穿戴设备等出现；产业生态层面出现了超级应用、原生AIGC应用、终端+AIGC形态等。

与此同时，多个具有自主性、交互性和协作性的智能体组成多智能体系统，可以在智能制造、智能交通、灾害救援、智能物流、医疗领域等实现应用。但多智能体协作发展也带来了不少的风险与挑战。

国内首个智能体可信互连工作组成立！超20家手机、大模型厂商组队

主要的风险有四点，第一是AIGC发展应用过程涉及大量的个人信息处理活动，数据源获取的方式包括主动爬取互联网数据和被动，无法有效追溯和验证其中的个人信息来源；第二是训练数据包含大量用户个人信息，互联网的公开数据成为训练来源，数据脱敏、清洗过程中没有有效识别关联个人信息的数据会有泄漏风险；第三是大模型的幻觉，输出的数据不可信、不可追溯；第四是模型的黑盒算法没有办法验证。

傅山提到，据国内外主流智能体平台运行情况来看，平台平均每天可增加2-8万个智能体。这一背景下会出现隐私侵害、过度数据收集、数据滥用、算法偏见、透明性不足、责任归属等风险。

基于此，信通院构建了生成式AI产品和服务用户权益保护标准体系。在数据获取和用户授权的矛盾上，目前通过匿名化技术的手段，可以提升个人信息数据的可用性。

匿名化技术可以应用于端侧处理、大模型训练、公开报告中，通过匿名化技术保证数据只在端到端场景交互，同时还能对统计报告中的公开数据进行匿名化技术，并公开发布。

国内首个智能体可信互连工作组成立！超20家手机、大模型厂商组队

二、多智能体协作案例GLM-PC，敏感信息操作经用户二次确认

智谱AI此前发布的GLM-PC，就是多智能体协作的典型案例。

CogAgent是依靠视觉对屏幕进行感知，然后获取屏幕上的界面元素信息的模型。智谱AI为其训练了一个可以接受1120×1120分辨率的图形输入的高分辨率的编码器，使得高分辨率图像特征，通过多个交叉注意力和视觉语言解码器相互联合，共同输出最终的结果。

新增了GUI界面元素的指代生成和指代理解相关预训练任务，指代生成指的是让模型根据屏幕截图和给定区域生成相关自然语言描述，指代理解指模型根据屏幕截图和自然语言描述计算这个被描述的元素所在的区域。

这两个任务分别对应的是界面上的元素是什么、界面上的元素在哪个位置。

智谱AI收集了汽车、手机、电脑等在不同分辨率、不同平台在内的包含一级界面元素量的百万量级屏幕截图数据，并采用多尺度训练策略和多样数据增强策略，提升了CogAgent模型GUI理解的能力，使其可以准确识别界面上的图标、按钮、文本。

国内首个智能体可信互连工作组成立！超20家手机、大模型厂商组队

此外，为了提高CogAgent的模型能力，其设计了目标拆解、长短程规划、界面理解、任务执行、状态判断等一系列训练任务。

CogAgent的行为包括两部分，模仿人类操作行为和LLM原生行为。这也包括其训练的三个思路，分别为被动模仿人的行为、交互学习、主动探索。

GLM-PC是一个开箱即用电脑智能体，用户只需要在文本框中输入任务的内容，然后按下回车就可以。它可以自己启动电脑上所需要的应用，像人一样去根据指令去执行一个长链条跨应用的操作，然后将最后的执行结果返回给用户。

在安全方面，GLM-PC会将即时通讯消息，文件发送、删除、清空，支付、转账，用户账号管理、密码输入等操作由用户进行二次确认；智能体的虚拟屏幕可以不影响人类使用自己的物理屏幕，用户能够查看隐形屏幕上GLM-PC的工作情况；第三是智谱AI在探索本地端侧模型的合作，对用户的个人隐私数据进行预处理等。

结语：AI智能体生态繁荣，可信互连工作组先行一步

AI智能体的能力在不断增强，业界诸多企业正在将文本、图像、语音等多种模态数据相结合，使智能体能够更全面地感知和理解环境，进而做出更准确、更贴近人类认知方式的决策和响应，如智谱AutoGLM可以自主执行超过50步的长步骤操作，并能够跨App执行任务，像发送红包、查询并下单外卖、采购食材等复杂任务。

可以预见，未来，AI智能体将极大地改变人们与AI的交互方式，但在这一背景下，用户的数据隐私与安全、智能体与不同系统和设备间的交互协同工作等挑战也不容忽视，在此背景下，IIFAA智能体可信互连工作组的成立，或许可以为未来有效避免由于缺乏统一标准而可能导致的智能体恶意攻击等诸多风险提供一条可行的解决路径。

一、每天新增智能体2-8万个，多智能体协作面临四大风险

二、多智能体协作案例GLM-PC，敏感信息操作经用户二次确认

结语：AI智能体生态繁荣，可信互连工作组先行一步

相关推荐