
智东西AI前瞻(公众号:zhidxcomAI)
编译 | 江宇
编辑 | 漠影
智东西AI前瞻6月14日消息,The Browser Company推出新产品Dia,是一款AI驱动的网络浏览器,旨在简化用户日常互联网任务,增强用户的浏览体验。
它围绕着,The Browser Company所称的“市场上最个性化AI的深度集成”而构建 。
与此前主打界面革新的Arc浏览器不同,Dia将重心从浏览器外观转向“操作逻辑”,即不再引导用户如何浏览网页,而是让AI介入用户的每一步操作,从搜索信息、整理笔记、写邮件到网购比价,Dia都允许用户直接通过AI对话来执行任务。
这不再是浏览器集成AI插件,而是一种“以对话为入口”的与用户交互的全新逻辑。
▲Dia可一次引用多个选项卡。
当前测试版本仅支持macOS平台。
The Browser Company成立于2019年,总部位于纽约,其创始团队由CEO Josh Miller和CTO Hursh Agrawal领衔,并由多位来自Chrome、Instagram、Tesla和Medium的工程师和产品背景人员组成。
一、Dia让AI参与到用户的上网行为中去
The Browser Company的上一款产品Arc曾尝试以垂直选项卡、“空间”功能等方式重构浏览器的界面,试图引导用户进入“更美、更有秩序”的浏览方式。
但CEO Josh Miller承认,“Arc的创新过于超前,大多数人根本没有上手”。
相比之下,Dia完全抛弃了这些界面层的创新,回归类似于Chrome的传统浏览器布局,但其操作方式将彻底不同。
用户可随时在右侧对话栏与AI助手交谈,让其识别网页内容、跨页面调用历史记录,甚至执行复杂任务。
▲使用Dia找到论文后,可在右侧对话框提出问题。
根据官网介绍,Dia参与了用户浏览网页过程中的多个环节,成为实际操作中的辅助工具。例如:
-
在写作时,Dia可直接在输入框中提供文字建议,帮助用户润色邮件、总结会议纪要、推荐用词与句式;
-
在学习或网购时,它能结合用户的浏览轨迹和内容偏好,自动完成比价、分析评论,并给出替代商品建议;
-
在处理日常事务时,Dia支持一键生成待办事项、翻译网页内容或将网页信息提炼成笔记,减少手动跳转与复制。
这背后主要依赖的是OpenAI的GPT-4.0模型,但Dia的实现方式并不是简单地在浏览器中放置一个“对话框窗口”,让用户手动提问、复制网页再去ChatGPT聊天。
Dia的关键区别在于,它把AI当作用户操作网页时的“代理人”。AI不仅能看到用户正在浏览的页面,还能理解页面上的内容,主动识别用户的需求,并直接参与到任务执行中,比如提取表格信息、自动填写表单、生成摘要等。
换句话说,Dia不是让用户“和AI对话”,而是让AI参与用户在网页上的行为,并帮用户完成任务。
二、Dia构建的是“分布式助手系统”,而非单体模型
目前主流浏览器引入AI大致有两种方式:一是Google的Gemini in Chrome路线,在已有的浏览器架构里,添加AI功能点,用户仍然按传统方式浏览网页,AI只是额外工具;二是Perplexity、OpenAI桌面端和The Browser Company的路线,浏览器将AI作为核心交互入口,用户通过自然语言输入与AI直接对话,AI自动识别网页内容、主动执行任务,让AI成为“操作代理”。
Dia并不试图自己训练大模型,而是构建了“Routing System+Skill System”两大技术框架来调用不同AI能力:
- 任务分配系统(Routing):为用户的问题精准分配模型与任务路径,用户说“我想买件外套”,Dia会调用具备上下文和浏览记录的“购物助手”模型,识别来源、筛选偏好,而不是套用一个通用问答式聊天机器人。
- 技能模块系统(Skill):针对不同任务构建小型AI插件,例如用于写邮件、总结网页、分析代码的模块,会读取用户历史数据,自动匹配语境、语气或代码风格。
三、浏览器是AI最理想的入口,意图+数据+页面接入三位一体
Dia之所以从浏览器场景切入AI,而不是另起一个独立应用,主要基于三点考虑:
1、用户意图最集中的地方是浏览器的地址栏
每次用户按下“新建标签页”(CMD+T),输入的第一句话就是用户当下的需求表达。Dia把这个搜索栏变成AI的入口,掌握了用户最自然、清晰的需求表达。
2、浏览器拥有最完整的“上下文记忆”
Dia知道用户打开了哪些网页、在哪些平台登录、看了什么内容、停留了多久。Dia可利用这些行为轨迹,来理解用户的真实意图并回以更贴近需求的响应。
3、浏览器具备天然的“隐性权限”能力
通过网站Cookie,Dia不仅能“看到”网页,还可以以用户的身份执行操作:预订餐厅、填写表格、提交资料……虽然出于隐私考虑,当前版本尚未全面开放这类操作,但The Browser Company已在内部验证了其可行性。
这是目前大多数AI聊天助手尚不具备的能力。
Dia能“看到一切”,自然也带来了巨大的隐私压力。它可以读取用户在网页中输入过的任何内容,哪怕是社保号、银行卡号,理论上也能被AI引用。
The Browser Company对此承诺,Dia的数据默认加密存储在本地,云端处理只停留“几毫秒”;涉及财务、健康等敏感信息的交互也设有安全阈值,不会被轻易调用。
▲Dia的隐私设置。
结语:这不仅是浏览器竞争,更是AI“入口之争”
The Browser Company已累计融资约1.28亿美元,2024年3月完成5000万美元A轮融资,估值达5.5亿美元。
其投资方包括Pace Capital、LinkedIn前CEO Jeff Weiner、Figma创始人Dylan Field、Notion联合创始人等科技大佬。
The Browser Company的目标,是将Dia打造为“用户与AI关系的起点”。换句话说,该公司的竞争焦点超出浏览器范畴,而是争取成为那个最早理解用户、陪伴用户建立使用习惯的AI应用程序。
一旦用户在Dia中建立了长期语境、操作习惯和信任关系,他们就更难迁移到其他AI应用程序。Miller将其比作Spotify和Apple Music的差异,即使Apple生态体验更好,很多人仍不愿换掉Spotify,因为它理解用户的音乐口味。
未来的AI也是一样。而Dia争取的,正是这个先发关系。
来源:The Verge、engadget、diabrowser.com