AI应用风向标(公众号:ZhidxcomAI)
作者|江宇
编辑|漠影

Agent能写文案、能查资料,也能帮你搭个网页。但如果想把一件事做到底——比如写完一首歌、搭好一个网页、调试功能、托管上线、还支持用户互动改写,中间往往还有几道坎需要用户亲自迈过。Manus 1.5正试图打破这个边界。

智东西10月17日报道,昨日,Manus正式推出1.5版本,除了在速度与推理质量上持续提升,本轮更新的重要变化是:将“上线部署”“网页测试”“版本管理”“多人协作”等传统人为环节一并纳入Agent执行能力。

这一变化的关键标志,是Manus 1.5引入了具备操作能力的“内建浏览器”,允许AI像用户一样点击网页按钮、测试功能、修复bug。同时,还新增了“Library”文件库统一管理生成内容,并开放多人进入同一Agent会话协同编辑。

功能能力上,Manus 1.5区分出旗舰版和轻量版两个使用路径,分别面向复杂构建场景与成本敏感型日常任务。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

平台数据显示,其平均任务完成时长已从4月的15分36秒缩短至当前版本的3分43秒。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

▲Manus 1.5平均任务完成时间为3m43s

在社交平台上,不少用户也对这次更新表达了积极评价,包括“加载更快”“功能更全”“更新到位”等反馈。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

▲图源:X

为了实测这套升级后的完整Agent闭环能力,我们设计了一个极具可玩性和互动性任务场景:将一首网络神曲《技能五子棋》交由AI改写,并生成一个用户可以在线互动、自由魔改的音乐网页应用。这个项目,我们完全通过自然语言完成,未写一行代码,经历了两个版本的指令迭代,最终落地。

1、第一回合指令:从“写一首歌”到“做一个能玩的网页”

指令1:请基于上传的歌曲为我重新填词,创作一首歌,然后搭建一个网页,用户可以通过以下功能玩这首歌: 1、 点歌词改写(自然语言); 2、拖动情绪滑块调整歌词和配乐 ;3、上传用户哼唱的音频替换演唱者; 4、自动合成并播放用户版本; 5、支持版本对比与分享。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

Manus随即进入项目规划流程,提示我们补充三项内容:上传歌曲文件、指定歌词主题与风格、设置情绪调节维度。在确认参数后,AI进入网页搭建阶段,并通过“Manus的电脑窗口实时展示网页构建进度。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

这一环节是1.5版本的重要新特性——支持在一个完整上下文中,由AI全权执行网站从设计到发布的全过程,并实时回传预览界面,便于用户检查和指令干预。

几分钟后,我们收到了第一版成品网站,命名为“歌曲重混工作室”。网页中部展示AI改写的歌词文本,右侧包含情绪滑块、歌词改写指令入口、音频上传区,底部则提供版本切换与分享按钮。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

尽管功能基本搭建完成,但初版体验中仍有明显短板:歌词内容虽可改写,但音频并未同步变化,无法听到更新后的“唱出来”的版本。

2、第二回合指令:格式要魔性,音频要同步

我们很快向Manus发出第二轮指令,明确提出两个修正目标:

指令2:1、原始歌词的格式改为emoji版本,保留当前歌词的风格格式,包括关键词加emoji、括号表情、魔性重复等形式,并用相同风格生成歌词改写版本; 2、网页中的“歌词编辑”“情绪调节”“换风格”等操作不仅要重新生成歌词文本,还要自动更新合成的歌曲音频版本,确保文字与旋律一一对应。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

Manus立即响应,并回传了一段技术说明,解释为何未能实现“歌词改写后同步生成歌曲音频”的目标。

在当前架构下,想要打通这个闭环,需依赖三项AI音乐处理能力的协同支持:一是将文本转为演唱语音的TTS模块,二是根据歌词自动生成旋律与配器的音乐生成AI,三是将旋律与人声混合的音频合成系统。

而这三者通常依赖外部平台如Suno AI或Udio的API服务,涉及付费、生成时长较长(通常30秒至2分钟)、音频合成链路复杂等问题。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

目前Manus尚未对接上述服务,因此采取了过渡性的解决方案:保留原始音频作为背景乐,用户可上传自己的哼唱音频进行替换,网页也内置了TTS朗读功能以辅助试听。

最终版本的网页在结构与交互上已趋完整。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

围绕“歌词改写”“情绪调节”“上传音频”这三类交互,Manus也同步更新了界面,确保每一步都能触发相应的文本与试听反馈。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

在最终网页上,我们还体验了“关键词定制改写”功能,如输入“糖葫芦、加班、熬夜”,系统即生成了“糖葫芦版”“加班版”“熬夜版”歌词,并在网页下方版本管理区自动归档、支持一键切换。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

▲糖葫芦版

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

▲加班版

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

▲熬夜版

我们进一步探索网页交互细节时发现,Manus 1.5在网页编辑上支持“点击式重写”。我们在使用“编辑”功能的过程中发现,只需将鼠标移至歌词区、情绪面板、版本对比区等任意板块,系统便会高亮提示可交互区域,点击后即可直接输入自然语言修改指令

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

Manus会实时识别当前所选区域的上下文,快速执行修改并自动刷新网页组件,整个过程无需跳转、无需代码。

《技能五子棋》被Manus 1.5玩活了:无代码生成魔改网页,情绪调节、歌词替换全搞定!

这一体验与传统网页搭建工具最大的不同在于:所有操作均在一个上下文内完成,AI不仅“听懂了”,还能“马上动手”。

最终成品网页可访问于:https://songremix-2sqdak.manus.space/

结语:更流畅了一些,也更能“自己动手”了

从整体流程来看,Manus 1.5的体验比我们此前接触的版本更流畅,任务拆解、状态衔接和指令响应都更稳定,尤其是在复杂需求下依然能保持对话连续性这一点,提升明显。而其中变化最大的,其实是那块新增的“内建浏览器”。

这一次,Manus不仅能生成代码和页面,还能在模拟浏览器中像用户一样点击按钮、识别出错位置、直接修复。这类本属于开发者工作流的行为,被系统默认纳入AI的执行范围,也使得它在交付完整任务时减少了不少“卡住”的中间段落。

在某种意义上,Manus正在让“用AI构建产品”这件事,真正变成一句话就能开始的事。