第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

智东西（公众号：zhidxcom）
作者 | 程茜
编辑 | 心缘

智东西4月26日报道，今天下午，AI独角兽第四范式首次公开了其面向企业的大模型产品SageGPT（式说大模型），并且首次提出AIGS（AI-Generated Software）战略，也就是以生成式AI重构企业软件。

第四范式创始人、首席执行官戴文渊现场拔网线测试了式说大模型在图片理解、多轮对话、图片代码、生成代码、逻辑推理上的能力。

除了这些通用大模型外，戴文渊认为，在C端，用户对于软件的使用体验已经优化的十分到位，但对于B端软件来说，很多企业在报销、申请办公室等方面的软件体验很差，因此B端软件的体验有巨大的提升空间。

第四范式提出了AIGS战略，并将式说定位为基于多模态大模型的新型开发平台。他补充道，要做到AIGS，大模型需要具备Copilot（副驾舱）和思维链CoT（chain of thoughts，多步推理）的能力。

第四范式今天公开的已经是式说的第三个版本，从今年2月开始，该公司就发布了具备生成语言能力的式说1.0，后续又推出加入文本、语音、图像、表格、视频等多模态输入及输出能力以及企业级Copilot能力的式说2.0。

一、写代码、文图互生、“装箱”难题均不在话下

首先是图片理解能力，测试人员上传了一张电视剧《狂飙》的剧照，式说不仅可以描述这张图片的大致情况，还可以回答图片中有几个人、他们在做什么。

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

其次是图片生成能力，测试人员让式说“画一张配色鲜艳的篮球鞋”，它还可以通过背景来突出“篮球”这一元素：

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

在代码生成能力上，测试人员让式说“请用VBA编写一个求两个数乘积的代码”：

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

在CoT思维链能力中，测试人员告诉式说“我想研发一个万亿参数的生成式大语言模型，请告诉我解决这个问题的每一步”，它会将涉及到的基本步骤都罗列出来：

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

更为基本的聊天能力方面，测试人员让它做个自我介绍，不过在第一句话上其生成的内容出现了重复性词语：

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

测试人员让式说做一个旅游规划，如“五一假期去硅谷旅游，有什么推荐的地方？”，式说罗列了几大值得逛的景点：

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

写作能力方面，式说可以“根据电影《流浪地球2》的情节，写一个《流浪地球3》的剧本”，它还将前两部的剧情梗概展现了出来：

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

在推理更为复杂的“装箱”操作上，式说也快速、准确的完成了任务，并且测试人员还能查看它的思考过程：

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

二、三个阶段，要用生成式AI重构企业软件

除了具备这些通用能力外，第四范式还提出了AIGC时代的AIGS（AI-Generated Software）战略，也就是以生成式AI重构企业软件。

戴文渊认为，生成式AI可能先改造B端的软件。他举了一个关于二维码的例子，二维码支付在国内已经无处不在，但海外的二维码支付并不普及，原因在于美国信用卡非常成熟，二维码相较于信用卡的提升并不大，因此其替代性并不强。但国内，二维码支付带来的体验升级是从现金支付开始的，因此更为直观。

同样，生成式AI改造C端的软件体验不见得非常明显，但对于B端菜单式的软件，生成式AI可以将其转化成更自然的交互方式。

例如，当前的员工想要通过企业软件预定会议室，他们需要找到这个时间段内想用的办公室，然后再去挑选没有被占用的会议室。而经过生成式AI改造后的范式AI助手，员工只需要和它说“查询会议室：下午14点7楼空闲的会议室”，就能清晰看到当前可用的会议室。

因此，AIGS还可以让复杂的工作变得更加简单，第四范式将AIGS的路径总结为三个阶段：

第一个是Copilot阶段，用户使用自然语言就可以让Copilot调动不同的信息、数据、应用，来完成指令。例如用户想要把照片的亮度提升20%，不需要用户拖到修图软件中，只需要通过自然语言来输入进去。

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

第二个阶段是Copilot+基于企业规则的“知识库”。绝大多数用户使用软件都并不是使用单一功能，而是多个功能的集合，而AI可以参照这一相应的规则来执行指令。例如任务是“把这张照片p的好看一点”，式说就可以查询“人像美化”知识库后，依次调节图片的亮度、对比度等。

第三个阶段是Copilot+思维链，软件系统的使用行为不断被大模型学习，最终形成AI针对这个领域的思维链，AI就可以自动按照步骤完成“把照片处理得更好看”等任务。

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

除此以外，生成式AI对软件的改造，不仅仅体现在体验上，还体现在开发效率上。戴文渊说道，当前的软件开发，绝大多数都是以月计算时间，更复杂的软件开发可能要以年计算。但生成式AI改造后的软件开发，可以将这一时间维度缩短到以天计算。

他补充道，AIGC最重要的是将它的能力变成生产力工具，提升企业的生产效率。因此，第四范式将式说定义为一个软件开发平台，是基于大模型的新型开发平台。

式说大模型的优势包括数据安全、成本可控的多模态大模型能力，内容可信的知识库能力，执行可控、知错能改的Copilot能力，以及能够实现多步推理、复杂任务拆分、形成数据飞轮的思维链能力。

第四范式正在快速迭代产品，基于AIGC的能力，帮助企业内部软件实现效果提升。据了解，目前，其产品已经落地数十家头部行业公司，覆盖金融、医疗、能源、航空行业等。

三、四大能力积累，未来让机器自己实验找答案

第四范式在AIGC领域的布局分为四层，分别是底层的式说大模型，能力层的Copilot、知识库、思维链CoT，平台层的开发平台，以及最后在金融、零售、医疗、制造行业的应用。

第四范式主任科学家涂威威谈道，他们想让语言模型不只拥有能聊天、会画画的能力，而是要成为一个生产力工具。

在1.0阶段，大规模预训练模型存在知识过时、上下文长度受限的缺陷，第四范式基于Memory Augmentation的核心技术，能辅助大模型进行相应推理，解决用户的实际问题。

此外，这一技术不仅是将数据接进来，还能构建一整套的反馈机制，来让用户越用越好。

第四范式参战AI大模型！首提AIGS战略，现场问答画画写代码

2.0阶段大模型的核心能力是知识库结合Copilot，也就是让机器具有一定的视觉、听觉和执行能力。

通过Plugin模式，大模型可以做一些科学计算，让其应用到实际领域中去的时候，能针对每个领域具有专业的能力。

并且，2.0阶段大模型主要是企业已有的操作规范，来让机器模仿人并代替人执行相关流程。

3.0阶段就要机器做更多的事情，大模型拥有学习更多思维链的能力，可以复制、模仿、学习人的行为，甚至于模仿人的一系列动作来执行更加复杂的任务。

涂威威谈道，他们下一个阶段的目标就是让机器对着任务的最终目标去学习，而不是简单复制人的步骤，而这往往需要机器去做实验。

因此，为了降低机器的实验成本，第四范式未来的方向就是利用大型语言模型，让机器在虚拟环境中进行迭代，再应用到实际环境中去，拥有可以解决更高层目标的能力。

结语：B端企业软件或成大模型应用爆发点

OpenAI造就的ChatGPT的爆火，验证了生成式AI产品的可行性，也提升了市场对于大模型的信心，但对于其商业化路径的探索，更多还要依靠企业选择的方向。

生成式AI的爆火很大程度来源于它对于人们生产效率的颠覆性提升，但对于企业来说，私域数据的安全性与如何快速应用前沿技术同样重要，就需要更专业的技术公司来为提供支持，找到前沿技术与数据安全保护的平衡点。

一、写代码、文图互生、“装箱”难题均不在话下

二、三个阶段，要用生成式AI重构企业软件

三、四大能力积累，未来让机器自己实验找答案

结语：B端企业软件或成大模型应用爆发点

相关推荐