智东西(公众号:zhidxcom)
作者 | 三北
编辑 | 云鹏

智东西5月15日报道,今日,在火山引擎原动力大会上,字节跳动豆包大模型正式开启对外服务

豆包大模型家族在会上首次亮相,目前包括通用模型Pro、通用模型Lite、角色扮演模型、语音识别模型、语音合成模型、声音复刻模型、文生图模型、Function Call模型、向量化模型九款模型。

字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待

在定价方面,火山引擎正推动大模型从“以分计价”进入“以厘计价”阶段。豆包通用模型Pro 128k版模型推理输入价格为0.005元/千Tokens,据称比行业价格低95.8%

字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待

豆包通用模型Pro 32k版模型推理输入价格为0.0008元/千Tokens,比行业价格低99.3%。换句话说,一元钱就能买到豆包主力模型的125万Tokens,相当于三本《三国演义》。

字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待▲火山引擎总裁谭待在解读豆包主力大模型的定价

同时,火山引擎宣布推出火山方舟2.0平台,发布联网插件、内容插件、知识库插件三个重要插件。火山方舟2.0平台可提供万卡GPU资源池支撑训练,支持3分钟内完成千卡扩容,在系统承载力、安全与服务能力上实现提升。

此外,火山引擎还宣布推出扣子专业版,提供企业级AI应用开发平台;发布了数据洞察AI助手ChatBI、智能创作云2.0、AI 助手 Sales Copilot联合多家行业伙伴成立智能终端大模型联盟、汽车大模型生态联盟

在会后,智东西等少数媒体与火山引擎总裁谭待进行了面对面对话。

团队在豆包大模型的定价方面有什么样的想法和思考?

谭待说,不同尺寸、性能的模型价格不一样,字节这次是能力最强的主力模型的定价都比行业价格低99%,这是非常惊人的。

背后的原因有两点一是团队能做到,团队在技术上有非常多优化手段,包括通过模型结构的优化调整,把成本做低、效果做好,通过分布式推理、混合调度大幅度降低部署成本等;二是团队需要怎么做,今年大模型的应用变得更加重要,同时大模型创新的风险依然很高,因此大家需要把试错成本降得非常低,才能够让大模型广泛地应用起来。

豆包大模型在价格降低的同时性能怎么样?

根据谭待在现场的解答,豆包主力模型是要跟市面上所有的主力模型去对比,虽然模型参数基准测试表现在会上没有特别披露,但在它开放后大家马上就会看到很多第三方测试结果出来,团队自信接受用户使用之后的测评。第二是普通用户去用豆包App后会有自己的感受,它的巨大的使用量也是模型能力很好的证明。

字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待▲火山引擎大模型服务全矩阵图(智东西现场拍摄)

谭待透露,豆包大模型目前日均处理1200亿Tokens文本,生成3000万张图片。而豆包App下载总量截至目前已达1亿,双端月活跃用户达2600万

一、推出全栈AI服务,豆包大模型开启对外服务

谭待说,大模型的发展与每个人、每家企业都息息相关,而当下企业落地大模型面临着模型效果、推理成本和落地难度关键挑战

为此,火山引擎宣布推出全栈AI服务,提供更低成本、更易落地的更好模型,助力企业AI转型。

同时,豆包大模型正式开启对外服务。谭待透露,经过一年时间的迭代和市场验证,豆包大模型目前日均处理1200亿Tokens文本,生成3000万张图片。

豆包通用模型Pro具备理解、生成、逻辑、记忆等强综合能力, 支持128k长文本精调,且支持问答、总结、分类、创作等丰富的场景。

字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待

豆包通用模型Lite是更具性价比的通用模型,千Tokens成本降低84%,延迟降低50%,它支持闲聊、天气及实时信息查询、音乐视频播放、导航等场景,效果领先传统语音处理50%以上。

豆包角色扮演模型支持角色高度定制,能够基于上下文感知自适应用户扮演或陪伴需求,且具有强剧情推动能力,能够持续引导聊天。

在豆包语音系列模型,豆包语音识别模型具有高准确率和个性化特征,支持多语种识别;豆包合成模型具有自然、多情绪和多演绎特征;豆包声音复刻模型支持5秒复刻,跨语种迁移,与原声具有高相似度。

字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待

此外,豆包大模型还包括文生图模型、Function Call模型、向量化模型等其他细分领域模型。

会上,字节跳动产品和战略副总裁朱骏结合豆包的案例解读字节在大模型产品设计上的思考。

朱骏谈道,豆包的设计有几条基本原则,第一是足够拟人化,比如“豆包”这一名字就体现了拟人化特征。

第二是离用户近。豆包的功能定位包括随身携带的“语音百事通”、桌面端文案创作小助手等,主要嵌入用户现有的使用环境,以拉进与用户的距离。

第三是遵循个性化。在智能体的世界,每个人都有个性化的需求和情感,因此在豆包上每个普通用户都可以“捏”一个专属自己的智能体。豆包还支持打造更高阶的智能体定义能力,比如打造个性化的辅导老师等。

截至目前,豆包App下载总量已达1亿,双端月活跃用户达2600万,智能体总创建数达800万

二、火山方舟2.0平台发布,万卡GPU资源池支撑,三大插件升级

今日,火山引擎还宣布推出火山方舟2.0平台,发布联网插件、内容插件、知识库插件三个重要插件。

字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待

其中,联网插件支持实时联网信源,提供抖音、今日头条同款搜索能力,并支持多模态交互及意图识别检索。

内容插件支持海量内容调取,独家上架抖音内容插件,提供抖音丰富视频和图文内容,丰富大模型和用户的交互过程,并支持内容策略定制。

平台知识库插件支持企业调用内部知识库,内置了字节自主研发的搜索引擎,支持毫秒级、百亿规模检索,且搜索更新快、搜索相关性高。

除了插件升级,火山方舟2.0平台在系统承载力、安全与服务能力上实现提升。

谭待称,平台可提供万卡GPU资源池支撑训练,3分钟内完成千卡扩容,运维体验和安全合规增强,助力AI场景落地的最后一公里。

字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待

三、扣子专业版发布,推出AI助手ChatBI,智能创作云2.0升级

今日,火山引擎推出扣子专业版,提供企业级AI应用开发平台。

字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待

据悉,扣子是字节推出的新一代AI应用开发平台,具有低门槛、个性化、实时性和多模态等特征,具备海量的AI资源、丰富的发布渠道,并支持一键自定义API服务。

字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待

目前,扣子专业版已集成在火山引擎的大模型服务平台“火山方舟”上。招商银行、海底捞火锅、超级猩猩、猎聘等企业,已在扣子上搭建了智能体。复旦大学、浙江大学等名校也为课程和实验搭建AI“助教”。

今日,火山引擎智能数据洞察DataWind正式发布AI助手ChatBI,用户可通过自然语言交互生成指标,用于图表制作、数据查询,还可进行深度数据分析,且ChatBI支持IM交互,可多端应用,随时随地自助分析,有望大幅降低数据消费门槛。

面向营销场景,火山引擎进行了智能创作云2.0的升级,成为从内容创作、矩阵分发、广告投放到数据洞察一站式的企业内容营销增长方案;不仅提供多模态的理解与生成能力,助力视频创作效率提升25倍,更上线抖音话题、POI、小程序等营销工具,使门店页面曝光提升600%。

面向销售场景,火山引擎发布了销售AI 助手 Sales Copilot,能够高效跟进客户需求,随时辅助销售解答复杂的产品问题。此外,它还能通过角色扮演的方式模拟不同风格的对客演练,并提供优秀话术学习,提升销售沟通质量。

此外,火山引擎今日与OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟;与吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20余家厂商,宣布成立汽车大模型生态联盟

结语:大模型产业新的价格战打响

当下,全球大模型产的的价格战已经打响。那厢,国外OpenAI最新推出的旗舰模型GPT-4o刚刚宣布API定价降低一半;这厢,国内的字节跳动豆包大模型将价格打爆,主力模型相比行业价格降低99%。

随着豆包大模型家族首亮相,我们看到字节做大模型具有强应用导向的特征。在应用需求的导向下,字节跳动及火山引擎关注模型效果、成本和易用等多个维度的平衡。本次豆包大模型的一大特征是远低于行业市场的定价,模型的实际使用性能和体验如何,我们持续关注用户和开发者体验后的进一步反馈。