智东西(公众号:zhidxcom)
作者 | GenAICon 2024
2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AIGC应用专场上,极睿科技创始人兼CEO武彬以《AIGC全链路电商内容生成的前景与挑战》为题发表演讲。
成立于2017年的极睿科技是一家“清华系”创企,算法团队源自清华大学计算机系NLP实验室,基于AIGC打造电商内容生成引擎。武彬分享说,极睿科技打造了业界唯一的一站式全角色x全链路x全类型电商内容生成方案,把电商内容全部通过AI的方式来做。
在武彬看来,当下电商行业图文和短视频的内容数量与需求都在大幅上升,内容关联着平台、卖家与买家的核心交易诉求,但内容制作效率严重不足。而极睿科技的AIGC工具和方法论在电商场景已经得到很好的验证,帮助商家将成本缩减为原来的1/5。该公司曾用1条视频帮助一家杭州女装品牌一个月多卖出两三千万元。
极睿科技已推出ECGPT+FashionCLIP基座模型及多种电商垂直大模型,可支持商品AI拍摄、AI排版上新、AI直播切片、AI生成商品短视频、AI带货、一站式AI技术与数据服务平台、智能商品操作系统等多种功能,目前已合作超4万电商客户。
以下为武彬的演讲实录:
我们是一家基于AIGC能力做电商内容的公司。为什么选择这个赛道?电商内容满足两个条件:
第一,需求量非常大,大家可能日常都会在淘宝、京东、抖音、快手购物,每天都会产生大量的内容。
第二,电商内容的价值可量化,会极大影响GMV(商品交易总额),电商内容做得好或者不好,对GMV有很大的影响,我们希望能够通过AI的方式在这个领域降本增效,开源节流。
我们团队主要是清华背景的算法团队,我是清华本硕,出身于自然语言处理(NLP)实验室,是一个专门做大模型和自然语言的实验室。毕业后,我创业成立了这家公司,到目前为止拿了四轮融资,包括金沙江、红杉、魔量、顺为等。
我们现在在专注做“AI+电商”行业里算是比较头部的公司,目前服务全网大概两千家品牌和四万多家店铺,大家打开淘宝、抖音,上面很多耳熟能详的品牌,像安踏、伊芙丽、马克华菲,也包括电器、食品品类,图片视频基本是我们帮他们做的。
这样既省掉了原来的电商内容制作成本,也可以帮他们多卖钱。有的品牌通过我们制作的图片、视频,可能一个月多卖两三千万。AI既是一个省钱利器,也是一个挣钱工具。
我们也对接了国内非常多的电商平台,核心做了3个事情:电商内容的制作、管理、分发。我们可以自动化把电商内容做好、管好,分发到电商平台上,通过这些内容做进一步的成交。
这是我们整体产品的矩阵和链路,当商家把内容上传上来之后,通过多个自动化工具,包括PhotoMagic自动做图片,EC Pro自动做排版布局和加工,自动化做成主图、详情页海报,以及iCLIP视频工具,可以自动化做好视频。
我们把文本、图像、视频从拍摄、排版到短视频一站式做好。基本上商家所需要的电商内容,都可以通过AI的方式来做。
一、电商对内容的诉求攀升,内容决定商品卖得好不好
我们发现的行业趋势是整个电商对内容的诉求一直在上升。
一方面,电商变得越来越碎片化。之前淘宝一家独大,大家只要把淘宝图片做好就行,随着抖音、快手、微盟、拼多多、得物、小红书诞生,商家需要做各种平台适合的内容。
另一方面,之前大家只需要做图,现在也需要做视频、直播,做更多的内容,商家的人力成本上升了,同时平台数量也上升了。而每个平台对于内容的喜好不一样,比如这个平台主打降价促销,这个平台主打新品,这个平台主打次日达,要做出适合各个平台不同的内容。
我们能帮助商家用AI来自动做多个版本的内容,覆盖这些平台和消费者。
对于平台、商家和消费者来说,内容是非常重要的枢纽。平台希望通过内容把消费者留下,拉更多停留的时长,促更多的GMV;商家希望通过内容把自己的商品卖出去;消费者希望通过内容了解商品。很多消费者在线下购物,对于商品的感知可能是触摸一下、试穿一下,但在线上所有的理解都基于内容。
我们有一个观点,就是商品卖得好不好,极大程度上取决于内容,只有退不退取决于商品。因为商品到消费者手里之前,所有的理解都是基于内容,包括主播的讲解、图片和视频,内容会极大程度上影响成交。
目前我们通过一系列SaaS工具帮助商家做好内容,在上层通过工具来引导和实现更多的成交。
二、电商要求百分之百的可控性,AI工具能带来上万倍ROI投入产出比
我们定义一个产品诞生之后,基本会经历这些流程:
第一,拍摄。帮商家合成图片,包括模特图、场景图、外拍图。
第二,排版布局。把商品图变成精美的页面,大家日常去看主图详情页,可能看到这些海报的复杂程度非常高。
第三,短视频。短视频的制作方式前面有人提到Sora、Pika、Runway,但在电商里面这些工具很难直接来使用,因为电商要求百分之百的可控性。
如果通过Prompt指令做了这个衣服,有任何细节变化跟商品不一致,在电商里面都叫货不对版、虚假宣传,电商要求百分之百可控以及可控基础上的多样。目前来说不管图生视频还是文生视频,都很难解决这个问题。我们做的方式更多是基于图片或基于视频,做自动化剪辑、混剪或美化包装,跟Sora、Pika和Runway有些区别。
再到后面的运营、种草,我们也会通过AI做更多的内容。
我们的工具和方法论在电商里面得到很好的验证,比如成本能达到商家原来成本的1/4到1/5。之前商家需要雇很多人,像编辑、美工、运营、文案、剪辑师,一年的成本大概要二三十万,但我们基本上能做到原来成本的20%左右,可能只要三四万,比雇一个人的成本要低很多就能解决这个问题。
其次,因为我们积累了大量的数据,我们知道这个平台或者这个时代用什么样的背景音乐、特效字幕、水印、LOGO做视频更好,也知道不同的商品如何做包装更好,我们做出来的图片、视频点击率可能比单人做得更好。
通过之前的验证,我们做的单条视频帮助杭州一个女装品牌,用1条视频1个月卖了100多万,整体1个月多卖了两三千万。它只要付给我们一年几万的费用,对于它们来说一年有几个亿的产出,这个ROI投入产出比可能达到上万倍。
三、打造首个电商垂直大模型,提供图文、排版、直播多个工具
这是我们的底层模型,一部分是我们自研的基座模型,一部分是通用模型改的垂直电商大模型。
前面讲过由于电商的百分之百可控性要求,以及在可控基础上的多样性要求。在基座模型层面,我们通过NLP或者计算机视觉识别的能力,理解识别这是一个什么样的图片,以及图片当中是什么样的商品,或者这是一个什么样的视频,视频中是模特走秀、穿搭还是街拍,这个模特在闲聊还是讲什么样的卖点。在基座模型的基础之上,我们通过大模型做可控的生成,比如识别到是碎花V领连衣裙,应该通过什么方式来展现。
这是我们的几个产品基座。
图文板块PhotoMagic,可以通过假模特自动生成模特图,把衣服穿到一个真人身上。商家不需要请一个模特,不需要场景街拍,就可以实现一个模特在巴黎香榭丽舍大街或者塞纳河畔的样子,极大地降低了拍摄成本。
这是我们的排版布局产品ECPro,大家打开日常淘宝的主图详情页海报图,它可以通过识别图片生成相应的标题、文案,生成排版、作出裁剪,做出精美的页面。
这是直播切片工具iCut,我们会通过识别能力,识别到在一个七到八小时的直播当中,这个主播在哪一段核心卖点讲得比较高,比如讲了商品细节,讲了面料,讲了垂感、亲肤的材质,在这个地方讲了食品的安全性等。
识别到这个卖点更精准或者卖点密度更高的片段之后,我们把卖点摘取出来,放在混剪里,带货效果更好。如果这个商家不做直播的话,我们也会通过图片的方式帮它合成视频。
四、立项AI MCN机构,拓展海外业务和更多品类
我们看到做出来的视频或者图片带货效果更好,因此在去年开始立项自己做了AI的MCN机构,它其实更像是一个Agent服务。
我们之前的所有工具服务更像Copilot,商家使用我们的工具,一起来创作内容,我们通过内容的方式跟商家收SaaS订阅服务。MCN业务更像Agent服务,商家直接用我们的MCN,通过我们做出来的内容直接做带货成交,我们从额外的成交当中赚CPS(按销售成功订单付费)。
比如我们帮助商家一个月多卖了一千万,我们拿10%,100万左右的佣金。通过这样的方式也能证明我们的内容有价值,收集更多的数据,让我们知道什么样的内容有更好的变现方式,有更好的商品展示能力。
最后总结一下我们的优势。我们相当于有自己的行业Know-how,知道电商品类需要什么内容,我们非常专注在电商内容,但是有几个拓展方向。
第一是拓展海外。之前我们主要做国内商家,今年做了跨境服务,把国内的视频自动化翻译到海外。比如人脸翻译,将中国模特翻译到海外变成欧美、日韩或者其他模特;字幕、音频翻译,字幕变成英文,音频变成英文。
其次,拓更多的品类、区域和更多的变现方式,比如从传统的工具再到MCN业务,提供全链路、全流程、全类型的服务。
我们还有一个优势是能帮商家算清楚账。所有客户的价值排序都是开源节流、管理发展,首先是你能不能帮我多赚钱、省钱,再下面才是管理和发展的需求。我们可以算出来商家一个月通过我们的服务能多赚多少钱,视频帮他们多卖多少钱,以及省掉多少人工成本。这也是我们选择电商的理由,需求很大,并且内容的价值可量化。
我们在全国各地都有分布,尤其在电商聚集带,像杭州、上海、广州、深圳、厦门,今年可能会扩展一些海外业务。我也从去年开始做创始人IP,定期分享一些AI和电商的干货,大家如果对我们的业务感兴趣,或者对电商和AI感兴趣,都可以来关注我们。
以上是武彬演讲内容的完整整理。