智东西(公众号:zhidxcom)
作者 | 徐珊
编辑 | 云鹏
数字人正在走入生活!——紧跟而来的是,数字人和现实人类之间的界限开始模糊。
近期大热的ChatGPT聊天机器人已经向人们展示了,AI不但能根据人们的要求进行丰富的内容创造,而且还可以和人们产生长时间、多轮次、有逻辑的文字互动。
现阶段,ChatGPT聊天机器人多数以文字的形式与人们产生交互。设想一下,如果将其和正在蓬勃发展的数字人相结合,那么一个无限向人类思维靠近的数字人即将诞生。
到那时,人们可能很难判断,屏幕之后的究竟是数字人,还是素未谋面的网友,数字人和现实人类之间的界限将被模糊。
不少数字人厂商闻风而动,迅速冲到了新市场的牌桌面前。近日,涉及数字人业务的企业世优科技、风语筑、天娱数科均提到正在研发相关技术,试图将数字人接入ChatGPT。
这其中,吸引了大半科技圈关注的是,百度在短短一周时间内,连发四条官方推文,介绍其即将推出中国版“GPT大模型”文心一言。
而发布这条消息的责任编辑,正是百度的希加加、度晓晓等数字人“成员”。数字人和“ChatGPT”的联动,让不少网友期待不已。
▲百度官宣大模型“文心一言”
百度告诉智东西,文心一言的能力将通过百度智能云率先在内容和信息相关的行业和场景落地。
相关行业如媒体、文娱、企业软件等,相关场景如智能客服、员工培训、巡检日报、知识萃取等,都将率先使用文心一言的服务,信息的高效流转和交互,也会进一步带来行业生产、经营效率的提升。
据了解,目前已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的近300家头部企业宣布加入百度“文心一言”生态。
除了白天认真“打工”,休闲时间,百度的数字人们也没闲着。前不久,百度虚拟数字人希加加、林开开、叶悠悠还登上了首款虚拟综艺《元音大冒险》,与明星张雨琦、大张伟等共同唱歌、跳舞、做游戏,展现虚拟数字人丰富的交互形式。
▲《元音大冒险》(图源:百度官方微信平台)
丰富多样的外形、未来可期的“灵魂”,点燃数字人市场新一轮的热情。有意思的是,近期科技圈“元宇宙”和“ChatGPT”两大炙手可热的风口,都与数字人产生交集。
这也带来百亿级的AI数字人市场空间。IDC在《中国AI数字人市场现状与机会分析,2022》报告中预计,到2026年中国AI数字人市场规模将达到102.4亿元。
数字人背后有哪些核心技术升级?数字人是如何走入产业的?未来,数字人市场将会发生哪些变化?我们和百度数字人与机器人业务负责人李士岩进行了深入交流,站在产业前沿,展望AI数字人未来的天地。
一、撑起百亿市场,AI为数字人注入“灵魂”
过去,无论是担任电影主角的数字人还是能唱会跳的虚拟偶像,他们的诞生都需要依赖价格高昂的光学动捕设备。数字人制作成本高、制作时间长、拍摄技术门槛高,成为限制数字人走入生活的三道“枷锁”。
为了松绑这三道“枷锁”,一直以来产业玩家们共同做出了不少尝试,在这些技术中,快速发展的AI技术无疑是斩断数字人产业“枷锁”的过程中,最为锋利的武器之一。如今,AI技术已经深入到数字人的数字资产生成、内容生产以及人机交互等环节中。
像是在数字资产生成环节,AI可以提供上千种不同风格的人物造型,给予人们充分的选择空间。过去,建模师们可能需要几个月才能完成的超现实数字人形象,如今在一周时间内就能完成,甚至2D数字人生成时间可以缩短到30s以内。
AI不仅赋予了数字人多样的外观,还赋予了其有趣的“灵魂”,让其拥有更加多样的创造能力。
目前,数字人的内容创作主要涉及图文、视频、影视、音频四大方向。与过去人类在背后操刀打磨内容不同,现阶段的数字人已经“学会”了自己创造内容。
▲各种不同类型的虚拟数字人(图源:百度)
“用户可以输入一段描述文字,通过大模型等技术就可以生成一段虚拟数字人视频,制造时间和成本将大幅下降。”李士岩说道。
他还介绍到,目前通过大模型等技术支撑,数字人可以根据文本要求自动生成一段颇具个人风格的图文内容、动作视频,甚至“演戏”。
比如说,在直播电商场景中,当你告诉数字人带货产品的主要特点、价格以及产品优势,并且让他以爆笑喜剧风设计三种直播讲稿,数字人平台将会直接提供几种不同风格的稿件。
“现阶段的虚拟数字人的人格化和内容运营往往受限于前期的创意效率问题。如果能和一些大模型结合起来,那么就可以通过AIGC提升内容生产效率、拓展创意边界。”李士岩还补充道:“现阶段,大家体验对话式语言模型,多数停留在语音和文字阶段。未来,你可以像与你朋友打视频一样,和虚拟数字人进行长时间、多轮次、有逻辑的互动。”
好看的皮囊千篇一律,有趣的灵魂万里挑一。可以看到,AI技术不但为数字人提供好看的“皮囊”,更是为其打造了有趣的“灵魂”,而整个数字人产业升级的背后,也同样是无数AI技术升级叠加所产生的效果。
二、全链路AIGC“造人”,百度持续领跑数字人第一梯队
尚处于起步阶段的百亿级数字人市场,吸引了大量的玩家涌入其中。天眼查数据显示,2022年国内有近20万家与数字人相关的创企成立,而国内整个数字人行业的玩家也不超过60万家。我们可以看出,创业者们对数字人赛道抱有较大的热情,行业竞争力也日趋加剧。
当其他玩家竞争压力与日剧增时,百度从一众虚拟数字人企业中脱颖而出,不但成为了中国数字人产业综合实力第一位,而且还成为了行业唯一获得“杰出级”评测的数字人厂商。
国际调研机构IDC称:“如果综合厂商的产品基本功能、AI能力、市场及生态能力、商业化能力、用户体验以及未来发展愿景,可将AI数字人技术提供商市场格局简单的分为2-3个梯队,第一梯队以百度智能云、商汤、小冰公司为主。”
而百度智能云曦灵数字人平台在技术能力、工程化能力、安全保障能力三大维度测评,成为首批获得中国信通院云计算与大数据研究所等机构联合认证的数字人厂商。并在信通院的第二轮分级评测中,以高分获得行业唯一的“杰出级”证书,代表了当前中国数字人的最高水平。
在双重技术认证的背后,是百度日复一日用其云智一体的技术优势,将虚拟数字人打磨到极致的耐心。
比如说,为了让数字人制作环节更加简洁易上手,同时也为了降低制作成本,百度智能云曦灵数字人平台可以通过一张图片直接生成2D形式的数字人。
用户只需要提交上传一张照⽚,或输入一段视频后,就可以直接生成一个和自己相差无几的2D写实数字⼈。
同时,百度智能云曦灵-数字人直播平台,还支持1358个人像细节微调维度。想要丹凤眼还是桃花眼,选择柳叶眉还是一字眉,只要你足够耐心,就可以享受给虚拟数字人“捏脸”的快乐。
为了让虚拟数字人更具生动性,百度通过4D Learning技术,和Smart IK智能身体绑定调适系统三大技术,让虚拟数字人“活”起来。
“当虚拟数字人在静态时的逼真程度达到一定程度,而其动态行为以及面部变化较为生硬时,会让人产生认知冲突,从而造成‘恐怖谷’效应。这也是我们希望提高虚拟数字人生动性的原因之一。”李士岩说道。
百度采用4D扫描技术精准还原面部肌肉动作,并且通过深度学习自研AI语音驱动算法和4D Learning技术,让逐字口型合成准确率超过98.5%。
同时,百度借助Smart IK智能身体绑定调适系统,数字人的每根⼿指头、每个关节的肢体驱动与肌⾁抗压和真人相似,让数字人的生动性进一步提升。
“简单来说,我们采集了一段时间内虚拟数字人由A表情到B表情之间的每一帧过渡动作的数据,并基于这些采集数据进行了算法训练及优化,让数字人表情在生动性上和细腻程度上都有大幅度提升。”李士岩介绍道。
华美的外表并非是百度探索虚拟数字人技术的终点,虚拟数字人在行为心智上还需要向人类靠拢。
百度打造的虚拟数字人可接入智能对话平台UNIT,该平台可以为数字人快速定制对话能力,并且根据行业需求,诸如金融、政务、文博等,构建专属“知识库”。
基于生成式开放域对话大模型,百度虚拟数字人不仅支持接近真人水平的多轮流畅对话能力,而且还能让虚拟数字人拥有自己的对话风格,实现人设、风格定制对话内容。
好看的皮囊和有趣的灵魂之间的联动,则是通过百度打造的跨模态智能对话引擎。据了解,百度虚拟数字人从用户的多模态信息中识别用户的情绪和诉求,自动生成与用户自然互动的语言、表情和动作,如微笑、抱歉、愤怒等。
从百度探索虚拟数字人的过程中,我们可以看出打造一个虚拟数字人并不算太难,但是想要低成本、高效率地打造一个栩栩如生的虚拟数字人,则是一场各方面的综合较量。
百度方面表示,小小一个数字人,背后其实是强大的云和AI技术在支撑。
去年12月,百度智能云推出国内首个全栈自研的AI基础设施“百度AI大底座”,可通过AI底层技术的通用化、模块化,实现AI服务的规模化。该设施主要面向企业AI开发和应用提供端到端自主可控、自我进化的解决方案,能让企业可以快捷、低成本地实现“AI能力的随用随取”。
三、落地金融、文旅等场景,数字人走向产业深处
历经多年打磨,带着满意的产品,百度智能云开始拿着数字人平台曦灵的“锤子”,找寻能将AI数字人“钉”入产业深处的场景。
“祝大家新年快乐。”虚拟数字人刘三姐在抖音上唱完了一段山歌后,送上了自己的新春祝福。 刘三姐是百度智能云曦灵平台为广西文旅打造的数字人,也是百度虚拟数字人在文旅领域落地的典型案例之一。
在创造刘三姐的形象时,百度团队不但参考了历代刘三姐人物的扮演者形象,还结合广西当地女性的外貌特征,进行了多种不同风格的外形设计。同时,在服装上,百度还结合刘三姐的风格设计,打造了兼顾壮族民族特色和现代元素的服装。
如今,刘三姐作为广西文旅的数字符号之一,不但经常出现在各类大会现场,还常常通过小程序和游客们互动,介绍当地美食特色等信息。
▲刘三姐数字人(图源:百度)
“刘三姐作为一个民间传说人物的数字形象,可以很好地吸引全国游客的关注,其品牌效应能够得到更广阔的传播。”李士岩分析刘三姐案例时说道,刘三姐不但会在线上与游客们互动,线下也会通过数字导览等场景,与游客们“网友见面”。“从线上的品牌效应到线下的效果营销,数字人在文旅场景中,可以形成一个完整的闭环传播效果。”
除了文旅行业,虚拟数字人也逐渐深入金融领域,并且已经为企业带来降本增效的成果。
目前,百度已经为浦发等众多银行打造多种类型的“数字员工”,构建大规模的数字员工,提供包含产品解读、市场资讯、财富诊断、产品推荐等多样化服务。
据介绍,目前小浦可以对近万款基金产品、多款财富产品的盈利、风险特点,进行详细剖析和解读,还可以根据客户持仓情况和风险承受程度,给予资产配置的调整建议,并根据客户不同的财务目标和管理需求,个性化推荐理财及基金产品。数字人本身自带的渠道流量优势,也大幅提升了服务的效率。
数字人不再是留存于屏幕表面的“IP形象”,而是为行业带来真正价值、能干的数字员工。随着行业对数字人的认知普及,兼顾“皮囊”和“灵魂”的数字人将在越来越多的行业领域绽放光彩。
结语:AI数字人正成为数字人主力军
生动的AI数字人,不但可以成为人们在元宇宙世界的“化身”,而且也能成为企业的“好助手”,带来实质的降本增效的成果。
另一方面,如何打造一个深受用户喜爱的AI数字人,成为所有数字人玩家共同的考题。而在这道题上,百度已经交出自己的高分答卷。并且,在下个月百度还将推出自己的文心一言大模型,其与数字人的结合,也拥有相当大的潜力空间。
当数字人走入产业深处将会碰撞出什么样的火花?我们也将持续关注数字人在产业深处应用的最新动向。