智东西(公众号:zhidxcom)
文 | 韦世玮
智东西8月25日消息,今天,百度在百度大脑语言与知识技术峰会上发布语义理解技术与平台文心(ERNIE)、智能文档分析平台TextMind、AI同传会议解决方案3项新产品,以及智能创作平台和智能对话定制与服务平台UNIT的多项升级。
其中,文心基于深度学习平台飞桨打造,能够为用户提供一站式能力,将为开发者减少90%数据标注量、90%算力投入、85%模型开发时长,进一步降低NLP定制开发的成本。
据了解,这些新产品发布与升级覆盖语言理语言生成、对话、机器翻译4大NLP(自然语言理解)领域重点研究方向。
除此之外,百度CTO王海峰也来到现场,为大家分享百度大脑发展历程的同时,也从知识图谱、语言理解与生成技术等方面介绍了百度完整的语言与知识技术布局。
值得一提的是,百度还联合中国计算机学会、中国中文信息学会,共同发起中文自然语言处理数据共建计划——千言,同时百度技术委员会主席吴华还发布了百度语言与知识技术算力共享计划。
一、三大新品发布与两大产品升级,丰富落地应用
峰会上,百度集团副总裁吴甜以理解、生成、对话、翻译四大方向,分别介绍了三款百度语言与知识技术的新产品,以及两项新升级。
1、文心(ERNIE):语义理解技术与平台
2019年,百度发布了具备持续学习和知识增强的语义理解框架ERNIE,语言理解能力得到了大幅提升。而今年,百度在ERNIE核心技术基础上延展开发了语义理解技术与平台,并取名为“文心”,意义取自《文心雕龙》。
据介绍,文心基于深度学习平台飞桨打造,集成了预训练模型、全面的NLP算法集、端到端开发套件和平台。文心将减少开发者90%数据标注量、90%算力投入、85%模型开发时长,为开发者提供一站式NLP开发与服务,从而降低NLP定制开发的成本。
目前,文心已经广泛用于百度产品中,包括搜索引擎、推荐系统、智能音箱、智能客服等。同时,文心已累计支持超过20000名开发者,应用场景覆盖金融、通信、教育、电商等各行各业,显著提升企业应用效果和效率。
2、TextMind:智能文档分析平台
TextMind是百度面向企业文本智能化需求,推出的智能文档分析平台,主要面向文档解析、文书审核等场景。
TextMind的底层基于OCR和NLP技术,以文档解析为核心能力,支持文档对比、文档审核等功能。同时,TextMind还结合了知识图谱的能力,能帮助企业在合同审核时能发现更多的隐含法律风险。
吴甜介绍,TextMind核心优势为“多、快、好、省”。
其中,“多”指支持多种格式,TextMind目前可解析6种格式、20类文档;“快”指显著提高企业文档处理效率,比如,可将企业报销时间从3-5个工作日缩短至1分钟;“好”指效果好,基于TextMind预置的文档解析能力,企业开箱即用,实现零门槛定制;“省”指文档规范化解析可帮助企业降低人力成本80%以上。
3、AI同传会议解决方案
百度自2017年推出同传系统以来,其AI同传已逐步构建起较为丰富的产品形态,包括桌面助手、翻译、同传功能等。这次百度则面向会议场景,发布AI同传会议解决方案,覆盖会议全场景、全流程。
现场,吴甜还为大家展示了如何只用一台电脑和一部手机,就能快速搭建一套同传服务,只需点点鼠标、打几个字,就能快速获得专业的同传服务。
值得一提的是,用户在会议前可以根据会议设计的特定领域进行属于定制,来应对各类专业议题中独有的词义,让翻译更准确。同时,用户在会议中也可以随时进行术语干预,并实时生效,会议结束后还能自动生成会议记录并保存到网盘中。
4、百度大脑智能创作平台
2019年初,百度上线了智能创作平台,尤其在媒体行业进行了重点深入,通过辅助创作和自动创作等多项能力,辅助用户进行内容创作、图文转换视频等工作。
此次,百度大脑智能创作平台针对媒体的应用场景,更新了智能策划、智能采编、智能审校3大媒体场景方案,帮助媒体人更快、更好地进行创作。
例如,在智能策划方面,百度大脑创作平台上汇聚了全网数据资源,利用知识图谱与自然语言处理的技术对数据深度的理解和分析,围绕媒体行业推出系列智能策划场景方案,高时效性的汇聚全网主流媒体线索,关联分析得到行业地域的热点信息。
自平台推出以来,它已自动创作文章超过200万篇,图文转视频能力已有7000多用户,已生产短视频15万个,相当于一个人至少100年的工作量,并已落地人民日报、央视网等20多家媒体机构。
5、UNIT:智能对话定制与服务平台
为了让开发者更加高效的获得高质量的对话理解能力,此次百度升级了UNIT的3大特性,包括任务式对话理解、表格问答和新对话引擎,将数据标注成本进一步降低到30%以上,并融合通用对话能力提升交互体验。
一是小样本意图理解能力升级。每个意图将提供大约10个标注样本就能达到高准确率的意图识别,显著降低数据标注的成本。
同时,UNIT基于最新升级的依存句法分析技术和通用关键词识别技术,为开发者带来了词槽修饰关系的识别能力。
二是表格问答能力升级。百度通过对表格的分析和自动化构建,基于表格内在知识能力,能够自动理解用户提出的问题,并分析出相应答案。此外表格问答还具备较好的口语化交互效果,支持在对话场景中使用。
例如,开发者只需上传业务数据表格,经过UNIT一分钟自动分析后,产出的问答机器人就可以准确回答大部分基于这些表格的事实性问题;加之1小时左右的人工辅助调优,问答机器人达到的水平相当于以往通过至少2周的人工整理FAQ建设的问答系统的水平。
三是新一代融合任务式对话和通用对话引擎。该引擎通过通用对话的主动式人性化交互,进一步提升用户体验,同时动态分析当前对话进程,以适当推荐引导的方式尝试触发任务,满足用户的具体需求。
二、百度语言与知识技术的十年布局发展
在王海峰看来,要让自然语言表达灵活,其普遍语言结构分析和语义理解难度很大。因此,以语言和知识为研究对象,研究如何让机器像人一样掌握知识,理解语言的NLP技术对AI技术的发展至关重要。
在现场,王海峰向大家分享了百度的语言和知识技术在过去十年是如何布局发展的。
▲百度CTO王海峰
“我们始终把握技术发展和产业发展两个趋势。”王海峰谈到,从研究方法上看,百度初期以规则和统计机器学习技术为主,探索深度学习、神经网络语义匹配框架、多语言神经网络及翻译等技术,近两年还扩展到知识增强的深度学习。
从研究对象上看,词、短语、句子以及篇章都是百度的研究对象。
随着AI技术的发展,应用场景变的愈发复杂,百度的研究对象也从语言扩展到语音、视觉等多模态信息,探索跨模态语义理解技术,例如语音一体化、图像语言一体化等。
从研究方向上看,从语言分析、语言生成、知识图谱及翻译拓展到深度与理解,完整的技术体系也促进了各项技术的融合发展。
在百度语言和知识技术发展的过程中,其技术已应用到搜索、翻译、地图、信息流和智能硬件等产品,并广泛应用于金融、医疗、教育和能源等各行各业,在为社会提供全方位智能服务的同时,加速产业智能化升级。
历经11年的发展,如今百度已形成了完整的NLP技术布局,包括知识图谱、语言理解与生成技术,以及应用系统等。
王海峰对百度NLP技术布局的部分关键技术进行了解读,并分享了部分最新进展。
1、知识图谱技术
作为机器认知世界的重要基础,知识图谱主要以结构化的形式描述真实世界中的实体属性、关系等。
基于搜索引擎,从多元异构的大规模数据中能构建非常庞大的知识图谱。基于此,百度提出了一整套构建方案,包括无标签大数据、开放知识挖掘技术知识体系、自学习技术,以及融合多源异构数据的知识补全和整合技术等。
据王海峰介绍,如今百度打造了一个多元异构知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新,已应用于各行各业,每日调用次数超过400亿次。
2、语言理解技术
在知识的加持下,百度的语言理解相关技术也不断增强。
百度提出知识增强的语义理解框架文心(ERNIE),即在深度学习的基础上融入知识,具备人类一样的学习能力,曾一举登顶全球权威数据集GLUE榜单,首次突破90分大关,刷新榜单历史,并且超越人类得分。
同时,百度还研制了知识增强的跨模态深度语义理解方法,通过知识关联跨模态信息,运用语言描述不同模态信息的语义,进而让机器实现从“看清”到“看懂”、从“听清”到“听懂”,即图像和语言、语音和语言的一体化理解。
在NLP技术领域,还有一个重要的任务是语言生成,主要研究如何让机器使用自然语言进行表达和写作。
百度提出了基于多流机制的语言生成预训练技术,在语言生成过程中兼顾词、短语等不同粒度的语义信息,显著提升生成和应用效果。
基于语言生成技术,百度还结合了其他语言和知识技术,并应用到百度智能创作平台,在各个环节全方位帮助用户进行智能创作。
随着百度大脑语言与知识技术的广泛落地应用,百度已经收获了许多行业成果。据王海峰介绍,百度大脑语言与知识技术已获得包括国家科技进步奖在内的20多个奖项,30多项国际竞赛冠军,发表学术论文超过300篇,申请专利2000多项。
未来,随着NLP技术的不断突破创新,百度也将在产品上继续保持探索,进一步赋能智能搜索、智能推荐、智慧城市、智慧医疗等各行各业。
三、发布两大计划,助力语言与知识技术发展
为了突破语言与知识技术在研发过程中面临的数据匮乏、算力不足的瓶颈,百度联合中国计算机学会、中国中文信息学会共同发布全球最大中文自然语言处理“千言”数据共建计划。
百度千言目标覆盖更丰富的任务类型,从语义理解、知识融合、跨模态融合等角度推动技术进步,同时提供能进行多维度综合评价的数据集。
据百度技术委员会主席吴华介绍,千言一期项目由来自国内11家高校和企业的数据资源研发者共同建设,已涵盖开放域对话、阅读理解等7大任务,20余个中文开源数据集。
未来三年,百度计划面向超20个任务,收集和建设不少于100个中文自然语言处理数据集,覆盖知识图谱、语言理解、语言生成、跨模态融合、NLP 应用系统等多个领域。
吴华谈到,算力是语言与知识技术发展中面临的另一大挑战,超大规模深度学习模型带来显著效果提升的同时,算力的需求也呈现出指数级的增长。
因此,吴华正式发布了语言与知识算力共享计划,通过百度AI STUDIO平台,百度将提供价值一亿元的免费算力支持,帮助广大开发者更好地专注技术创新。
结语:百度NLP技术版图的十年布局
如王海峰所说,语言与知识技术是人工智能认知能力的核心。回顾这场峰会,我们也能看到过去十年百度在语言与知识领域的技术发展和产业布局,如今已逐步构建起一套成熟和丰富的NLP技术版图。
下一个十年,百度的NLP技术布局还会给我们带来哪些惊喜?它能否推动行业离通用人工智能(AGI)的目标更近一步?我们拭目以待。