智东西(公众号:zhidxcom)
文| 赵佳蕊

导语:成立四年的达观数据推出自主研发集OCR与NLP于一体的达观智能RPA,将RPA的应用场景覆盖面提升到了80%以上。

智东西7月28日报道,人工智能企业达观数据于近日正式推出其自主研发集OCR(光学字符识别)与NLP(自然语言处理)于一体的达观智能RPA,它通过运用OCR技术对文档内容进行提取,再用NLP技术对文本内容进行自主的纠错、审核以及排版等操作,从而让计算机像人一样完成重复、繁琐的文档流程工作。

RPA即Robotic Process Automation(软件流程自动化),是指用软件自动化方式实现在各个行业中本来是人工操作计算机完成的业务。比如: 在企业的业务流程中,通常有纸质文件录入、证件票据验证等操作,软件机器人能够代替人类准确快速完成这些工作,减少人工错误、提高效率、降低企业运营成本。

据称,达观数据RPA目前在我国自然语言处理和机器人流程自动化上已经走在行业前列,此次推出的产品是国内首款自主研发的OCR与NLP于一体的智能RPA。达观数据CEO陈运文表示,目前达观智能RPA解决了流程自动化“最后一公里问题”,通过自然语言逻辑分类、自然语言数据提取、识别和深度学习模式预测,将RPA的应用场景覆盖面提升到了80%以上。

仅仅成立三年多的达观数据为何能在RPA领域有了这样的成就,不禁令人好奇。为了弄清楚达观数据成立以来到底发生了什么,我们将以此次发布会的内容和对达观数据的了解,对达观数据做出深度的剖析,介绍达观智能RPA,了解其成立以来的重大节点以及展望达观数据的未来发展。

一、达观智能RPA可实现操作流程自动化

RPA技术目前已经在世界范围内得到了广泛的关注,例如今年6月国际AI领域估值最高的企业之一UiPath与特朗普团队签订协议,用其RPA技术去帮助政府更加高效的完成工作,UiPath还表示要在5年内培养75万RPA人才。

目前有许多国外的RPA厂商正在进入中国市场,例如UiPath、BluePrism、Automation Anywhere、Nice和Verint等一些国际上的RPA企业。中国国内从事RPA的企业还不算太多,主要有艺赛旗RPA、阿里RPA、云扩科技以及其他有RPA功能的品牌产品。

达观数据目前也加入了智能RPA的的行列,在今年年初开始研发达智能RPA,并于近日正式举办发布会,推出达观智能RPA。

在此次发布会上,达观数据副总裁金克具体介绍了达观智能RPA。他表示,RPA的发展会经历三个阶段,第一个阶段是结构性重复性的RPA,也就是传统的RPA。这个阶段的特点是RPA只能完成简单、重复性高的任务,例如在对发票数据进行处理的时候,传统的RPA只能依靠人工将发票中的数据输入电脑中,再由RPA对这些数据进行处理。

金克还表示,相比于第一阶段的RPA,目前的达观智能RPA,只需要人工提供发票的扫描版或电子版,便可以用机器将发票中的信息提取出来,并对这些信息进行自动化处理。这是RPA的第二个阶段,是在第一阶段的RPA上加上了自然语言处理、光学字符识别和深度学习这些技术,此次发布会上推出的达观智能RPA目前就是处于第二阶段。

金克还对未来智能RPA进行了展望,达观数据希望第三阶段的RPA就可以实现通用机器学习和认知智能学习,也就是应对不同的场景,智能RPA可以自我学习,自动生成符合要求的操作流程后去处理所需文档。

对RPA的发展历程有了大概的认识之后,金克详细介绍一下此次发布会上推出的达观智能RPA。

达观智能RPA主要包括四个部分,分别是开发平台、控制中心、机器人和人工智能组件。它的运作流程是,首先在开发平台生成客户所需的操作流程,这个操作流程生成好之后就会被交给机器人,机器人负责准确的执行这个流程。在机器人执行任务的时候,控制中心的主要角色是机器人“管家”,它的主要任务是调度和管理,也就是监控机器人,合理安排不同类型的机器人各司其职并保证机器人在准确地执行这些操作流程。

成立四年首推智能文档处理产品,AI创企达观数据如何与阿里竞争?

达观数据还向我们介绍了达观智能RPA的具体应用,例如,上市公司需要按照证监会的要求按时披露公司的业绩,财务人员就需要查阅整合大量的财务报表中的数据,按照要求及相关逻辑填入报告中,并进行数据校验,在这个过程中公司需要消耗大量的人力。但通过使用达观数据的RPA就可以为上市企业大大减轻这些负担,它可自动代填各类表格、报告,还可以自动报送各类材料。中国信息通信研究院副总工程师王爱华表示,通过使用达观智能RPA他们的文档处理的时间从原来的25天缩短至7天。

二、达观数据自主研发OCR和NLP技术

此次发布会中,达观数据重点介绍了其自主研发的OCR和NLP技术。

OCR技术通过融合CRNN、Attention OCR、 Faster-RCNN、Mask-RCNN等数十种算法,解决了图像识别与转换的难题,例如对通用文字、证照、财务报告、复杂表单、合同、图纸等各种类型文档的识别与处理,完成更大程度的自动化。

NLP技术采用CRF、HMM、HAN、Bi-LSTM、BERT等最新算法,为企业工作流程中的关键信息抽取、合同预审、合规检查等需要认知参与的复杂任务实现自动化、全流程、可调控的AI应用效果。

达观智能RPA在其自主研发的OCR和NLP技术的支持下,能够实现操作流程自动化。达观数据CEO陈运文表示,OCR如同人的眼睛,NLP如同人的大脑,RPA则是人的双手,手脑眼三者结合才能承担更复杂的流程化工作。

成立四年首推智能文档处理产品,AI创企达观数据如何与阿里竞争?

三、达观数据为我国语义识别领域融资最高企业,高达2亿元

达观智能RPA的这款产品能够按期落地,一个很重要的前提是他们有一个不错的资金支持和初创团队。下面我们来了解一下达观数据的融资历程、其创始人陈运文和它的初创团队。达观数据达观数据成立于2015年,并在创立的第一年便获得了1000万元的天使融资,此次融资由真格基金领投,众磷资本和掌门科技跟投。此后达观科技不断发展壮大,并于2017年获得了软银赛富和方广资本的5000万的A轮融资。

在2017年的B轮融资中,达观数据共融资1.6亿元,此轮融资由宽带旗下基金晨山资本领投,元禾重元、联想之星、钟鼎资本以及老东家跟投。B轮融资过后,达观数据的融资总额达到了2亿元,使得达观数据成为我国语义识别领域融资金额最高的企业。

达观公司创始人陈运文在一次采访过程中还表示,2019年达观数据将有下一轮融资,将用于核心技术和行业生态建设上面。

陈运文在创立达观数据之前已经有了很多的关于机器学习、自然语言处理等技术方面的经验,他曾就职于百度、盛大和腾讯,同时他还是科技部“万人计划”的专家。2015年,陈运文拉到“十人帮”和他一起成立了达观数据,这十人之中,绝大部分都是百度、腾讯、盛大等大公司出身的工程师。这个初创阵容奠定了达观数据在技术领域发展的基础。此后,达观数据不断发展壮大,仅仅成立四年,就在国内的RPA领域暂露头角。在一次媒体采访过程中,陈运文还表明,他想要达观数据成为中国文本智能处理领域的NO.1。

成立四年首推智能文档处理产品,AI创企达观数据如何与阿里竞争?

▲达观数据CEO陈运文

四、达观数据未来将重点发展达观智能RPA

达观数据成立四年的时间里,在行业领域和多家企业进行了合作,利用其NLP技术为企业提供各种各样的定制化服务。

最近一次签约是今年7月初,达观数据成功中标中国太平洋保险,它将依托达观数据文本智能处理平台,结合中国太平洋保险的业务场景打造人工智能应用平台。2019年4月,达观数据中标光大银行智能分析项目。通过利用自然语言处理、文本挖掘和情感分析等技术,达观数据可以为光大银行提供客户价值管理流程。2018年12月,达观数据与全球四大会计事务所之一德勤正式签约,赋能德勤文档自动化处理,提高德勤事务所文档处理的效率。

除了提供文档处理流程自动化的服务,达观数据还为多家公司提供了量身定制了个性化推荐引擎。例如,2019年4月底,混沌大学向达观数据抛出了橄榄枝,将利用达观数据的个性化推荐引擎为用户打造创新学习平台。2019年3月,达观数据和四川报业集团正式签约,为其旗下的新闻内容的传播提供个性化推荐和文本智能处理服务的功能。个性化推荐也是广告商投放广告的一种行之有效的方法,2018年10月,达观数据与广而告之公司签约,增强其个性化推荐能力。

达观数据工作人员向我介绍,达观数据以后仍将为企业提供个性化推荐引擎,但达观数据未来的重点将放在达观智能RPA的发展上,为企业提供更加方便快捷的智能RPA服务。

结语:期待达观数据扩展更多的RPA场景

陈运文在最后的发言中表示,未来超过50%的基础性的工作可以用机器人来代替,人类可以免去从事大量单一、重复、枯燥的工作而担任具有创造力的工作。

目前达观智能RPA主要为一些大公司提供服务,因为大公司的体量更大,会产生巨量的数据,达观智能RPA实现流程自动化后可以省去大量的人力。我们也期待未来达观数据可以提供更加智能的RPA服务,可以根据个人的需求自动生成流程帮助个人处理事务。未来达观数据还有很大的发展空间,这家成立四年的公司,能否为更多的领域提供更加优质的RPA服务,我们也将拭目以待。