智东西(公众号:zhidxcom)
文 | 心缘

随着AI技术的成熟,AI已经开始作为一种基础工具,加速安防、零售、医疗、金融等传统行业的智能化进程。具备先发优势的谷歌、微软、BAT等大公司都在积极布局平台,而AI创企们则纷纷在细分行业领域深耕,赋能B端、服务C端等T2B2C的商业模式成为主流,创新奇智正是其中一员。

创新奇智是李开复创办的创新工场旗下面向企业服务的AI+B2B公司,脱胎于创新工场人工智能研究院。其业务聚焦零售、制造、金融三大行业。今年成立的创新奇智,已经获得过亿元天使轮融资,客户包括永辉、原麦山丘、鸿海科技、徐工信息、储蓄银行、民生银行等多家。

最近,智东西与少数媒体来到创新奇智,和创新奇智的CTO、联合创始人、创新工场AI工程院首席架构师张发恩聊了聊创新奇智的AI技术的特色、布局和商业落地情况。

一、技术行业人才两手抓

张发恩毕业于中国科学院软件研究所,先后加入微软、谷歌负责研发工作,并曾任百度主任研发架构师、百度云计算事业部技术委员会主席、百度云计算事业部大数据和人工智能首席架构师。

▲创新奇智的CTO、联合创始人、创新工场AI工程院首席架构师张发恩

今年3月,创新工场正式宣布成立子公司创新奇智,随后,在5月份,张发恩加入创新奇智担任CTO一职。创新奇智在5月已完成天使轮融资,由成为资本领投,创新工场等跟投,融资过亿元。

创新奇智基于计算机视觉识别技术、自然语言处理、机器学习,为制造业、零售业和金融业三类提供AI技术平台,其中制造和零售业相对占据更多业务量。

该公司有三位行业合伙人,分别在三个行业工作超过20年,具有丰富的行业经验,有助于创新奇智事半功倍地深入三个商业领域。

自成立以来,创新奇智快速发展,以北京为核心,先后落地广州、重庆、南京、宁波、合肥等城市。

脱胎于创新工场人工智能工程院,创新奇智的近两百位技术及行业团队成员,大多来自国内外高校和谷歌、微软、SAP、万达等企业。目前技术团队的人才分布主要分为四类团队:视觉算法,自然语言处理,机器学习,工程和业务开发,目前十余篇专利和若干篇国际顶级学术会议论文在申请中。

二、计算机视觉的技术差异点

随后,张发恩介绍了创新奇智的在视觉方面的一些技术差异点,包括畸变图像识别、语义级的图像差分系统与亚像素级缺陷识别、自研卷积神经网络架构、商品识别与缺陷检测、光衍射神经网络、以及3D视觉引导。

和同做图像识别的商汤、旷视、云从不同,创新奇智的一个技术优势在于广角摄像头造成的畸变图像。

张发恩表示,畸变图像识别在新零售不可或缺。由于智能货柜要求摄像头能够清楚拍摄每一层每一个商品,这需要一定高度,如果使用正常摄像头最多能摆放2层,但有了畸变图像识别技术,可以摆放至少5层。

另一个技术差异点在于语义级的图像差分系统与亚像素级缺陷识别,他们主要用在智能制造的缺陷识别中。以手机为例,它的缺陷可能小到几个像素点,很难建立视觉特征,但如果缺陷未被识别,可能会出现电力问题。

此外,创新奇智正在自研卷积神经网络架构,目标要超过ResNet。商品识别和缺陷识别也是该公司的研发重点,张发恩称,预计在2020年-2021年实现非监督式学习,靠强化学习做商品识别,到2024年,计划探索光衍射神经网络。光衍射神经网络不再需要芯片,依靠光传播即可实现零延时、低能耗的深度学习。

还有一个技术差异点在于3D视觉引导。目前很多机械臂是编程机械臂,只有手,无眼无脑,创新奇智要让机械臂“看得见,摸得着”,具备识别和分拣规划能力。具体来说,就是基于RGBD摄像头,获取立体信息和深度距离信息。

三、用技术优势解决行业痛点

新零售、智能制造和智慧金融的主要应用产品存在一些常见问题,创新奇智的产品则对这些问题逐个击破。

1、新零售

三个月前,原麦山丘引入一个心算满分的新“收银员”,只需将选好的面包盘放在扫描仪下,瞬间你的账单就出来啦。

这个超高效率的“收银员”就是创新奇智打造的自助结算机,它采用更高效的数据采集和交互设计解决方案,既能识别外观相似的不同类商品,也能辨别“造型百变”的同一类商品。

上文提到的畸变图像问题则常发生在智能货柜产品中,创新奇智从控制变量和增加校验信息着手,全流程无手机处理,即可准确识别畸变图像中被遮挡的相似商品。目前,该产品在北京、广州、重庆、宁波都有布局,并具有成本低、货架好用的竞争优势。

此外,许多线下商店开始陆续布置渠道陈列监控,但是在不可预知的拍摄设备、场景、人物下,难以准确识别排面商品的口味和容量。对此,创新奇智通过控制、引导拍摄内容和标准,以及设计更精细复杂的网络,解决这一痛点。

2、智能制造

AI在制造业的主要工作之一就是表面检测。比如某生产汽油发动机的厂商,其装配线上有25道工序,每道工序都需要仔细查错,创新奇智在其每一道工序备有一个基于视觉检测的一体机,可以有效降低出错可能性。当然,表面检测还能用于检测零部件数量、位置、是否有划痕等。

此外,在金属加工类细分领域,对零部件、产成品激光刻码、打码是进行数据管理以及追查质量的重要手段之一。创新奇智用OCR技术代替手工采集和录入,可快速、准确进行扫码录入。

3、智慧金融

在创新奇智主打的三个行业中,金融属于另一个主打行业。目前,已经有一些智能核保、智能定损、智能定价等解决方案推出。

比如,为保险业打造智能核保,买健康险需要体检报告,通过做文字识别,用结构化模型把主要疾病直接录入数据管理和数据中心。用做决策分析,还可以有效降低制冷系统的能源消耗。

四、提出“P3”理论,要做价值的场景

在新零售、制造和金融中,张发恩提出P3理论的规划,即项目(Project)-产品(Product)-平台(Platform)。他告诉我们,在后AI时代,小公司玩场景,大公司做平台,目前创新奇智在第一到第二阶段之间,并或在2024-2025年进入到第3个“P”阶段。

当记者问道为何选择制造业,张发恩表示,真正对国家非常有用的是第一产业和第二产业,尽管服务业产生巨大营收,但“皮之不存,毛将焉附”。当下,我们的衣食住行都离不开制造业,而中国制造业“大而不强”,AI将帮助整个制造业节省大量人力并提高效率。

在规划行业发展的道路中,要“有所为有所不为”,不在不熟悉的领域分散精力,因此创新奇智不会涉足自动驾驶领域。虽然暂不会涉及其他传统行业,不过制造业的安全防控、预测性维保等与安防稍有交叉点,未来公司业务是有可能向这些方面拓展的。

张发恩表示,后AI时代应用为王,最重要的是找到有价值的场景。一些原来的技术公司和进入瓶颈期的公司,如今都不得不走上寻找落地场景的转型之路。

以钢铁为例,其制造过程有很多智能质检的场景,但它最主要痛点在钢板检测、货物堆叠等方面。AI创企要深入行业,将AI技术应用在更有价值的场景上,才能在日益激烈的AI行业竞赛中胜出。

五、基于AI三要素,建立技术根基

建设AI离不开“数据、算法、算力”三要素,张发恩表示,基于这三大要素,创新奇智取得了一些成绩。

在数据方面,创新工场有分布式爬虫平台、数据采集和标注平台、智能货柜和智能结算一体机,用来收集和处理海量线下消费行为数据。

在算法方面,创新奇智研发了全分布式机器学习平台、全分布式深度学习平台,支持市面上多种算法和框架,并开发出具有创新性网络结构的深度神经网络(DNN)模型,在物体识别应用方面取得非常好的效果。

在算力方面,创新奇智建立统一在线中台,提供CPU、GPU、FPGA多种异构计算算力,目标建设峰值能力达到1200 Teraflops,相当于4000台至强CPU服务器的算力。该公司还计划在智能货柜和自助结账产品上应用FPGA加速芯片,使订单结算速度少于20毫秒。

基于上述平台,创新奇智主要发力于计算机视觉方面的感知智能、文本处理类的认知智能和决策分析,打造AI在新零售、智能制造和金融行业的应用。其交付形式为软硬一体交付,即为客户提供ABC一体机。

结语:牢抓市场需求,警惕AI寒冬

正如张发恩所言,尽管我国是世界上公认的制造业大国,但主要优势体现在资源与劳动力“大”,而非技术和专利“强”。就目前来看,制造业想要长足发展,搭乘AI等新兴技术的的东风完成转型是大势所趋,而AI技术也通过和更多传统行业的结合产生更多实用价值。

如今,我国的智能制造体系初具雏形,AI的计算机视觉、自然语言处理、机器学习、知识图谱等技术已经开始为一些企业的生产过程智能化提供可靠的支撑,提高收益并降低成本。

但与此同时,“AI寒冬论”已然初显征兆,一些业内人士预言,未来两年将有大量AI创企举步维艰。当各家技术实力相差不多,真正有价值的市场需求对于AI创企而言,可能是迈过寒冬的“救命稻草”。

zhidx