对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

智东西(公众号:zhidxcom)
文 | 司北

不知不觉间,AI已经渗透到了生活的方方面面,甚至包括我们所熟知的餐饮外卖。

从商家的菜单录入、招牌识别、到促销时AI自动生成的广告首图优选、外卖骑手的身份验证……美团的AI视觉能力已经渗透到其业务的方方面面。

对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

▲美团视觉图像中心图像视频组负责人魏晓明

近日,智东西来到美团北京总部,与美团视觉图像中心图像视频组负责人魏晓明进行了一次深度对话,全面地解读了美团的视觉AI能力、美团视觉AI平台发展历程、与美团视觉AI背后的“发电厂”。

一、从菜单录入到AI选图,AI无处不在

魏晓明说,与其他很多企业不同,美团的AI技术有着强烈的业务导向特色。

当前,美团的AI技术主要分为四大类,分别为:基于AI的语音/语义理解技术、基于AI的视觉处理技术、基于运筹学为主的配送调度优化、以及基于自动驾驶相关的无人配送技术。

魏晓明是美团视觉图像中心图像视频组负责人,有着超过9年视觉领域研发和技术管理经验,此前曾经就职于佳能研究院和三星研究院。

魏晓明2015年加入美团后,主导了超过50个AI视觉项目。在采访中,魏晓明分别从商户、骑手、用户、平台四个角度,对于美团的典型AI视觉应用场景进行了介绍。

对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

▲AI菜单拍照录入

对于商户而言,美团AI能够让其通过拍照录入菜单,通过文字检测、语义分割、视觉关系学习等技术抽取纸质菜单上的结构化信息,让商户菜单录入的时间由小时级降至一分钟以内。

对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

▲AI招牌识别

随着OCR技术的不断发展,菜单识别、招牌识别等细分场景成为了当前OCR领域的研究热点。在今年的 ICDAR 2019 上,美团主办了业界首个中文门脸招牌文字识别比赛(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards),并公开的业界首个真实场景招牌图像数据集。

此外,商户的证件资质认证、骑手的刷脸认证、用户所使用的AI菜品识别小程序、广告首图优选、骑手抽检等等应用背后,都有着美团AI视觉的加持。

对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

魏晓明说,当前,美团的技术人员有上万人,美团AI视觉团队规模仍在不断扩展当中。

二、GPU计算平台全面升级,效率提高百倍

美团的AI视觉团队从2015年开始建立,为美团各项业务提供AI视觉能力(比如图像审核、智能选图等),2015-2016年可以看作是美团AI视觉平台的第一个发展阶段。

随着集团内部对于AI算力的需求飙升,2017年,美团进行了企业层面的计算平台全面升级,将从CPU为主的计算平台升级为以英伟达GPU为主的集群化AI计算平台,2017-2018年可以看作是美团AI视觉平台的第二个发展阶段。

对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

在升级为以英伟达Tesla V100 GPU为主的集群化AI计算平台后,美团AI在文字检测、人脸识别、商品识别的离线训练(Training)环节能够达到上百倍的效率提升。

而在应用推理(Inference)方面,当前,美团基于英伟达Tesla P4 GPU + TensorRT的搭配能让计算效率提高数十倍。而且,美团目前使用的是FP32精度,未来如果使用英伟达T4 Tensor Core GPU进行FP16精度的推理计算,性能将进一步提升。这种低时延、高实时性的计算性能对于用户与配送员的体验非常重要。

对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

举个例子,为了保障用户的安全,当前美团日活的70万名骑手都已经全面覆盖了“刷脸认证”功能。但是这项功能为骑手多增加了一道验证工序,对于效率与体验都有影响。

因此,为了保证骑手的人脸比对效率,美团使用了基于GPU并行+TensorRT的方案进行大规模人脸比对的骑手身份验证。相比于基于CPU方案,这套方案可以加速20倍以上,速度的提升能让外卖小哥“刷脸认证”的过程更快捷、体验更优秀。

魏晓明说,当前,美团服务器集群的AI视觉服务的日均调用已经达到了上亿次。

三、美团AI的下一步

2018年,结合美团的计算平台升级,美团AI视觉得到了超大规模的落地,覆盖了上文提到的菜单识别、人脸认证、刷脸支付、广告生成等众多集团内部应用场景。

对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

▲美团在CVPR2019-FGVC6商品识别比赛获得第二名

从2019年开始,美团的AI视觉团队已经不仅仅只支持集团内部的AI需求,还逐步在国际大型比赛上进行发声。2019年,美团AI视觉团队在CVPR、ICME等视觉届知名比赛上都取得了Top3名次。

魏晓明认为,当前AI算法依旧在快速迭代的过程中。对于美团这种大型平台来说,持续对TensorFlow、Caffe、MXNet等多个深度学习框架进行迭代能够提高计算并行化效率,对于美团特定AI场景的优化十分重要。

下一步,美团AI视觉团队还将对视频理解、门店数字化、无人配送系统等更多AI场景落地进行拓展。

结语:AI应用全面爆发,实时性要求不断提高

随着AI应用的爆发,众多企业都在进行AI计算平台的升级,尤其是涉及刷脸认证、拍照信息检索等实时性要求较高的AI推理应用,传统计算平台已经不能满足需求。

不知不觉间,AI已经逐渐渗透到了我们生活的方方面面,在你不经意间,也许已经享受到了AI带来的生活便利。