智东西(公众号:zhidxcom)
文 | 心缘

智东西8月21日报道,今天,第24届国际模式识别大会(24th International Conference on Pattern Recognition, ICPR 2018)在北京开幕,这是ICPR创办40余年来第一次在中国内地召开(两年一届),由中科院自动化研究所模式识别国家重点实验室和中国国际科技交流中心共同主办。

作为模式识别领域的旗舰学术会议,这届大会自然是学术大咖云集,周志华等知名学者应邀发表主题演讲。今年大会共收到1258篇论文,最终有125篇论文被选作口头报告,527篇论文被选作海报展示,总体入选率达52%,属于近几届ICPR较低的入选率。

其中,中国有超过100家高校及研究机构的论文被接收,入选口头报告的有60篇,入选海报展示的论文数量达300篇。在中国企业中,阿里巴巴、京东方、平安科技各有一篇论文入选口头报告,三星中国R&D研究院、北京麦哲科技、京东金融、众安科技、深圳中科微光和阿里巴巴各有1篇论文作为海报展示。

夸张一点来说,我国高校和企业的入选论文占了总入选论文的半壁江山。

智东西作为受邀媒体来到大会现场,不仅观看模式识别最高荣誉King Sun Fu Prize(傅京孙奖)颁奖活动和聆听获奖者的学术演讲,而且通过口头报告和展示的论文海报了解更多模式识别领域的前沿研究和应用成果。此外,智东西还深入展区,看到阿里巴巴、百度以及中科院自动化研究所孵化企业等国内公司在图文识别、虹膜识别和步态识别在不同行业的具体应用。

一、情感识别专家摘得桂冠

历届ICPR大会的一个“金牌”项目就是颁布IAPR三个颇具声望的奖项:King Sun Fu Prize、J.K.Aggarwal Prize以及Maria Petrou Prize。

在开幕式后,首先由大会主席Rama Chellappa颁发模式识别届的最高荣誉——King Sun Fu Prize(傅京孙奖)。这是一个颁给对研究人员的终身成就奖,用于鼓励获奖者在模式识别领域的杰出技术成就。该奖项每两年颁发一次,提名者必须由IAPR成员提名,并至少得到五名成员的认可,且IAPR执行委员会和奖项委员会成员不具备获奖资格。

今年的获奖者是芬兰奥卢大学教授Matti Pietikainen,他在局部二值模式(LBP)纹理分析、人脸图像分析等方面做出了许多开创性的贡献,他发表了300多篇学术论文,在谷歌学术上的引用次数总计超过5万次。2011年,他因为在机器学习视觉纹理和人脸分析方面的贡献而被任命为IEEE Fellow。

随后,Matti Pietikainen发表了主题演讲,分享了其研究团队在人脸分析与情感AI方面的一系列研究成果,包括情感与动态人脸表情识别、基于局部二进制(LBP)算法的图像和视频描述、心率测量、可视语音识别和多模态情感分析等内容。

除了介绍相关算法外,Matti Pietikainen还展示了这些研究的一些应用场景,并分享了几个有趣的实例视频。比如机器可以在川普和希拉里的竞选视频中根据两人的动态表情变化实时分析出他们在那一刻的心情。

此外,面部表情分析还可以应用到情感机器人、顾客体验分析、在线教育、疼痛强度预估、审讯、价格谈判、心房颤动等多个行业场景。

Matti Pietikainen表示,目前情感AI领域的研究仍然处于初级阶段,未来挑战的研究方向有卷积神经网络二值化(Binarized CNNs)、常规算法和卷积神经网络混合等。

对于产业界而言,情绪识别还是一个非常新的领域,目前在这方面投入关注的企业不算太多,已经做出具体产品企业的包旷视、竹间智能、微软小冰等。

二、图文识别大面积落地开花

本届ICPR大会为期5天,不过它的开幕式在第二天才举行。

在大会首日也就是昨天,主办方举办了MTWI(Multi-Type Web Images,多样式网络图像)识别挑战赛,中科院、清华、北大、三星中国研究院、科大讯飞、商汤科技、网易等学术界和产业界的研究机构纷纷参与了这次比赛。MTWI识别挑战赛一共分为三个任务,每个任务的参赛队伍数量分别为70、193、26支。三个任务如下:

(1)网络图像文本行识别(Text Line Recognition of Web Images),要求识别出给定文本行中的文字;

(2)网络图像文本检测(Text Detection of Web Images),要求检测出文本行所在位置;

(3)网络图像端到端文本监测和识别(End-to-End Text Detection and Recognition),要求同时对文本行进行监测和识别。

该挑战赛使用华南理工大学和阿里巴巴联合收集的已标注图像作为MTWI数据集,训练集和测试集各有10000张图像。每支队伍有三次机会提交测试结果,最终结果按每支队伍的最优成绩加以排名。最终,科大讯飞和中科大语音及语言国家工程实验室联合团队的成绩相当亮眼,在三项任务全部夺魁。

在开幕式和King-Sun Fu Prize颁奖结束之后,便进入各入选论文作者的口头报告和海报展示环节。此届大会围绕6个主题,分别是模式识别和机器学习、计算机视觉、语音图像视频和多媒体、生物识别技术和人机交互、文档分析和识别、生物医学成像和生物信息学,入选的论文将集中在本周以口头报告和海报展示两种形式进行展示。

口头报告在几个会议厅并行,参展人员可以根据自己的兴趣去听论文报告,并和论文作者进行交流。海报展示则陈列了入选论文的标题、作者、关键字和主要内容等基础信息。

虽说是学术会议,本届大会依然吸引了不少企业前来参展, 在大会的展区,我们也看到科大讯飞、百度、阿里巴巴等国内企业的身影。

图片是互联网时代传递信息的重要媒介,每天都有亿兆级别的图像在流动传播,图片中的文字识别(OCR)有重要商用价值。除了昨日挑战赛拿了三项冠军的科大讯飞外,阿里巴巴和百度也各自展示了其在图像文字识别领域的产品。

阿里巴巴“图像和美”团队打造的OCR云产品,能够实现快速高效率的图像文字定位、识别和理解。展位工作人员现场展示了“钉钉”APP中的“传图识字”功能,对现场随便拍一张照,手机可以立即识别出其中包含的文字。除了现场拍照,“传图识字”还提供方便的卡证照识别服务,比如它能直接识别并整理发票图片中的内容。

百度也向智东西展示了其图像文字识别技术的一些应用。例如,百度翻译可以做到对图片中的大段文字进行秒翻译;百度识图可以对图片中的任意一个区域画圈,然后搜索这个划定区域内的类似图片。

三、除了人脸识别,“AI+安防”还有很多可能

在展区的另一侧,有几家主营AI+安防业务的企业展位,它们都是从中科院自动化智能感知于计算研究中心孵化。有趣的是,在人脸识别几乎成为“AI+安防”主旋律的大背景下,这几家公司的主攻方向都在于补上人脸识别应用于安防领域容易出现的漏洞。

人脸识别往往需要足够高清的摄像头和较近的拍摄距离,但当遮挡、光线等变数出现时,人脸识别往往不再适用。银河水滴的主营业务就是补上这一缺口,他们主要做步态识别的软硬件及解决方案,能够通过对人进行远距离的跨视角步态识别,其精确度高达94.1%。此外,银河水滴还打造了全球最大容量的步态数据库。

做虹膜识别业务的中科虹霸和中科虹星则是一对同门兄弟,他们的创始人员都源自中科院自动化所的虹膜识别研究团队。不过,两家公司的主攻方向却有所不同。中科虹霸主要在做近距离虹膜识别的产品,展位工作人员向智东西展示了他们的可以存放20000人虹膜信息的身份验证成机,用户在距离机器大致60cm的位置录入虹膜,随后即可通过虹膜识别判断身份。

中科虹星的产品则主攻远距离虹膜识别。其工作人员展示的身份验证机器的用法和上述提及的中科虹霸产品相似,不同的是,它将验证距离扩大到1.2m,并可以根据客户的需求对验证距离进行相应的调整。

四、ICPR大会与中国的历史渊源

ICPR大会始于1972年,由国际模式识别联合会(IAPR)组织创办,每两年召开一次。IAPR会提前四年通过无记名投票的方式来确定下一届大会的主办国家或地区。

早在四年前,我们国家就和澳大利亚为了今年的大会举办权展开角逐。在我国两位学术界大咖——中国科学院自动化研究所模式识别国家重点实验室学术委员主任谭铁牛院士和实验室主任刘成林研究员——代表中国做申办报告并回答理事会的质询后,ICPR大会终于花落北京。

追溯到40年前,ICPR大会可以算是和我国关系相当密切的国际学术会议了,因为其创办者、国际智能控制学科的奠基人傅京孙(King-Sun Fu)教授正是我国浙江丽水人。

由于傅京孙教授在模式识别与机器智能方面的学术造诣极高,在1976年当选为美国工程科学院院士后,他先后获得美国工程教育学会高级研究奖、IEEE教育奖状和IEEE百年纪念奖。他曾担任IAPR和美国IEEE计算机学会机器智能与模式识别委员会的第一任主席,以及目前计算机视觉和相关领域最权威的期刊之一——IEEE模式分析与机器智能(PAMI)会刊的第一任主编。

在傅京孙的一生中,他一共出版了5本专著和18本编著,发表过约400篇论文,培养了近一百名博士和大量的华人研究人员,为模式识别的研究与应用以及中国计算机发展都做出了历史性的贡献。在IAPR设立的三大奖项中,最重磅的就是King Sun Fu Prize(傅京孙奖),该奖作为终身成就奖,是模式识别的最高荣誉。

虽然傅京孙教授已经与世长辞,但其严谨专注的治学精神,将伴随King Sun Fu Prize一起,激励一代又一代的后起之秀为AI领域做出更多的贡献。

结语:模式识别技术落地广泛,学术进步引领产业变革

近年来,AI发展非常迅速,大部分最新研究成果都会先发表在顶级会议上。作为产学研的基础,AI学术研究的成果可能会引发未来几年新的行业变革。

本次主办ICPR大会,对于我国在国际AI学术领域而言,绝对是值得庆贺的进展。从主办权到参与度,从论文数量到科研成果,我国高校、科研机构和企业正在不断刷新记录,我国在AI领域的影响力与日俱增。

在本次大会上,我们还看到许多高校的硕士和博士生穿梭于各报告厅之间。我们也惊喜地发现,许多研究团队正在和企业合作,这意味着我国学术人才正在走出象牙塔。随着越来越多的AI人才走入行业,我们期待有更多成熟的技术落地,推动各行各业的自动化和智能化升级。


每日一头条

趋势·深度·犀利·干货,最专业的行业解读</p >

深喉爆料、投稿:guoren@zhidx.com</p >

zhidx