百度林元庆:解读“最强大脑”脑王PK背后的技术真相

智东西(公众号:zhidxcom)
文 | 四月

智东西4月11日下午消息,“第五届百度技术开放日”活动在北京举办,百度研究院院长、深度学习技术及应用国家工程实验室主任林元庆,百度技术技术负责人、百度云联席总经理刘炀,百度技术委员会理事长陈尚义等人现场分享,系统、全面地解构了百度大脑背后的技术支持。

上周五,在《最强大脑》第四季收官之战,来自百度的小度”和人类选手陈志强、黄政、Alex Mullen共同获得了“脑王”称号。百度研究院院长、深度学习技术及应用国家工程实验室主任林元庆先主要介绍了百度在《最强大脑》使用到的技术,其中最为核心包括图像检索、声纹识别、人脸识别。

他表示,最初节目组在2016年7、8月份找到百度,在此之前也找到其他类似的人工智能平台,但百度可能在技术上实力最为合适。以下为分享内容精摘:

1)在搜索业务上,以图搜图是比较容易做的。图像质量良好,包含多个信息点作为线索。但《最强大脑》的规则难度加大了许多:在几十张图像里面(图片做了模糊处理),扣出极小的像素进行识别和匹配。百度采用深度学习算法,算出128位特征,对模糊、噪声、角度变化等因素有更好的校正。

他透露,近期百度在引擎服务上会有非常大的升级。

2)声纹识别技术的应用。它和语音识别的区别在于,语音识别只需要识别声音内容,而声纹识别需要识别声音特征,判断说话对象。因为不同的说话内容包含的噪声背景不同,有一定难度。百度大脑在现场判断中也有一次识别错误。

百度林元庆:解读“最强大脑”脑王PK背后的技术真相

林元庆强调,这一块将是百度重点提升的方向。声纹识别可作为身份验证的辅助手段,具备一定应用场景。

4)在跨年龄、跨代的人脸识别测试中,百度大脑不但展现了极强的辨别能力,还在社会公益项目中发挥作用,其中跨年龄人脸识别已经应用到帮助寻找走失儿童项目中。

百度林元庆:解读“最强大脑”脑王PK背后的技术真相

百度与“宝贝回家”寻亲平台合作,已经有超过6万条寻亲图片数据接入百度跨年龄人脸识别系统对比评测,初步筛选出30例疑似对象。目前已经成功确认一例子,父母与孩子DNA匹配成功。据林元庆透露,实际上匹配成功的还包括一对家庭。此外,跨代的人脸识别还能通过父母的照片,找到小孩线索。

百度林元庆:解读“最强大脑”脑王PK背后的技术真相

“宝贝回家”寻亲平台此前也与其他人脸识别技术方合作,但匹配与寻亲并未成功。“百度在跨年龄、跨代的人脸识别领域已经是世界第一”,林元庆介绍,其内部数据测试集包含有11万类图片,而著名的图像测试平台ImageNet是1000类。

5)此外,百度的人工智能业务还在不断扩充中,林元庆透露,AI视频分析、AI医疗图像分析是百度正在搭建和扩充的两大团队。

其中AI视频分析包括两个方面:一个是视频的语义理解,短视频是非常火的应用领域,即发现视频里面是谁,他在干什么,可为视频打上标签和帮助剪辑。

百度林元庆:解读“最强大脑”脑王PK背后的技术真相

百度正在搭建一个强大的团队,Stereo Visual Odomety研究方向聚焦在检测、分割和3D重建的统一框架。可应用于自动驾驶、AR等场景,例如,利用汽车上的摄像头拍到影像,分析估计出摄像头的精确位置,即三维重建,对周围环境有更深的理解。百度希望能达到99%的精度。

此外,AI医疗图像分析也是百度当下重点发力的方向。

百度林元庆:解读“最强大脑”脑王PK背后的技术真相