多模态智能公开课上线,主讲浪潮多模态的研究与开源应用框架iMIX | 直播预告

什么是模态?每一种信息的来源或者形式,都可以称为一种模态。例如,人有触觉,听觉,视觉,嗅觉;信息的媒介,有语音、视频、文字等;多种多样的传感器,如雷达、红外、加速度计等。以上的每一种都可以称为一种模态。目前大多数的研究都属于单模态任务的研究,如CV和NLP。

然而就像人类生来就有视觉、听觉、触觉、味觉等感官接受世界的信息一样,我们更希望构建的是一种通用人工智能技术,即具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。多模态学习是通过机器学习的方法实现处理和理解多源模态信息的能力,倾向于对同时包含不同模态的数据进行建模。

现阶段的CV和NLP等单模态任务在技术上的突破,如用于CV的CNN和用于NLP的Transformer等,为多模态智能的发展带来了千载难逢的机遇,此间有大量的研究工作值得被关注,如目前比较热门的研究方向是图像、视频、音频、语义之间的多模态学习。

1月7日晚7点,「浪潮元脑专场」第7讲邀请到高效能服务器和存储技术国家重点实验室首席研究员范宝余进行直播讲解。这一讲定名为多模态智能公开课,主题为《多模态智能:让AI更接近人类智能》。范宝余老师将从多模态智能的前沿发展出发,重点讲解视觉-语言的跨模态研究,最后也会向大家介绍国内首个、由浪潮面向多模态领域所推出的开源应用框架iMIX。

范宝余是高效能服务器和存储技术国家重点实验室首席研究员,主要从事面向视觉-语言的多模态人工智能、认知智能前沿技术研究,致力于多模态智能算法的优化和开源应用框架的设计开发。他曾多次参与国家、工信部重大研究课题,并获得CVPR2020盲人视觉问答挑战赛冠军。

专场介绍

专场主题

《多模态智能:让AI更接近人类智能》

专场提纲

1、多模态智能对AI发展的重要意义
2、多模态智能面临的五大挑战
3、多模态研究中的常见任务
4、iMIX:国内首个多模态开源应用框架

专场讲师

范宝余,高效能服务器和存储技术国家重点实验室首席研究员,从事面向视觉-语言的多模态人工智能、认知智能前沿技术研究,致力于多模态智能算法的优化和开源应用框架的设计开发;多次参与国家、工信部重大研究课题,获CVPR2020盲人视觉问答挑战赛冠军。

直播信息

直播时间:1月7日晚7点
直播地点:智东西公开课小程序

入群方式

为了便于大家学习和交流,本次专场讲解设有主讲群,并将邀请讲师入群。加入主讲群,除了可以与讲师直接请教和交流,还能提前获得课件,且能结识更多的技术牛人。
欢迎添加小助手曼曼(ID:zhidxclass006)进行申请,备注“姓名-公司/学校-职位/专业”的朋友将优先审核通过。