在平时观看影视剧、综艺节目、体育比赛、短视频时,我们总会在画面中看到跟视频内容相关的广告:比如在观看球赛过程中,会有球星同款球衣、球鞋的广告;当视频画面中出现地标性建筑时,会出现旅游相关的广告;在厨房场景下,会有厨具相关的广告等,甚至同一个视频不同观看时间推送的广告也是不一样的,是不是感觉很神奇呢?其实这背后都是视频内容识别的功劳!

视频内容经深度学习算法扫描后会自动识别出其中的明星、品牌、场景、物体等,自动匹配广告内容,实现商品和视频内容的精准匹配,在提升消费者购物体验的同时提高商品转化。除了精准广告投放,视频内容识别还可以应用于视频结构化、网络视频违规、敏感内容审核等方面。

虽然视频内容识别已经在广告营销、视频结构化和网络视频内容识别等领域实现了应用落地,但是依然面临着很多的挑战:算法功能单一,目前不同的视频识别算法基本都是针对单一维度来设计的,无法利用视频内容各维度之间存在的语义关联建立模型,提高识别准确度;数据匮乏,缺少包含多维度标注的大规模视频数据集来为多维度视频识别算法研究提供训练测试数据支持;视频内容复杂,以消费级视频为例,会存在内容类别(体育赛事、综艺节目、影视剧、广告等)多样化、场景(特效、光照、旋转等)复杂等问题,因此视频内容识别技术仍然有很长的路要走。

10月10日晚7点,计算机视觉应用系列课第二季第2讲将开讲,由极链科技AI研究院资深研究员张奕主讲,主题为《消费级视频内容识别的算法设计与应用》。张奕博士将从视频内容识别在消费级视频应用中的挑战、数据的重要性以及算法设计等维度为我们带来系统讲解。