「NLP前沿讲座」,是智东西公开课针对自然语言处理领域推出的一档讲座,聚焦于自然语言处理前沿领域研究成果与进展。我们将持续邀请研究者、专家与资深开发者,为大家带来直播讲解。
语言模型编码在神经模型中的评估越来越受到科研人员的关注。语言探针(linguistic probe)是最近比较流行的一种可以探测深度神经模型里面编码了哪些特征的“诊断性分类器”算法,分类器效果的好坏直接体现深度模型包含信息的好坏,也就是模型性能的好坏。“探针”的选择是对模型性能的解释,因此如何选择“探针”成为了一个难点。
2019年Hewitt & Liang提出,语言探针分类器的效果好可能因为信息好,或者探针本身学会了探测任务。而在2020年,Pimentel et al.反对这种二分法。那么这种二分法到底是否正确呢?多伦多大学的朱子宁博士通过信息理论对此进行了验证,表示这两种可能性确实存在。同时他们还发现探针的构建与选择,与两篇论文中提到的控制任务(Hewitt和Liang,2019)和控制功能(Pimentel等人,2020)是等价的,也就是说,这两种选择标准造成的误差原因是相同的。
11月20日上午10点,智东西公开课邀请到多伦多大学在读博士朱子宁参与到「NLP前沿讲座」第8讲,带来主题为《如何利用语言探针检测深度神经模型性能》的直播讲解。在本次讲解中,朱子宁博士首先会讲解深度神经模型的性能检测算法,然后对语言探针的定义及分类器的选择进行详解,最后就如何减少探针误差的方法进行重点解析。
朱子宁博士目前就读于多伦多大学,师从Frank Rudzicz。他的研究方向包括自然语言处理和深度模型的可解释性,试图设计实验来理解深度语言模型编码的信息,以及这些模型在应用时的表现。
课程内容
课程主题
《如何利用语言探针检测深度神经模型性能》
课程提纲
1、深度神经模型的性能检测算法
2、语言探针:一种探测模型编码特征的“诊断性分类器”
3、基于信息论的语言探针分类器选择
4、减少语言探针误差的方法解析
讲师介绍
朱子宁,多伦多大学在读博士,师从Frank Rudzicz;研究方向包括自然语言处理和深度模型的可解释性;试图设计实验来理解深度语言模型编码的信息,以及这些模型在应用时的表现。
直播信息
直播时间:11月20日10:00
直播地点:智东西公开课小程序
加入讨论群
加入讨论群,除了可以免费收看直播之外,还能认识讲师,与更多同行和同学一起学习,并进行深度讨论。
添加小助手小语(ID:hilele20)即可申请,备注“姓名-公司/学校/单位-职位/专业”的朋友将会优先审核通过哦~