大厂讲坛上新商汤专区,特邀三位研究员深度讲解最新模型量化算法与工具

「大厂讲坛」是智东西公开课教研团队全新策划推出的系列直播课,将邀请国内科技/互联网大厂开设专区,围绕其最新研究成果、核心技术、业务创新等,持续带来多场直播讲解。

今年7月,腾讯优图实验室在智东西公开课「大厂讲坛」开设了第一个专区,将围绕优图实验室在弱监督目标定位、图文多模态、TNN、高效模型、3D人脸、人脸隐私训练及开源项目Tface这七个领域的重要研究成果,陆续进行直播讲解和交流。

8月,「大厂讲坛」第二个专区——商汤专区,正式上线。

商汤科技打造的新型人工智能基础设施——SenseCore商汤AI大装置,打通算力、算法和平台,大幅降低人工智能生产要素价格,实现高效率、低成本、规模化的AI创新和落地,进而打通商业价值闭环,解决长尾应用问题,推动人工智能进入工业化发展阶段。

学术研究方面,商汤同样拥有着深厚的学术积累,并长期投入于原创技术研究。在今年的CVPR,更是有66篇论文入选。

商汤科技工具链团队的三位研究员将在商汤专区带来三讲,介绍其如何在模型量化领域从算法创新和工具沉淀两个维度助力SenseCore AI大装置,降低量化模型的生产成本,打造具有极致部署效率和规模化落地能力的量化模型生产体系。直播将分享该体系中的核心算法原理以及工具使用介绍,希望推动整个领域和社区的共同发展。

在深度学习的各个垂直领域中,模型量化对高效推理部署是至关重要的。离线量化是生产量化模型最简单高效的方式,也是被主流深度学习硬件厂商广泛支持的方式,然而它也面临很多挑战。8月23日晚7点,第一讲将开启,商汤科技高级研究员龚睿昊将围绕主题《离线量化算法研究》进行直播讲解。

龚睿昊硕士毕业于北航计算机学院,大三下加入商汤科技实习,现为商汤科技高级研究员。期间他先后从事视频结构化解析系统开发,模型量化压缩框架的设计开发和相关算法研究,服务大量业务线模型的压缩落地。他曾获得商汤科技未来之星、腾讯犀牛鸟人才培养计划、CCF优秀大学生、北京市三好学生、国家奖学金等,在ICCV、CVPR、ICLR、PR、NeurIPS、ICML等期刊会议上发表15篇论文(其中3篇一作,4篇二作),现阶段主要研究和工作方向为: 深度学习模型压缩和部署编译,致力于打破硬件彩票假设,最大化榨取模型和系统的潜力。

离线量化速度快,却无法保证量化模型的精度。对于提升量化模型精度的方法,其中上限最高的就是量化感知训练——在模型训练中加入量化操作。9月9日晚7点,在商汤专区第二讲,商汤科技见习研究员李雨杭将为你解答。他的讲解主题为《可部署的量化感知训练算法研究》。

李雨杭主要研究方向为模型量化与部署,包括量化感知训练和后训练量化以及量化框架的开发设计,致力于解决神经网络在部署过程中低速推理的问题。他曾在ICLR,AAAI,CVPR,IEEE VR,ICCV,ICML, NeurIPS会议上发表论文共计10篇。

同时,随着量化过程逐渐成为工业级模型生产中必备的一个环节,开发出易用的量化工具显得非常必要。9月16日晚7点,在第三讲中,商汤科技研究员张琦将以《支持多平台部署的离线/在线量化工具与实践》为主题,深度讲解基于PyTorch最新feature的量化训练工具,以及其中的一些使用方式和仍存在的一些问题等。

张琦毕业于北京航空航天大学,目前是商汤科技的研究员,主要研究方向为深度学习模型的量化加速技术,负责量化感知训练和后训练量化工具开发,支持多个业务线的项目落地。

「大厂讲坛」商汤专区的三讲直播课,都将在智东西公开课知识社区进行,包含主讲和问答两个部分,其中主讲环节40分钟,问答环节20分钟。每个环节主讲老师都将通过视频直播进行实时讲解与互动。

同时,我们还组建了相应的技术讨论群。加入讨论群,除了可以免费收看直播进行学习之外,还能与讲师,以及更多研究人员和开发者认识和交流。