
4月1日-2日,2025中国生成式AI大会(北京站)「GenAICon 2025北京站」将在北京中关村东升科技园万丽酒店盛大举办。中国生成式AI大会已成功举办三届,现已成为国内人工智能领域最具影响力的产业峰会之一。
本次大会继续由智一科技旗下智猩猩、智东西共同发起,以“大拐点 新征程”为主题,邀请到50+位重量级嘉宾同台分享和交锋,深入解构DeepSeek引发的变革狂潮,全面展示国内生成式AI重大进展。大会也是“智领未来”北京人工智能系列活动之一。
大会主会场首日将进行开幕式、GenAI应用论坛,次日全天将进行大模型峰会;分会场则会先后组织DeepSeek R1与推理模型技术研讨会、AI智能体技术研讨会和具身智能大模型技术研讨会。其中,三场研讨会为闭门制,主要面向持有闭门专享票、贵宾通票的观众开放。
作为本次峰会的三场技术研讨会之一,DeepSeek R1与推理模型技术研讨会将在4月1日的下午进行,由主题报告和圆桌Panel两个环节组成。
目前,DeepSeek R1与推理模型技术研讨会邀请到360智脑算法资深专家邹昊晟,中国人民大学高瓴人工智能学院在读博士陈志朋,东南大学计算机学院硕士研究生、LMM-R1一作 、蚂蚁金服实习算法研究员彭英哲,浙江大学软件学院硕士研究生、LightThinker一作张锦添,华中科技大学Hust Vision Lab与地平线联合培养博士生蒋博5位来自学术界和工业界的青年学者和技术专家带来报告。
性能领先、开源普惠、国产易获取的三重势能,造就了2025年初DeepSeek的技术平权狂热。然而,在端侧部署DeepSeek模型时,研究者需在高计算成本和低推理质量之间权衡。3月4日,360智脑开源了Light-R1模型及全部训练数据和代码,用较低的训练成本即可从零训练得到推理模型,在开源时首次实现领域内评测超越DeepSeek-R1-Distill。本次研讨会, 360智脑算法资深专家邹昊晟将以《Light-R1:低成本复现推理模型之路》为主题,介绍Light-R1背后的课程学习SFT、RFT、DPO等方法上的数据心得和训练策略,和QwQ-32B、TinyR1等相关工作在训练资源、方法等各方面进行比较。
传统通用大型语言模型的思维方式更像是“快思考”,其主要依靠算力对海量数据进行学习,实现对后续空白内容的快速预测,回答人类提出的各类问题,本质上是基于概率模型对可能的答案进行“猜测”。相比之下,推理大模型更有意识和逻辑,会在回答之前进行一段时间“慢思考”,依据特定思维链条,提供更全面解答。本次研讨会,中国人民大学高瓴人工智能学院陈志朋博士将以《类o1模型复现探索与行业思考,慢思考的外置、内化与提升》为题,阐述如何通过奖励引导的外置树搜索、“模仿、探索和自我改进”的框架来增强大语言模型的推理能力。陈志朋博士负责推进“STILL”系列研究工作,探索大模型慢思考能力这一前沿课题,为提升大模型的深度推理能力提供了新的思路。
大型多模态模型在处理视觉与语言信息时面临着显著的推理能力挑战,尤其是在多模态环境下实现高质量的逻辑推理更是难上加难。LMM-R1提出了一种创新的两阶段框架,通过规则强化学习实现了模型推理能力从文本到多模态的跨域迁移与泛化。本次研讨会,LMM-R1一作彭英哲将以《LMM-R1:探索增强多模态模型推理能力的两阶段强化学习》为题,深入剖析LMM-R1的技术原理、实现细节与评估结果,探讨这一方法如何推动多模态AI技术在实际应用中的落地,以及对未来研究方向的启示。
大型语言模型在复杂推理任务中生成冗长的中间思维步骤会导致显著的内存与计算开销,限制其实际应用效率。本次研讨会,LightThinker一作张锦添将以《长思维链高效推理方法——动态压缩思维过程》为题,阐述通过训练的方式,让大型语言模型在合适的时机自主压缩冗长的思维为紧凑的表征,并基于压缩后的内容继续推理,从而降低显存开销,提升推理速度。张锦添主导并开源MachineSoM、OneGen、LightThinker等研究项目,参与agents(github累积5.3k star)项目的构建。
DeepSeek R1验证了强化学习在模型自主探索和提升模型能力/训练效率上的显著优势,结合推理策略,有效增强了模型的复杂问题解决能力。在自动驾驶领域,终极任务是planning,这也是一项涉及场景理解、分析、和决策的复杂任务。本次研讨会,华中科技大学Hust Vision Lab与地平线联合培养博士生蒋博以《探索DeepSeek强化学习和推理策略在自动驾驶中的巨大潜力》为题,介绍将DeepSeek R1的强化学习和推理策略迁移应用于驾驶领域,并做出一系列针对驾驶规划的策略优化,显著提升大模型自动驾驶决策规划的效果,并展现出涌现的多模态规划能力。蒋博是AlphaDrive的一作,代表作VAD/VADv2,已成为端到端自动驾驶的基准算法。
一、DeepSeek R1与推理模型技术研讨会议程
二、技术研讨会报告人及报告主题介绍
报告嘉宾:360智脑算法资深专家 邹昊晟
报告主题:Light-R1:低成本复现推理模型之路
内容概要: 360智脑在3月4日开源了Light-R1模型及全部训练数据和代码,用较低的训练成本即可从零训练得到推理模型,在开源时首次实现领域内评测超越DeepSeek-R1-Distill。报告将介绍Light-R1背后的课程学习SFT、RFT、DPO等方法上的数据心得和训练策略,和QwQ-32B、TinyR1等相关工作在训练资源、方法等各方面的比较。虽然Light-R1仅使用数学数据训练了模型的长推理能力,但在非数学任务上也表现出了泛化性及有效性。随着训练和推理技术的不断发展,未来长推理模型将更加普及,Light-R1正为低成本快速训练一个领域专精推理模型提供了重要参考。
报告嘉宾:中国人民大学高瓴人工智能学院二年级博士研究生 陈志朋
报告主题:类o1模型复现探索与行业思考,慢思考的外置、内化与提升
内容概要:
最近,测试时扩展(Test-time Scaling )引起了研究界的广泛关注,这在很大程度上得益于OpenAI o1模型和DeepSeek R1模型的重大进展。通过在推理阶段分配更多的计算资源,大型语言模型(LLMs)可以通过生成更多的思考标记或多样的解决方案,广泛探索解决空间,从而产生更准确的响应。然而,研发和训练类似的推理模型具有挑战性,研究人员一直在进行各种尝试,以推动这一开放研究领域的发展。我们先后从以下三个方面对复现类R1的慢思考系统做出了探索。
1.如何通过奖励引导的外置树搜索增强大型语言模型的推理能力?
2.如何通过内化慢思考过程长程思维链,使用“模仿、探索和自我改进”的框架来增强大语言模型的推理能力?
3.如何对已经具备慢思考能力的大语言模型进行进一步提升?
报告嘉宾:东南大学计算机学院硕士研究生二年级、LMM-R1一作 、蚂蚁金服实习算法研究员 彭英哲
报告主题: LMM-R1:探索增强多模态模型推理能力的两阶段强化学习
内容概要:
大型多模态模型(LMMs)在处理视觉与语言信息时面临着显著的推理能力挑战,尤其是在多模态环境下实现高质量的逻辑推理更是难上加难。LMM-R1提出了一种创新的两阶段框架,通过规则强化学习实现了模型推理能力从文本到多模态的跨域迁移与泛化。在第一阶段”基础推理增强”(FRE)中,LMM-R1利用纯文本数据集进行规则强化学习,克服了直接多模态训练中数据稀缺与质量不足的瓶颈,构建起坚实的推理基础。随后在第二阶段”多模态泛化训练”(MGT)中,模型将已获得的推理能力自然扩展到视觉-语言交互场景,展现出强大的跨模态泛化能力。实验表明,该方法在多种基准测试中取得了显著进步,多模态任务平均提升4.83%,纯文本任务提升4.5%,特别在需要复杂推理的场景中表现尤为突出。更重要的是,LMM-R1建立了一种数据高效的训练范式,巧妙规避了对大量高质量多模态训练数据的依赖,为大模型推理能力的提升开辟了新途径。本次演讲将深入剖析LMM-R1的技术原理、实现细节与评估结果,探讨这一方法如何推动多模态AI技术在实际应用中的落地,以及对未来研究方向的启示。
报告嘉宾:浙江大学软件学院硕士研究生二年级、LightThinker一作 张锦添
报告主题:长思维链高效推理方法——动态压缩思维过程
内容概要:
大型语言模型(LLM)在复杂推理任务中生成冗长的中间思维步骤会导致显著的内存与计算开销,限制了其实际应用效率。现有高效长思维推理方法可以分为两类,第一类通过提示工程或者训练的方式让LLM学会使用较少的词进行推理,第二类通过在LLM推理过程中对kv缓存进行裁剪进行。本次演讲提出LightThinker,一种基于动态思维压缩的推理加速方法,其核心是通过训练的方式让LLM在合适的时机自主压缩冗长的思维为紧凑的表征,并基于压缩后的内容继续推理,从而降低显存开销,提升推理速度。
报告嘉宾:华中科技大学Hust Vision Lab与地平线联合培养博士生 蒋博
报告主题:探索DeepSeek强化学习和推理策略在自动驾驶中的巨大潜力
内容概要:
DeepSeek R1验证了强化学习在模型自主探索和提升模型能力/训练效率上的显著优势,结合Reasoning策略,有效增强了模型的复杂问题解决能力。在自动驾驶领域,终极任务是planning,这也是一项涉及场景理解、分析、和决策的复杂任务,我们首次尝试将DeepSeek R1的强化学习和推理策略迁移应用于驾驶领域,并做出一系列针对驾驶规划的策略优化,显著提升大模型自动驾驶决策规划的效果,并展现出涌现的多模态规划能力。
三、报名方式
DeepSeek R1与推理模型技术研讨会将在4月1日下午的分会场进行,主要向持有闭门专享票、贵宾通票的观众开放。
希望参加研讨会的朋友,可以扫描下方二维码,添加小助手“泡泡”咨询和购票。已添加过“泡泡”的老朋友,给“泡泡”私信,发送“GenAICon25”即可。
除了闭门专享票、贵宾通票,大会还设有主会场观众票、主会场VIP票,在主会场的座位分布如下。有需要的朋友可以进行免费申请或购买。