智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影
智东西4月27日报道,今日,2024中关村论坛年会首次举办的主题日活动「人工智能主题日」在北京举行。在主论坛未来人工智能先锋论坛及专题论坛通用人工智能论坛期间,8项重大政策、研发成果、报告、联盟、生态计划集中发布。
主题演讲嘉宾阵容规格也相当重磅——北京大学教授、中国科学院院士鄂维南,中国工程院院士、清华大学信息科学技术学院院长戴琼海;百度CTO王海峰;蚂蚁集团CTO何征宇;微软全球资深副总裁、Microsoft AI亚太区总裁张祺;远期人工智能研究中心主任曾毅;北京通用人工智能研究院院长,北京大学智能学院院长、人工智能研究院院长,清华大学讲席教授朱松纯等,分别从数据、算力、模型与框架、应用、产品、治理、未来目标等关键维度分享前沿进展。
分别围绕“具身智能”、“通用人工智能的产业创新实践”和“人工智能科学治理”的3场圆桌论坛也密集输出干货。国内具身智能机器人产业代表性的7位创业者与大厂研发负责人同台探讨具身智能的现状、挑战与未来走向,来自产业界的多方代表就通用人工智能跨领域合作及创新商业模式和应用场景的范式展开高峰对话,国内外人工智能安全与治理专家们则重点分享了对推动技术创新与伦理道德的平衡、建立有效的风险评估和应对机制等方面的思考。
一、《北京市关于加快通用人工智能产业引领发展的若干措施》发布,最高重奖1亿元
北京市发展改革委党组副书记、副主任林剑华在会上发布《北京市关于加快通用人工智能产业引领发展的若干措施》,聚焦提升智能算力供给、强化产业基础研究、支撑高质量要素聚集、加快大模型创新应用、打造一流发展环境5大方面,提出10条措施。部分重要措施如下:
在算力方面,对现有数据中心改建且智能算力规模达到1000P以上的绿色低碳智能算力中心,最高支持5000万元;统筹各级算力补贴,通过资金补贴、发放算力券、模型券等方式,降低大模型企业算力使用成本。
在模型方面,加强大模型关键核心技术攻关,支持创新主体通过“揭榜挂帅”“赛马”等方式开展关键核心技术攻关,择优纳入市级科技研发计划,最高支持3000万元,对纳入国家重大战略任务的攻关项目,最高1亿元。
对于开展人工智能颠覆性技术路线创新,设立创新专项,前瞻布局新型架构芯片、脑智能、类脑智能等新路径探索,《若干措施》择优纳入市级科技研发计划,最高支持3000万元。
在数据方面,鼓励各类主体开放共享高质量训练数据,根据数据开放数量和质量等予以最高300万元奖励;对于完成大模型训练数据产品交易的主体,予以最高200万元支持,推动政府、企业多方联动,促进数据合规使用。
在应用方面,推动应用场景对人工智能大模型的验证、迭代,围绕具身机器人、智能医疗、智能教育等重点领域,建设行业大模型应用场景联合研发平台,打造一批示范效应好、推广前景大、融合力度强的人工智能标杆应用,最高支持5000万元。
在环境方面,优化投融资环境,5年内投资超1000亿元。积极推动人工智能企业优先在北交所上市;以海淀区为核心,加快建设人工智能大模型产业集聚区,打造特色鲜明的人工智能创新创业街区,予以最高5000万元支持。
二、北京市行业大模型创新应用大赛颁奖,行业应用分析报告发布
北京市科委、中关村管委会信息科技处处长韩健在会上发布《北京市人工智能大模型行业应用分析报告》,并宣布北京市人工智能应用场景联合研发平台启动征集。
北京市以行业大模型创新应用为抓手,全力推动大模型技术应用落地,举办北京市人工智能行业大模型创新应用大赛,开放多维度场景及高质量数据,最终有6家企业获得一等奖,分别是瑞莱科技(政务)、中科闻歌(金融)、瑞泊(产业升级)、数坤科技(医疗)、中科大脑(文化教育)、中科睿鉴(智慧城市)。
韩健谈道,北京市人工智能大模型行业应用呈现5大特征:1)由浅入深,大模型穿越边缘场景,向核心场景挺进;2)守正创新,央国企拥抱新技术,加快大模型在产业升级、金融等领域的落地步伐;3)百花齐放,大模型应用搭建难度明显下降,“动态行业大数据”成为落地新关键;4)量体裁衣,需求方情况各异,在采购、部署大模型时特色鲜明;5)保驾护航,大模型安全逐渐受到重视,为可持续发展提供保障。
当前人工智能大模型行业应用面临5类挑战:1)算力需求持续增长,可能会掣肘大模型落地应用;2)需求尽快找到大模型落地与知识产权保护、数据隐私保护之间的平衡点;3)大模型幻觉问题仍未得到“根治”;4)大模型从“可用”到“好用”,需要供需双方协同发力,联合研发;5)部分领域应用积极响应监管需要,对大模型落地提出更高要求。
同时,北京市人工智能应用场景联合研发平台征集储备。征集时间为4月27日至5月30日,面向行业用户,即大模型产品的需求方、场景方。
申报单位需在相关行业具有较高的行业影响力和丰富的行业从业经验,积累一定规模的高质量行业数据,有明确的行业大模型应用需求;有一定体量的信息化或人工智能研发团队,对促进人工智能新技术、新产品、新应用落地具有较强推动和示范作用。
三、人工智能创新街区概念发布,汇聚1300家人工智能企业
海淀区委常委、常务副区长岳立发布人工智能创新街区概念。“这里将真正成为一个会学习、会思考、有温度、可进化的超级城市智能风景。”
据他介绍,他们选择在海淀南部具有顶级人工智能资源、国际互动紧密的53平方公里范围,全面打造人工智能创新街区,以三横两纵一带为骨架,串联起52个全国重点实验室、10个新型研发机构、106个国家级科研机构、37所顶尖高校、89位AI2000全球顶尖学者、1.23万位人工智能学者、1300家人工智能企业、90余家大模型相关单位、37家备案大模型单位。
海淀区希望构建创新生态的新范式,包括推动政产学研金服用要素有机融合、提供独一无二的研究平台、提升千行百业创新水平的产业智能体;并希望搭建起高性能的通用城市智能底座,最底层是海量可信数据资源平台、超大规模算力资源平台,往上一层是空间计算操作系统,再往上是通用大模型平台,最上面是智能体运营平台。
“我们将秉承以人为本的初心,将率先在五道口和大钟寺两个先导区打造智能体的样板间,推动街区、校区、园区三期融合。有生命的城市智能体正在向我们走来。”岳立谈道。
四、聚焦具身大模型和机器人整机,打造全国具身智能创新高地三年行动方案
中关村科学城管委会副主任、海淀区副区长唐超发布《关于打造全国具身智能创新高地三年行动方案(2024-2026年)》,提出以大模型等人工智能技术突破为引领,聚焦具身大模型和机器人整机,部署实施六大行动。
六大行动分别是:源头创新突破行动,本体产品领跑行动,创新平台赋能行动,应用场景示范行动,产业集群建设行动,生态雨林打造行动。
行动方案的主要目标是力争到2026年,成为全球具身智能的原始创新策源地、应用示范新高地、产业加速集聚地,成为我国参与全球具身智能竞争的核心力量。还有三个“小目标”:
1、突破一批具身智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人。
2、打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。
3、集聚一批具身智能创新团队,率先培育出具有国际竞争力的领军企业。
在机器人方向,海淀区科研和产业优势突出,聚焦全市40%的企业,人形机器人企业数量近200家(占全市半数以上),包括十余家人形机器人本体企业,有3家本体上市企业、2家独角兽企业,清华、北大、北航、北理、中科院等高校院所,银河通用机器人、智源研究院联合研发了140亿参数量的具身智能多模态大模型Emu。
五、中国首个原创全自研长时长、高一致性、高动态性的视频大模型Vidu发布
清华大学教授、生数科技首席科学家朱军现场发布视频大模型突破性原创成果——中国首个原创全自研长时长、高一致性、高动态性的视频大模型Vidu。
Vidu由清华大学与生数科技联合研发,实现全栈自主创新、多维全面突破,具备模拟真实物理世界、富有想象力、多镜头语言、16秒视频时长、高时空一致性、理解中国元素等特色。
Vidu能根据文本描述直接生成16秒高质量视频,且生成视频流畅连贯,没有明显的插帧现象。朱军展示了Vidu与Pika、Gen-2、Sora等行业现有文生视频大模型的生成视频效果对比。
朱军称,其快速突破源于长期积累和多项原创成果。2022年9月,其团队在全球首发U-ViT网络架构,这是全球首个Diffusion Transformer架构,这一架构提出3个月后,Sora采用的同源基础架构DiT的论文才发表。
其团队2023年3月在全球首发并开源基于U-ViT架构的多模态大模型UniDiffuser,5月提出文生3D新算法Prolific Dreamer,今年1月发布4D框架Animatable Dreamer并实现可生成4秒视频的文生视频模型。今日发布的原创自研U-ViT视频大模型Vidu,进一步将视频时长增加到16秒。
朱军认为其快速突破离不开5个要素:算法原理、模型架构、算力资源、数据治理、工程实现。
六、全球首个低碳、高性能、低幻觉开源多语言大模型Tele-FLM发布
智源研究院理事长黄铁军与中国电信首席技术官、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙发布了由北京智源人工智能研究院与TeleAI联合研发的全球首个低碳、高性能开源多语言大模型Tele-FLM,并预告接下来将发布千亿、6000亿、万亿参数大语言模型。
Tele-FLM拥有520亿参数,支持全球80%以上的主流语言,有3大特色:
1、低碳。损失预测技术保障训练0调整0重试。据Meta官网信息,Llama 3训练可能用了超过49152张H100,而Tele-FLM训练仅用到896张A800。
2、高性能。在多轮角色、多轮安全、安全测试、幻觉测试、闲聊问答等多维度能力测评结果超过GPT-3.5 Turbo。重视中文数据质量而不是数量,Tele-FLM在基础模型评测中取得了领先的效果,BPB loss指标在英文上优于Llama 2-70B和Llama 3-8B,在中文上优于Qwen 1.5-72B。
3、全面开源。核心技术(生长策略、超参搜索、稳定训练……),模型权重(基础模型、对话模型),训练细节(超参搜索曲线、Loss曲线、GradNorm、过程评测……)全开源。
七、通用人工智能四大科研成果发布
在通用人工智能论坛上,北京通用人工智能研究院发布4项科研成果:
1、通用人工智能大任务仿真平台(TongSIM),拥有虚拟环境构建、物理及因果逻辑仿真以及智能体环境感知等功能特性,能够为通用智能体提供丰富的任务训练环境,并支持对通用智能体的智能能力进行全面的测试。
2、通用智能人“通通”(LittleGirl),全球首个通用智能体,区别于数据驱动的AI,以价值和因果驱动,能够根据自己的“价值观”做出可解释的决策,而不是简单地执行预设的程序。其日常训练使用不超过10块A100芯片。
3、通用人工智能评级标准与测试平台“通智测试”(TongTest),为评估通用智能体智能水平而设计的综合测试系统。根据TongTest对“通通”的阶段性测试,与人类儿童对比,在复杂动态场景中,“通通”处理复杂任务的能力和价值与人类3-4岁儿童相当。
4、通用人工智能科研平台“通境”(TongVerse),为具身智能提供安全、可控的仿真环境,让机器人在面对真实世界挑战前得以充分准备和训练。
八、中关村人工智能产业联盟发起成立,启动通用人工智能产业创新生态计划
在未来人工智能先锋论坛期间,中关村人工智能产业联盟发起成立。联盟成员包括北京通用人工智能研究院、中国信通院、北京大学、清华大学、中国人民大学、中国科学院自动化研究所、智源研究院、海天瑞声、智谱AI、腾讯、中国中车、百度、百川智能、中关村科学城公司等上百家高校、机构。
通用人工智能论坛正式启动通用人工智能产业创新生态计划,将基于北京通用人工智能研究院的系列科研成果和产业转化实践,以通用智能体技术为核心,构建产业链、创新链、资金链、人才链四链融合的产业生态,推动AI+新质生产力发展。
据北京通用人工智能研究院常务副院长董乐介绍,通用人工智能产业创新生态将聚焦应急、交通、教育、康养、制造、政务六大业务领域,以通用智能人“通通”为核心技术底座,联合生态企业共建垂直领域智能体,加速通用人工智能技术创新的产业转化。
基于此,北京通用人工智能研究院分别与神州信息、中国联通智慧足迹、南网数企、千方科技研究院、暗物智能等产业智能体创新伙伴,以及伟仕佳杰、智子引擎、北京数道智算、拓维信息、爱动超越等场景创新伙伴举行签约仪式,共同推动通用人工智能的产业应用。
北京通用人工智能研究院还联合北京大学、清华大学,支持建立北京大学通用人工智能实验班和清华大学通用人工智能因材施教计划。由北京通用人工智能研究院牵头与北大、浙大、上海交大等多所高校开展博士研究生联合培养工作——通用人工智能协同攻关合作体人才培养计划。
九、顶级学术大牛群星璀璨,百度蚂蚁微软分享前沿AI实践
在主题报告环节,来自全球产学研领域的顶级人工智能学术专家和产业领袖将分享前沿的技术动态、深刻的行业洞察和宝贵的实践经验。
北京大学教授、中国科学院院士鄂维南以《新一代AI与科学应用》为题发表演讲,重点分享了大模型和大数据库双轮驱动的AI方法,强调训练大模型的核心技术困难之一在于数据处理,“非结构化数据”处理是机器学习方法的一大主要难题,如果将所有的数据都放在一张表格里,机器学习的门槛就会大大降低,因此必须建立高效率、高性能的数据处理系统。
MyScale数据库是国际第一个AI数据库,也是目前综合性能最好、功能最强的AI数据库,同时在数据管理和向量查询性能上领先。鄂维南分享了小模型+AI数据库的技术路线:AI数据库+模型库和模型生产平台+模型操作系统。
大预训练模型大大提升了基础AI能力,大模型不能“一杆子捅到底”,需要Agents来实现具体任务。对此,鄂维南谈道,只需在原来的框架下稍作改动,把小模型改成Agents,把模型生产平台改成以预训练模型为基座,就能打造大模型+大数据库结合的Agent平台。
中国工程院院士、清华大学信息科学技术学院院长戴琼海以《光电智能计算》为题发表演讲。他首先提到算力需求暴涨带来的能耗压力:十年内,大模型计算预计将消耗我国年发电量的5%-10%。新型计算架构是人工智能算力优化与创新的主要路径之一,其中光电智能计算具备高算力低功耗的特性,能够加速AI大模型训练与推理。
光电智能计算有望对当代计算的速度、能量效率、数据通量实现变革,能实现速度千倍提升、能效百万倍提升,将AlphaGo整体计算耗煤量从1吨降低到1克。清华大学提出光电混合全模拟智能计算架构,研制ACCEL芯片,突破光电模数转换瓶颈。相比A100,ACCEL系统级算力提升3个数量级,能效提升6个数量级(百万倍)。相关论文去年发表于国际顶级学术期刊Nature。
此外,清华大学还研发大规模智能光计算芯片“太极”,提出干涉-衍射融合计算架构,构建智能光计算传播模型,刻画深度光网络规模极限,用“广度”光神经网络来支撑复杂智能任务,算力能效达到160TOPS/W,可支撑百亿像素大场景光速智能分析、百亿参数大模型训练推理。相关论文今年发表于国际顶级学术期刊Science。
百度CTO王海峰以《文心加飞桨,翩然赴星河》为题发表演讲。他认为智能体是大模型的重要发展方向,将带来更多应用的爆发,智能体的思考模型像人一样,会阅读说明书,学习工具的使用方法,进而可以调用工具来完成任务。比如百度代码智能体使得人人都可以成为程序员,百度智能代码助手能帮助专业程序员编程更高效。
飞桨是我国首个自主研发的产业级深度学习开源开放平台,通过与文心大模型协同优化,文心大模型的周均训练有效率达到98.8%,相比一年前文心一言发布时,训练效率提升到当时的5.1倍,推理性能提高至当时的105倍。飞桨加文心生态已集聚1295万开发者,服务24.4万家企事业单位,创建89.5万个模型。
蚂蚁集团CTO何征宇以《从智能涌现到应用涌现:让AI人人可得》为题发表演讲。他认为“AI产业落地、实现人人可得”有3个核心问题:可靠性,经济性,易用性。可靠性的终局是如何控制和对齐比我们聪明得多的模型,要用AI监督AI;经济性决定了大模型应用能否成为主流,需将大模型做“小”;易用性决定了AIGC产业应用有多广,因此智能化需要“傻瓜式”,持续降门槛。
他也分享了蚂蚁集团针对这3个问题的一些实践案例,比如蚁天鉴AI安全监测与防控加固平台助力蚂蚁理财管家大模型在金融领域可信评估中全面超越通用大模型,支付宝智能助理压缩出1B单侧“小”模型以支持手机本地推理计算,蚂蚁集团绿色通算与万卡异构集群智算技术面向行业开源开放,CoDeF实现视频二次加工所见即所得,Codefuse对话式编程机器人让人人都可以成为工程师。
微软全球资深副总裁、Microsoft AI亚太区总裁张祺以《微软Copilot:新一代人工智能副驾》为题发表演讲。他认为在AI大航海时代,人人都将拥有自己的Copilot,微软一方面通过Copilot的产品形态,将AI能力赋予微软自身的核心产品;另一方面,通过Copilot Stack,将Copilot智能副驾的全栈能力,辐射给整个行业。
“仅是去年一年里,微软发布的新产品和服务比以往十年都要多。”张祺说,微软之所以能以更快的创新频率实现AI相关产品的密集发布和快速更新,归功于其率先在公司内部进行了Copilot的大规模部署和全员应用。今年微软与生态伙伴共同发布的AI PC引发了很多关注,具备本地大模型算力、AI友好的硬件架构和软件环境,并在键盘上增加了全新的AI功能按键“Copilot”。
▲微软全球资深副总裁、Microsoft AI亚太区总裁张祺
张祺还特别强调了“单人创业家”理念,例如其团队有一位没有编程背景的产品经理,短短7天内用“智能副驾”构建了一个具有搜索定位和长期记忆功能的iOS语音聊天应用。他认为新的用户界面、强大的推理引擎这两大技术突破结合,定义了AI新时代。看向未来,接下来的探索将涉及3个关键方向:认知智能、具身智能、科学智能。
远期人工智能研究中心主任曾毅以《以人工智能能力建设推进可持续发展与国际治理》为题发表演讲,他强调人工智能的能力建设关乎全球共享和受益于人工智能带来的发展机遇,应尽可能采用绿色能源和低碳高效的人工智能技术,并注重对劳动就业的潜在影响。
曾毅总结说,人类与世界可以被人工智能辅助而不是被导向,负责任、稳步地发展与适度使用,使人工智能赋能人类与生态发展的未来。
在通用人工智能论坛上,北京通用人工智能研究院院长,北京大学智能学院院长、人工智能研究院院长,清华大学讲席教授朱松纯发表了主题为《迈向通用人工智能》的演讲。他谈到通用人工智能研究的目标是寻求一个统一的理论框架来解释各种智能现象,并研发具备自主的感知、认知、决策、学习、执行、社会协作等能力,且符合人类情感、伦理与道德观念的通用智能体。
朱松纯认为,通用智能体需具备完成无限任务、自主定义任务、由价值驱动三个基本特征,同时需解决认知架构、价值驱动、具身智能、社会智能、可解释性、人机互信等重要问题。在他看来,迈向通用人工智能的关键在于“为机器立心”,人类针对各种问题进化出的强大心智和价值体系才是最重要的,相比数据与理论,价值与“心”才是“活”的,是自主智能的源头活水。
十、三大圆桌对话,围绕具身智能与人工智能科学治理,头部创业代表与学术大牛齐聚
在未来人工智能先锋论坛圆桌对话环节,由智源研究院院长王仲远主持,7位国内具身智能领域代表性的创业者及研发负责人同台输出对具身智能的发展思辨。
7位嘉宾分别是星动纪元创始人陈建宇,傅利叶智能创始人兼CEO顾捷,智元机器人联合创始人、上海人工智能研究院院长宋海涛,银河通用机器人创始人、智源具身智能研究中心负责人王鹤,宇树科技创始人兼CEO王兴兴,小米机器人团队负责人许多,ACM会士李航。
讨论的核心议题包括数字世界中是否有可能实现通用人工智能,以及具身智能兴起的意义、重要特征与系统性工程、与AI智能体如何协同、研发与工程挑战、仿真数据与现实数据两种路线、技术发展与产业应用等。最后7位嘉宾们分别给研究具身智能的学生、青年学者和工程师分享了一些建议。智东西将在后续发布深度报道文章。
通用人工智能论坛有两个圆桌对话,主题分别是“通用人工智能的产业创新实践”和“人工智能科学治理”。
“通用人工智能的产业创新实践”圆桌论坛由北京通用人工智能研究院常务副院长董乐主持,与神州信息副总裁、信创BG总裁闫光明,中信建投证券高级副总裁程楠,千方科技研究院副院长冉学均,智子引擎首席科学家卢志武,爱动超越创始人邓海勤,暗物智能副总裁苏江六位嘉宾展开高峰对话,围绕建立开放协同的产业生态系统,探讨跨领域合作及创新商业模式和应用场景的范式。
“人工智能科学治理”圆桌对话由安远AI创始人兼CEO谢旻希主持,北京大学人工智能研究院AI安全与治理中心主任张平,北京通用人工智能研究院研究员綦思源等五位嘉宾推动技术创新与伦理道德的平衡、建立有效的风险评估和应对机制,提升人工智能安全治理能力,确保人工智能健康有序安全发展等观点。
结语:海淀已成为全国通用人工智能与具身智能发展排头兵
在迈向通用人工智能和具身智能等前沿方向,海淀区是国内人工智能领域创新基础最好、人才资源最集中、研发创新能力最强、产品迭代最活跃的地区,在企业数量、数据要素资源、产业链和算力建设等方面,走在北京市乃至全国前列。
在科研方面,海淀区拥有3家新型研发机构、14家国家重点实验室、21所人工智能本科高校、全球AI高校前十(清华、北大、人大)。
在人才方面,海淀区拥有1.23万位人工智能学者(占全市超80%),89位AI2000全球顶尖学者(占全市超70%)。
在产业方面,海淀区汇集了1300家人工智能企业(占全市约70%)、20家独角兽企业(占全市约60%)、超90家大模型相关单位、37款通过备案的大模型(占全市总量70%)以上。
海淀区率先扛起人工智能大旗,统筹推动算力供给、大模型落地、数据支撑、场景应用、生态完善,做强新质生产力引擎,加快建设具有全球影响力的人工智能创新策源地和人工智能产业高地。
据介绍,海淀区将持续深化中关村先行先试改革,为人工智能创新主体提供全方位、一站式服务,强化要素资源集中供给,突出政策匹配支撑,推动制度创新和监管创新,形成资本、空间等全面保障的开放创新生态,以人工智能占先发展引领高质量发展,切实当好新时代首都高质量发展排头兵、新质生产力示范区。