百度腾讯推出视频生成模型;传美团AI视觉中心负责人离职;微软研究院回应关闭传言丨AIGC大事日报

1、Meta重组两大AI部门,正研发Llama 3

2、微软研究院回应关闭传言

3、Runway推出多头运动笔刷

4、夸克App上线“元知”、“听记”等AI应用

5、腾讯发布视频生成模型VideoCrafter2

6、百度发布视频生成模型UniVG

7、国内首个网络安全大模型评测平台发布

8、讯飞1月30日发布星火大模型V3.5

9、传美团AI平台视觉中心负责人魏晓林离职

10、智源等提出视觉版Mamba方法Vim

11、成都发布AI新政 最高奖励1000万元

12、TikTok内测AI生成歌曲功能

13、韩国Kakao推出多模态大模型Honeybee

14、Rabbit宣布与AI搜索引擎Perplexity合作

1、Meta重组两大AI部门,正研发Llama 3

今日,Meta CEO马克·扎克伯格(Mark Zuckerberg)于社交平台Instagram发布视频,宣布将两个主要的AI研究部门FAIR和生成式AI团队重组,它们将“更紧密地结合”以支持开源AGI的长期目标。Meta目前正在训练下一代模型Llama 3,并且正在构建大规模的计算基础设施,到今年年底将达到35万个H100,算上其他GPU则总共拥有近60万个H100的等效算力。同时,Meta在AI驱动的计算设备方面很快会有更多进展。

2、微软研究院回应关闭传言

据界面新闻报道,针对微软计划关闭微软亚洲研究院的传闻,微软全球资深副总裁、微软研究院负责人Peter Lee昨日回应称,目前没有关于关闭微软亚洲研究院的讨论或主张,“我们一如既往地支持微软亚洲研究院及其世界级的研究工作,对未来的研究计划充满期待。”微软公司总裁兼董事会副主席Brad Smith则强调:“历史的经验表明,从世界范围内汲取思想才能够获得成功。‘护栏’与‘把控’固然重要,而‘参与’的重要性同样不容忽视。”此外据了解,微软研究院也在温哥华成立了新的研究中心,并在持续扩招人才。

3、Runway推出多头运动笔刷

昨日晚间,AI视频创企Runway宣布Gen-2模型中的运动笔刷(Motion Brush)功能升级为多头运动笔刷(Multi Motion Brush),可以独立控制视频中多个区域的运动,让不同的物体、内容分别运动。该功能在免费帐户中也提供体验。

体验地址:runwayml.com

4、夸克App上线“元知”、“听记”等AI应用

今日,夸克App基于自研大模型能力升级多个功能板块和智能工具,推出搜索问答产品“元知”,上线夸克PC版以及夸克“听记”等新产品。用户可在“元知”搜索结果中,查看生成式AI总结提炼出的回答内容,包含图文、视频等多种形式。夸克“听记”用于音视频内容整理,支持中、英、粤等主流语言和方言,语音笔记可以在夸克多端同步保存。夸克网盘提供AI自然语言搜索功能,输入简单描述词就能快速找到照片、图片、文档等资料,夸克网盘播放器能够自动生成AI字幕,实现视频转文字以及导出视频中的PPT。

5、腾讯发布视频生成模型VideoCrafter2

昨日,腾讯AI实验室发布了视频生成模型VideoCrafter2,相关论文同日发表在arXiv。该模型研究了利用低质量视频和合成高质量图像获得高质量视频模型的可行性,通过使用高质量图像对空间模块进行微调,在不降低运动质量的情况下,将分布转移到更高质量的视频上,克服了高质量视频扩散模型的数据限制。

项目主页:

ailab-cvc.github.io/videocrafter2

论文地址:

arxiv.org/pdf/2401.09084.pdf

Demo试用:

discord.gg/RQENrunu92

6、百度发布视频生成模型UniVG

昨日,来自百度的团队发布了视频生成模型UniVG,这是一种统一模式视频生成系统,能够以文本和图像的任意组合作为输入。团队将系统内视频生成模型的多个任务,重新划分为高自由度生成和低自由度生成两类,并针对不同自由度采用不同的生成方式。

项目主页:

univg-baidu.github.io

论文地址:

arxiv.org/pdf/2401.09084.pdf

7、国内首个网络安全大模型评测平台发布

业界首个网络安全大模型评测平台SecBenc今日正式发布,该平台由腾讯朱雀实验室和腾讯安全科恩实验室,联合腾讯混元大模型、清华大学江勇教授/夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室OpenCompass团队共同建设,主要解决开源大模型在网络安全应用中安全能力的评估难题,旨在为大模型在安全领域的落地应用选择基座模型提供参考,加速大模型落地进程;同时,通过建设安全大模型评测基准,为安全大模型研发提供公平、公正、客观、全面的评测能力,推动安全大模型建设。

8、讯飞1月30日发布星火大模型V3.5

科大讯飞今日在深交所互动易问答中透露,基于算力底座“飞星一号”平台的讯飞星火认知大模型V3.5目前已经完成训练,相比V3.0,在逻辑推理、文本生成、数学答题及小样本学习能力等方面大幅提升。科大讯飞将在1月30日下午2:00举办讯飞星火认知大模型V3.5升级发布会,在科大讯飞视频号等平台在线直播。

9、传美团AI平台视觉中心负责人魏晓林离职

据AI科技评论今日报道,现任美团AI平台视觉中心负责人魏晓林将离职,结束4年6个月的美团生涯。据悉,魏晓林深耕计算机视觉领域17年,在职期间,魏晓林制定了计算机视觉/AI战略和发展路线图,领导美团视觉中心开发AI系统。在魏晓林的带领下,美团AI平台视觉中心开发并部署了数千个AI API和SDK。他还组织研发了部署在美团自动配送车队、用于自动驾驶的高性能CV模型,以及美团地图街景自动处理和自动更新的管道。

10、智源等提出视觉版Mamba方法Vim

昨日,来自华中科技大学、地平线、智源研究院等机构的研究者提出了Vision Mamba(Vim),相关论文发表于arXiv。论文提出Vision Mamba块,结合了用于数据依赖的全局视觉上下文建模的双向SSM和用于位置感知视觉识别的位置嵌入。 据介绍,在对分辨率为1248×1248的图像进行批量推理时,Vim比成熟的视觉Transformer模型DeiT快2.8倍,并节省了86.8%的GPU内存。Mamba是去年12月推出的一种新架构,在语言任务上匹配Transformer性能,具有线性复杂度和5倍推理吞吐量。

项目主页:

github.com/hustvl/Vim

论文地址:

arxiv.org/pdf/2401.09417.pdf

11、成都发布AI新政 最高奖励1000万元

昨日,成都市经信局市新经济委等7部门联合印发《成都市进一步促进人工智能产业高质量发展的若干政策措施》,提出14条政策措施。《政策措施》提出,鼓励企业、科研机构研制AI开发框架,一次性给予最高250万元的资金补贴。对取得国家科技重大专项等成果并在蓉落地转化的,给予最高1000万元经费支持。支持AI企业上市融资,给予最高100万元奖励。

12、TikTok内测AI生成歌曲功能

据The Verge今日报道,海外版抖音TikTok正在测试AI生成歌曲功能AI Song,由大型语言模型Bloom提供支持。用户发布视频时在文本框中写下歌词,AI Song将会生成歌曲,并且用户可以切换歌曲的流派。

13、韩国Kakao推出多模态大模型Honeybee

据《韩国时报》报道,韩国科技巨头Kakao今日宣布,公司已开发出一种名为“蜜蜂”(Honeybee)的多模态大语言模型。据Kakao称,“蜜蜂”能够同时理解图像和文本,回复与图像和文本内容混合相关的咨询,该模型代码已在开源社区GitHub上发布。

14、Rabbit宣布与AI搜索引擎Perplexity合作

AI硬件创企Rabbit今日在社交平台X宣布与AI搜索引擎Perplexity合作,利用后者的技术增强rabbit OS的自然语言搜索功能,为所有AI硬件R1用户提供支持。Rabbit还宣布R1开启第6批共5万台预售,此前5批共5万台已售罄。