苹果或采用OpenAI大模型;国产类Sora复现方案开源;国内首个AI导演上岗;丨AIGC大事日报

1、马斯克Grok大模型开源 参数量3410亿

2、苹果谷歌和OpenAI商谈iPhone大模型使用

3、苹果新研究提升服务大模型效率

4、Open-Sora视频生成模型开源

5、AI程序员代码能力超Claude 2

6、月之暗面智能助手支持200万字上下文

7、斯坦福新研究提升大模型长视频理解能力

8、高通手机芯片支持100亿参数大模型

9、国内首个AI导演上岗

10、赛迪四川发布中国AI大模型20强报告

11、OpenAI CTO说不知道Sora训练数据出处

12、阿联酋AI投资公司考虑支持OpenAI万亿芯片计划

1、马斯克Grok大模型开源 参数量3410亿

今天,马斯克的AI创企xAI正式发布了大模型Grok-1,其参数量达到了3140亿,超过OpenAI GPT-3.5的1750亿。这是迄今参数量最大的开源大语言模型,遵照Apache 2.0协议开放模型权重和架构。Grok-1是一个混合专家(Mixture-of-Experts,MoE)大模型。xAI称这是他们自己从头训练的大模型,Grok-1没有针对特定应用进行微调。

2、苹果谷歌和OpenAI商谈iPhone大模型使用

今天,据彭博社报道,有知情人士称,苹果公司正在与谷歌进行谈判,希望将谷歌的Gemini大模型能力应用在iPhone中,以支持今年iPhone即将增加的各类生成式AI功能。彭博社记者马克·古尔曼认为,这将是一项重大的协议,可能会撼动整个AI行业。该报道还提到,苹果最近与OpenAI进行了讨论,考虑使用其大模型。

3、苹果新研究提升服务大模型效率

3月14日,苹果研究人员发布论文,推出了一种用于大型语言模型中快速推测解码的Recurrent Drafter,这种改进后的推测解码方法可以提高服务大型语言模型的效率。Recurrent Drafter利用了双模型推测解码方法和单模型方法Medusa。研究人员通过实验证明了这种方法在几个主流开源大型语言模型上的有效性。

论文地址:

https://arxiv.org/pdf/2403.09919.pdf

HuggingFace地址:

https://huggingface.co/papers/2403.09919

4、Open-Sora视频生成模型开源

3月18日凌晨,潞晨科技创始人尤洋教授在X平台发文,潞晨科技旗下Colossal-AI团队开源了其Open-Sora 1.0视频生成模型,包括模型权重、训练源代码和详细的架构。该模型采用了Diffusion Transformer(DiT)架构。据了解,团队以使用了DiT架构的开源文生图模型PixArt-α为基础,引入了时间注意力层,并将其扩展到了视频数据上。

GitHub地址:

https://github.com/hpcaitech/Open-Sora

5、AI程序员代码能力超Claude 2

3月15日,AI创企Cognition对其团队发布的首个AI软件工程师Devin进行了技术解读,发布了关于Devin的SWE-bench基准测试技术报告。SWE-bench可以评估系统解决现实中代码库问题的能力。测试结果显示,Devin不需要人类辅助就可以解决570个问题中的79个问题,成功率为13.86%,高于SOTA 大模型(Claude 2)的4.80%。

GitHub地址:

https://github.com/CognitionAI/devin-swebench-results

6、月之暗面智能助手支持200万字上下文

今天,AI创企月之暗面(Moonshot AI)宣布其智能助手Kimi在长上下文窗口技术上取得突破,无损上下文长度提升至200万字。今天起,支持200万字上下文的Kimi已启动内测。据称,基于新版Kimi,用户上传几十万字的经典德州扑克长篇教程后,Kimi可以扮演德扑专家为用户提供出牌策略的指导。

7、斯坦福新研究提升大模型长视频理解能力

3月15日,斯坦福研究人员发布论文,推出了一种基于代理(Agent)的系统——VideoAgent,其将大型语言模型作为中央代理,迭代地识别和编译关键信息以回答问题,同时利用视觉语言基础模型作为翻译和检索视觉信息的工具。在EgoSchema和NExT-QA基准测试中,VideoAgent在零样本准确率上分别达到了54.1%和71.3%,平均仅使用了8.4和8.2帧。研究人员称,该测试结果表明该方法在效果和效率上优于当前最先进的方法,在提升长篇视频理解方面有应用潜力。

论文地址:

https://arxiv.org/pdf/2403.10517.pdf

GitHub地址:

https://wxh1996.github.io/VideoAgent-Website/

8、高通手机芯片支持100亿参数大模型

今天,高通正式发布了第三代骁龙8s芯片,其在端侧生成式AI能力方面进行了重点升级,支持Baichuan-7B、Gemini Nano、Llama 2和智谱ChatGLM等30多个大型语言模型和大型视觉模型,据称最高支持模型参数量为100亿。

9、国内首个AI导演上岗

据上海证券报报道,3月15日,湖南广电集团首个AI导演爱芒(英文名AIM)正式以助理导演的身份和观众、网友们见面。这也是国内首个正式上岗的AI导演。3月17日午间,该综艺超前企划播出,爱芒正式亮相。《声生不息》系列制片人洪啸说:“AI导演会倒逼着我们不断地去创新。”

10、赛迪四川发布中国AI大模型20强报告

智东西3月17日消息,3月15上午,赛迪工业和信息化研究院(集团)四川有限公司发布了《2024中国人工智能多模态大模型企业综合竞争力20强研究报告》,腾讯混元大模型排名第一、科大讯飞星火大模型排名第二、阿里巴巴通义千问排名第三、华为盘古大模型排名第四、智谱华章智普清言排名第五。

据称此次评价研究通过建立覆盖经济、技术、行业、商业等多维度指标的企业竞争力评价模型,对我国人工智能自研多模态大模型企业实力进行综合评估,最终形成人工智能多模态大模型企业综合竞争力20强评价结果。其评价体系包括经济抗衡力(15%)、行业影响力(30%)、技术竞争力(40%)、商业角逐力(15%)。

11、OpenAI CTO说不知道Sora训练数据出处

智东西3月17日消息,3月14日,《华尔街日报》记者Joanna Stern采访了OpenAI首席技术官Mira Murati,针对一段Sora生成的虚拟视频进行了讨论,Mira Murati解释了Sora的工作原理,但是回避了大部分有关该模型训练数据来源的问题,甚至在回答中出现了“我其实不太确定(I’m actually not sure about that)”的说法。

12、阿联酋AI投资公司考虑支持OpenAI万亿芯片计划

智东西3月17日消息,据英国《金融时报》报道,阿联酋阿布扎比一家由国家资助的投资公司MGX正在和OpenAI谈判,讨论支持此前由OpenAI CEO Sam Altman提出的“万亿芯片计划”。报道称,MGX 是一家今年1月刚刚成立的专注于AI的投资公司,代表了阿联酋希望在全球AI竞赛中实现领先的关键布局。