ChatGPT测试上传文件功能；百川推出192K长文本大模型；通义千问App安卓版上线丨AIGC大事日报

1、ChatGPT测试新版本可上传文件和自动切换模式

2、昆仑万维开源”天工”Skywork-13B系列大模型

3、百川智能推出192K大模型可处理35万汉字

4、智子引擎发布多模态大模型元乘象Chatimg3.0

5、阿里云通义千问App上线安卓应用市场

6、智谱AI面向全球大模型创业者开启“Z计划”

7、万兴科技发布AI视频创作软件Filmora 13

8、全国AGI行业产教融合共同体在北京门头沟成立

9、七国集团或就企业AI系统开发行为准则达成一致

10、苹果前员工创企下月发布智能设备内置ChatGPT

11、苹果研究团队提出俄罗斯套娃式扩散模型MDM

12、中科大等提出大模型免重训架构幻觉降低30%

13、英伟达等提出机器人自主数据生成系统MimicGen

14、斯坦福等提出新的Transformer替代技术

15、传谷歌要向Anthropic投资20亿美元

16、交通安全AI企业卓视智通获数千万Pre-B+轮融资

17、优刻得与中贝通信达成合作推进智算中心建设

1、ChatGPT测试新版本可上传文件和自动切换模式

据外媒The Verge援引社交平台Threads博主@luokai消息报道，OpenAI正在测试新版本ChatGPT并逐步向Plus用户推出。新版本主要更新了上传文件、多模式支持两大能力，用户可以直接上传PDF等文件，且不再需要选择ChatGPT模式，它会根据对话中的描述自动选择启动Web浏览器、运行Python代码或使用DALL-E生成图像等模式。

2、昆仑万维开源”天工”Skywork-13B系列大模型

据昆仑万维集团微信公众号发文，今日，昆仑万维宣布开源百亿级大语言模型“天工”Skywork-13B系列，并即将全面开放商用，还配套开源了600GB、150B Tokens的高质量开源中文数据集Skypile/Chinese-Web-Text-150B。据介绍，昆仑万维“天工”Skywork-13B系列目前包括130亿参数的两大模型：Skywork-13B-Base模型、Skywork-13B-Math模型，在CEVAL、GSM8K等多个权威评测与基准测试上的中文能力表现较为出色，在中文科技、金融、政务等领域表现均高于其他开源模型。

Skywork-13B下载地址：

https://modelscope.cn/organization/skywork

https://github.com/SkyworkAI/Skywork

3、百川智能推出192K大模型可处理35万汉字

今日，百川智能发布Baichuan2-192K大模型。其上下文窗口长度达192K，是目前全球最长的上下文窗口，能够处理约35万个汉字，是目前支持长上下文窗口最优秀大模型Claude2（支持100K上下文窗口，实测约8万字）的4.4倍，GPT-4（支持32K上下文窗口，实测约2.5万字）的14倍。据悉，Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10项中英文长文本问答、摘要的评测集上有7项取得SOTA。目前，百川智能已开启Baichuan2-192K内测，将以API调用和私有化部署的方式提供给法律、媒体、金融等行业的核心合作伙伴。

4、智子引擎发布多模态大模型元乘象Chatimg3.0

据元乘象微信公众号发文，10月28日，AI创企智子引擎发布超精细识别、少幻觉的多模态大模型“元乘象Chatimg3.0”，支持多图理解、物体定位、OCR等功能。与Chatimg2.0相比，Chatimg3.0主要升级了两个方面，包括第一阶段的预训练（描述、检测、OCR等多任务训练）以及第二阶段的指令微调（高质量的人工精筛指令集）。据称，Chatimg3.0在问答和业务两个方面的能力上赶超GPT-4V，目前已应用于全域防控和无人机巡检等领域，实现了AI缺陷识别、异常检测、行为分析、重点监控、自主巡查、风险预测等功能。

体验地址：

https://www.chatimg.cn/pages/chatroom/chatroom

5、阿里云通义千问App上线安卓应用市场

据IT之家报道，近日，阿里云旗下大模型通义千问App上架各大安卓应用市场，版本号为1.0.2。应用介绍显示，通义千问是一款超大规模预训练模型，能够在创意文案、办公助理、学习助手、趣味生活等多个方面为用户提供全方位的协助。目前，安卓用户可下载安装App并通过手机号注册体验。

6、智谱AI面向全球大模型创业者开启“Z计划”

据智谱微信公众号今日发文，智谱AI“Z计划”面向全球大模型创业者开启招募。该计划面向原则上成立五年内的未上市初创企业以及优秀独立开发者或团队，面向AI大模型领域或利用AI大模型技术改造升级的任何行业或场景，提供投资和技术支持，申请者不要求一定采用智谱AI大模型。同时，智谱AI也将联合生态伙伴提供入围者扩展大规模业务所需要的低成本、易用型相关基础设施。

7、万兴科技发布AI视频创作软件Filmora 13

据万兴科技微信公众号发文，10月29日，万兴科技发布AI视频创作软件Wondershare Filmora 13。据介绍，Wondershare Filmora 13内置创作助手Copilot，可根据自然语言提供创作建议和指导。Wondershare Filmora 13还上线了AI文本成片、AI音乐生成器等AI生成功能，以及AI文字快剪、智能人声分离、AI智能遮罩等AI智能编辑功能，支持用户在手机端、平板端、PC端之间共享文件、逐帧审阅视频和自动同步编辑元素。面向国内市场，万兴科技多端同步升级了“万兴喵影2024”，在国内率先上线AI文字快剪、智能人声分离、AI智能遮罩、AI智能补帧等AI创作功能。

8、全国AGI行业产教融合共同体在北京门头沟成立

据北京门头沟微信公众号昨日发文，10月28日，全国通用人工智能（AGI）行业产教融合共同体在京成立，由中关村科技园区门头沟园管理委员会、北京航空航天大学、中国电子技术标准化研究院、北京工业职业技术学院等单位联合发起成立，共有25个省份超过200个机构参加，该共同体将围绕“一体、两翼、五重点”，推动校企联合科研创新。

9、七国集团或就企业AI系统开发行为准则达成一致

据路透社报道，路透社看到的一份七国集团（G7）文件显示，G7将于当地时间周一就开发先进AI系统的公司的行为准则达成一致，各国政府正寻求降低该技术的风险和潜在滥用。文件显示，在隐私问题和安全风险的背景下，这份包含11点的自愿行为准则“旨在促进全球范围内安全、可靠和可信的AI，并将为开发最先进AI系统（包括最先进的基础模型和生成式AI系统）的组织提供自愿行动指南”。

10、苹果前员工创企下月发布智能设备内置ChatGPT

据外媒The Information报道，苹果前员工成立的创企Humane将在11月9日发布首款可穿戴设备Ai Pin，内置ChatGPT。据透露，Ai Pin是一款小型无屏幕设备，大小与一块饼干差不多，配备摄像头、麦克风和扬声器，以及各种传感器和激光投影仪，可通过磁铁吸附在衣服上。据熟悉该公司计划的消息人士称，Ai Pin预计售价为1000美元，并且需要每月订阅数据。

Humane由苹果前设计总监Imran Chaudhri和前软件工程总监Bethany Bongiorno于2018年创立，宣称将通过创新计算方式，探索更理想的人机交互体验，并暗示在开发某种穿戴式AR设备。

11、苹果研究团队提出俄罗斯套娃式扩散模型MDM

据机器之心报道，10月23日，苹果研究团队提出俄罗斯套娃式扩散模型（Matryoshka Diffusion Models，MDM），用于端到端高分辨率图像生成。该研究提出的主要观点是将低分辨率扩散过程作为高分辨率生成的一部分，通过使用嵌套UNet架构在多个分辨率上执行联合扩散过程，可以训练分辨率达1024×1024像素的单像素空间模型。

论文地址：

https://arxiv.org/pdf/2310.15111.pdf

12、中科大等提出大模型免重训架构幻觉降低30%

据量子位报道，10月24日，中科大和腾讯优图实验室研究人员合作发表了一篇论文，提出一个免重训、即插即用的通用架构“啄木鸟”（Woodpecker），直接从模型给出的错误文本下手，“倒推”出可能出现“幻觉”之处，然后与图片确定事实，最终直接完成修正。据悉，该架构是业内第一个无需重新训练模型就能解决“幻觉”的全新办法，成功将MiniGPT-4的准确性从54.67%提高到了85.33%，将mPLUG Ow的准确性从62%提到了86.33%。

Woopecker论文地址：

https://arxiv.org/abs/2310.16045

Woopecker代码地址：

https://github.com/BradyFU/Woodpecker

13、英伟达等提出机器人自主数据生成系统MimicGen

据《科创板日报》报道，10月26日，英伟达与得克萨斯大学奥斯汀分校发表论文，提出一个名为“MimicGen”的系统，该系统只需少量人类示范，便能自动生成大规模的机器人训练数据集。研究团队称，利用MimicGen，他们从不到200个人类演示中自动生成了超过50000个演示，涉及18个任务、多个模拟器和现实世界。

项目主页：

https://mimicgen.github.io/

论文地址：

https://arxiv.org/abs/2310.17596

14、斯坦福等提出新的Transformer替代技术

据机器之心昨日报道，斯坦福大学和纽约州立大学布法罗分校的一个研究团队近日发布了一篇论文，提出Transformer的替代技术Monarch Mixer，并公开了一些检查点模型及训练代码。该方法去掉了Transformer中高成本的注意力和MLP，代之以富有表现力的Monarch矩阵，使之在语言和图像实验中以更低的成本取得了更优的表现。

论文地址：

https://arxiv.org/abs/2310.12109

代码地址：

https://github.com/HazyResearch/m2

15、传谷歌要向Anthropic投资20亿美元

据华尔街日报援引知情人士爆料，谷歌近日已承诺向OpenAI的对手Anthropic提供20亿美元资金。知情人士说，谷歌向其预先投资了5亿美元，并同意随着之后再逐渐增资15亿美元。Anthropic由前OpenAI工程师于2021年创立，目标是开发与OpenAI竞争的生成式AI模型。此前10月17日，Anthropic于社交平台X上宣布向全球95个国家或地区的用户提供Claude大模型的访问权限。9月25日，亚马逊与Anthropic宣布达成战略合作，亚马逊称将向Anthropic投资至多40亿美元，并拥有该公司的少数股权。

16、交通安全AI企业卓视智通获数千万Pre-B+轮融资

据36氪今日报道，北京卓视智通科技有限责任公司已完成数千万元Pre-B+轮融资，由中交资本、腾飞资本联合投资。所融资金将主要用于市场拓展、AI大模型等技术研发、AI训练平台建设，以及智能制造生产基地的升级扩容。据悉，卓视智通成立于2012年，是一家基于AI的视频融合感知及车路协同解决方案提供商，专注于车脸识别、行人识别、交通场景识别、交通视频分析、大数据技术等前沿技术研发。

17、优刻得与中贝通信达成合作推进智算中心建设

据UCloud云计算微信公众号昨日发文，近日，UCloud优刻得与中贝通信签署战略合作协议，双方将以云计算、大数据、AI等技术为核心数智化能力，共同推进智算中心及算力集群运维平台建设。未来双方将加强在东数西算和超算、智算与算力网络等关键技术合作，共同打造高性能智算中心，联合完成科技项目申报，推动国家级算力基础设施建设。此外，双方还将共同推进国产智算集群合作，为生成式AI行业大模型厂家提供算力服务，为政府及企事业单位提供信创私有云解决方案等。

相关推荐