1、马斯克Grok正式开始向X订阅用户开放
2、ChatGPT:正在修复GPT-4的“懒惰”问题
3、OpenAI前董事成员:解雇阿尔特曼无关AI安全
4、Meta推出AI虚拟形象新方法 可重新照明
5、Meta推出AI图像生成器Imagine
6、Meta推出AI安全项目Purple Llama
7、英伟达AI研究高级总监离职
8、微软发布材料生成AI模型MatterGen
9、阿里自研夸克大模型通过备案
10、通义千问登顶Hugging Face开源大模型榜首
11、Stability AI发布30亿参数轻量模型
12、AMD推出旗舰数据中心AI芯片MI300X
13、IDC:预计明年中国市场AI终端占比将达55%
14、麦当劳与谷歌云达成合作 明年起部署生成式AI
15、思科推出AI安全助手
16、开发工具JetBrains全面推出AI助手
17、商汤自研编程助手代码小浣熊Raccoon公测
18、南科大联合IDEA发布34B对话模型
19、TCL华星发布全球首款半导体显示大模型
20、法律AI创企幂律智能获近8000万融资
21、创想数维获千万级Pre-A轮融资
1、马斯克Grok正式开始向X订阅用户开放
昨晚,马斯克于社交平台X发文,宣布AI聊天机器人Grok正在向X Premium+订阅者推出最新的应用程序版本。随后X官方账号今早发文,宣布在接下来的一周内,Grok的访问权限将陆续对美国的Premium+订阅用户开放。订阅时间越长,获得访问权限的时间就越早。用户可以在网页端或iOS和安卓的最新版本侧边菜单中找到Grok,其中在移动端上,用户可以将其添加到底部菜单以便轻松访问。
今天下午,马斯克又发文称,Grok AI测试版一开始会有很多问题,但预计几乎每天都会有快速改进,大约一周后将扩展到所有英语用户,其次是日语用户,希望在2024年初扩展到所有语言。
2、ChatGPT:正在修复GPT-4的“懒惰”问题
今日,ChatGPT在官方X账号上回应近日GPT-4变得“懒惰”的问题,称自11月11日以来从未更新模型,没有故意削弱,并称模型行为是不可预测的,团队正在研究修复它。大约一周前,有多名网友反馈,GPT-4疑似被削弱,在数学和代码方面回避请求,难以给出能正常运行的完整代码,而是告诉用户该如何去做,还把一些原本只需一个步骤的工作分解成多步。
3、OpenAI前董事成员:解雇阿尔特曼无关AI安全
据《华尔街日报》今日报道,OpenAI前董事会成员海伦·托纳(Helen Toner)在接受采访时坚称,解雇CEO萨姆·阿尔特曼(Sam Altman)的原因并非安全问题,而是由于缺乏信任。她认为,这一决定符合OpenAI董事会负责任地建设AI系统的职责。她没有透露具体原因,只是表示她和其他三名成员投票决定解雇阿尔特曼。在阿尔特曼被罢免之前,二者曾有过冲突。
4、Meta推出AI虚拟形象新方法 可重新照明
当地时间12月6日,来自Meta的研究团队发布了可重新照明的高斯编码头像(Relightable Gaussian Codec Avatars),是之前的编码头像2.0(Codec Avatars 2.0)的升级版。这是一种构建高保真可重新发光头部头像的方法,可以通过动画来生成新颖的表情,并在点光源和连续光源下高效地实时重照明。该方法基于3D高斯的几何模型,可以捕捉3D一致的亚毫米级细节,如动态面部序列上的发丝和毛孔。作者还在消费级VR头显上演示了虚拟形象的实时重照,展示了效率和保真度。
5、Meta推出AI图像生成器Imagine
昨日,Meta推出AI图像生成器Imagine,目前在美区免费开放。Imagine基于Meta的图像基础模型Emu构建,该模型使用11亿张公开的Facebook和Instagram图片来训练,可以根据文字提示渲染图像,每次生成都会创建四个1280×1280像素的图像,可以以JPEG格式保存,图像的左下角有一个“Imagined with AI”水印。
试用地址:imagine.meta.com
6、Meta推出AI安全项目Purple Llama
今日,Meta宣布推出Purple Llama项目,提供开放的信任与安全工具和评估,旨在为开发人员提供公平竞争的环境。作为项目的第一步,Meta发布了CyberSec Eval,这是一套用于大模型网络安全安全评估的基准。Meta还发布了Llama Guard,这是一个用于输入/输出过滤的安全分类器,优化了部署的便利性。
Meta解释了该项目为什么是“紫色”:要真正解决生成式AI带来的挑战,需要同时采取攻击(红队)和防御(蓝队)两种姿态。紫色团队由红队和蓝队共同负责,是一种评估和降低潜在风险的合作方式。
7、英伟达AI研究高级总监离职
今天凌晨,英伟达AI研究高级总监阿妮玛·阿南德库马尔(Anima Anandkumar)于社交平台X宣布从英伟达离职,专心开始新的工作,“我期待着根据对物理和科学的理解来扩展模型,从而加快实现 AGI 的进程。我将很快与大家分享更多信息,期待在下周的NeurIPS2023(第三十七届神经信息处理系统会议)大会上与大家见面。”
8、微软发布材料生成AI模型MatterGen
今天,微软研究院AI4Science高级研究员Tian Xie于社交平台X发布新论文,推出生成式AI模型MatterGen,用于广泛的属性引导材料设计。据介绍,MatterGen是一种扩散模型,专门用于生成新颖、稳定的材料,生成方式类似于DALL-E 3生成图像的方式。MatterGen生成的新颖独特结构比目前最先进的模型(CDVAE)稳定性高2.9倍,还能生成接近能量局部最小值17.5倍的结构。
论文地址:arxiv.org/pdf/2312.03687
9、阿里自研夸克大模型通过备案
阿里智能信息事业群自研的夸克大模型近日已通过备案。据悉,该模型将陆续在通识、健康、创作等领域升级内容产品与智能工具,并落地一系列AIGC创新应用。借助大模型的能力,夸克App将全面升级,帮助用户提升学习、工作、生活效率。
10、通义千问登顶Hugging Face开源大模型榜首
全球最大的开源大模型社区Hugging Face日前公布了最新的开源大模型排行榜,阿里云通义千问超越Llama 2等国内外开源大模型登顶榜首。Hugging Face的开源大模型排行榜是目前大模型领域最具权威性的榜单之一,收录了全球上百个开源大模型,测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等六大评测。其中,通义千问720亿参数的Qwen-72B模型以73.6的综合得分在所有预训练模型中排名第一。
11、Stability AI发布30亿参数轻量模型
今日,AI独角兽Stability AI推出30亿参数的聊天模型StableLM Zephyr 3B,可满足从简单查询到边缘设备上的复杂教学语境等各种文本生成需求。据介绍,该模型是StableLM 3B-4e1t模型的扩展,灵感来自HuggingFace的Zephyr 7B模型。该模型现已开源模型权重,允许在非商业许可下使用和发布。
开源地址:
huggingface.co/stabilityai/stable-zephyr-3b-dpo
12、AMD推出旗舰数据中心AI芯片MI300X
12月7日,芯片巨头AMD在Advancing AI活动上宣布推出旗舰数据中心AI芯片AMD Instinct MI300X GPU,并在多项硬件规格及大模型训推测试上与英伟达正面交锋。据介绍,MI300X在AI峰值性能、内存密度、内存带宽,这些关键硬件规格上均胜过英伟达旗舰AI芯片H100 GPU,能跑更大参数规模的大模型。
除了MI300X外,AMD还宣布推出结合最新AMD CDNA 3架构和“Zen 4”CPU的MI300A加速处理单元(APU),以及让笔记本电脑能够更轻松添加AI功能的Ryzen 8040系列移动处理器。此外,AMD剧透了Ryzen AI路线图,代号为“Strix Point”的下一代Ryzen AI CPU将在2024年出货,采用XDNA 2架构。XDNA 2架构的生成式AI NPU性能将提高到上一代的3倍以上。
软件方面,AMD发布了最新版本的ROCm 6开放软件堆栈,该堆栈针对生成式AI(尤其是大语言模型)进行了优化。相较MI250搭ROCm 5,MI300X与ROCm 6双强组合在Llama 2上生成文本的总体延迟性能提高了约8倍。与Ryzen 8040系列处理器同时登场的Ryzen AI 1.0软件栈,使开发者能够轻松部署使用预训练模型为Windows应用程序添加AI功能。
13、IDC:预计明年中国市场AI终端占比将达55%
据每日经济新闻报道,12月7日,在首届AI PC产业创新论坛上,联想集团和IDC联合发布了首份《AI PC产业(中国)白皮书》。白皮书指出,未来,每个个体都可以拥有一个专属于自己的AI PC,运行属于自己的“个人大模型”,AI PC将成为个人、家庭与企业不可或缺的个人AI助理。IDC预计,2024年中国市场上搭载AI功能的终端设备将超70%,AI终端占比将达55%。
14、麦当劳与谷歌云达成合作 明年起部署生成式AI
12月7日,麦当劳于官网宣布与谷歌建立战略合作伙伴关系,以连接最新的云技术并在其全球餐厅中应用生成式AI解决方案。麦当劳称,计划利用谷歌云硬件、数据和AI技术,将信息存储和高性能计算引入各个餐厅,从而深入了解设备的运行情况,制定减少业务中断的解决方案,并降低员工的工作复杂性,以便餐厅团队可以专注于为顾客提供优质的服务。
15、思科推出AI安全助手
12月6日,网络解决方案供应商思科(Cisco)推出AI安全助手,该助手首先在思科云交付的防火墙管理中心和思科防御协调器中上线,以解决设置和维护复杂策略和防火墙规则的挑战。管理员现在可以使用自然语言来发现策略并获取规则建议,消除重复规则、错误配置的策略和复杂的工作流程,提高可见性并加速故障排除和配置任务。思科还推出适用于所有防火墙型号的AI加密可见性引擎,利用数十亿个样本(包括沙盒恶意软件样本)来确定加密流量是否正在传输恶意软件。
16、开发工具JetBrains全面推出AI助手
当地时间12月6日,开发工具JetBrains宣布全面推出AI助手,该助手可以针对代码进行重构、生成代码、编写文档、生成提交消息等。当用户询问AI助手问题时,它会考虑有关项目的深层上下文信息,包括语言和依赖项、最近使用的文件以及项目不同部分之间的关系等。AI助手现在可供JetBrains产品付费版本客户使用,作为JetBrains AI订阅服务的补充功能。
17、商汤自研编程助手代码小浣熊Raccoon公测
据商汤科技微信公众号发文,基于商汤自研大语言模型的智能编程助手——代码小浣熊Raccoon,即日起开放公测。据介绍,Raccoon拥有强大的中文语言理解能力,支持Python、Java、JavaScript、C++、Go、SQL等30+主流编程语言和VS Code、IntelliJ IDEA等主流IDE(集成开发环境),覆盖软件需求分析、架构设计、代码编写、软件测试等环节,满足用户代码编写、数据分析、编程学习等各类需求。在实际应用中,可帮助开发者提升编程效率超50%。
体验地址:code.sensetime.com
18、南科大联合IDEA发布34B对话模型
据南方科技大学新闻网报道,近日,南科大统计与数据科学系讲席教授、大数据创新中心荆炳义课题组和粤港澳大湾区数字经济研究院(IDEA)认知计算与自然语言中心(CCNL)联合发布开源34B通用Chat模型:SUS-Chat-34B,在由美国Hugging Face社区支持的、致力于追踪、排名和评估大语言模型性能的开放大语言模型排行榜(Open LLM Leaderboard)中占据榜首,成为目前最具优势的开源34B指令微调模型之一。
ModelScope开源地址:
modelscope.cn/models/SUSTC/SUS-Chat-34B
Huggingface开源地址:
huggingface.co/SUSTech/SUS-Chat-34B
19、TCL华星发布全球首款半导体显示大模型
12月7日,TCL华星在全球生态大会上发布了全球首款半导体显示垂域大模型——星智X-Intelligence,据称其在半导体显示领域的能力超越GPT-4,并且支持私有化部署。该模型由TCL华星和清华KEG&智谱AI、国家新型显示技术创新中心联合发布。根据官方展示的信息,这款大模型打通了知识管理、多领域应用仿真和多场景实践,进行了垂域数据增量预训练,学习了超过53万个半导体显示领域文献。
20、法律AI创企幂律智能获近8000万融资
据法律领域AI创企幂律智能微信公众号发文,12月7日,幂律智能2023战略发布会暨法律大模型创新论坛在北京举办。会上,幂律智能宣布已完成新一轮近8000万元Pre-B轮融资,由蓝驰创投领投,电子签头部厂商e签宝跟投,红杉中国、华宇科创、源码资本、线性资本、智谱AI等老股东继续跟投。
此外,幂律智能推出了基于法律垂直领域大模型PowerLawGLM的智能审查解决方案,目前已经初步实现了审查点的自主实现和自主优化,在多家企业开始落地应用,支持中文、英文合同,支持智能抽取、智能审查等多种场景。幂律智能还推出了的特色法律服务“无忧吾律”,主打AI人机结合。
21、创想数维获千万级Pre-A轮融资
据上海证券报今日报道,小型化XR虚拟直播解决方案提供商奥拓电子控股子公司创想数维近日完成千万级Pre-A轮融资。本轮融资由深圳高新投创投、深圳高新投罗湖基金等知名机构共同投资,资金将主要用于新一代MetaBox产品、AIGC数字资产生成工具研发以及市场拓展。
创想数维成立于2021年,是一家以小型化XR虚拟直播解决方案为核心,以MetaBox虚拟直播间、XR技术服务和数字资产生成为主要业务的科技企业,产品及技术服务广泛应用于直播、短视频、教育、金融、文娱等市场。