1、阿里云通义千问140亿参数Qwen-14B发布

2、百川智能发布Baichuan2-53B闭源大模型

3、Meta或于本周发布系列AI聊天机器人

4、开源可商用的中文版Llama 2发布

5、特斯拉机器人启用端到端神经网络

6、6.7k Star量的vLLM出论文 助大模型低成本部署

7、亚马逊与Anthropic达成合作 至多投资40亿美元

8、恒生电子大模型LightGPT开启内测

9、AI原生人力资源服务商TTC获千万人民币融资

10、Canalys:2027年兼容AI功能的个人电脑占60%

1、阿里云通义千问140亿参数Qwen-14B发布

今天,阿里云举办通义千问开源发布会,正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat,开源、免费。据介绍,Qwen-14B在众多同尺寸20B以内开源模型中突出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩,超越所有测评中的SOTA大模型。此外,通义千问团队还升级了Qwen模型对接外部系统的能力,开发者可以通过简单的操作实现复杂的插件调用,也可以基于Qwen系列基座模型快速开发Agent等AI系统,利用Qwen的理解和规划能力完成复杂的任务。同时,Qwen-7B也实现了全面升级,核心指标最高提升22.5%。

2、百川智能发布Baichuan2-53B闭源大模型

今天,百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。据介绍,Baichuan2-53B的数学和逻辑推理能力显著提升,并通过高质量数据体系和搜索增强大幅降低了模型幻觉,是目前国内幻觉问题最低的大模型。百川智能此次还开放了Baichuan2-53B API接口,宣布正式进军To B领域。

API接口文档地址:

https://platform.baichuan-ai.com

3、Meta或于本周发布系列AI聊天机器人

据《华尔街日报》报道,知情人士透露,Meta计划最快于本周在其社交媒体应用上发布一系列AI聊天机器人,以吸引年轻用户。据称,这些聊天机器人在公司内部被称为“Gen AI Personas”,正在由员工进行内测,预计将在当地时间本周三开始的Meta Connect大会上推出。据《华尔街日报》看到的内部文件显示,正在开发的聊天机器人中有一款被称为“机器人Bob”,自称是一位“高智商、敏锐的智慧和尖锐的讽刺”的将军;一个名为“Alvin the Alien”的聊天机器人会询问用户的生活;一个名为“Gavin”的聊天机器人发表了攻击性言论,以及批评扎克伯格和Meta但赞扬TikTok和Snapchat的评论。

4、开源可商用的中文版Llama 2发布

据量子位报道,现在,15小时、几千块钱、85亿Tokens数据,即可训练出中文版Llama 2。Colossal-LLaMA-2近期把大模型门槛打下来了,同时开源团队还提供了一个完整的评估体系框架ColossalEval,以实现低成本的可复现性。这一模型综合性能达到开源社区同规模从头预训练SOTA模型水平。方案完全开源,包括全套训练流程、代码及权重;而且无商业限制,还可迁移应用到任意垂类领域和从头预训练大模型的低成本构建。

GitHub地址:
https://github.com/hpcaitech/ColossalAI

5、特斯拉机器人启用端到端神经网络

据量子位报道,当地时间9月24日,特斯拉人形机器人「擎天柱」最新视频公开,启用了自动驾驶系统同款的端到端神经网络架构,无需任何规则代码就学会分拣物品。对此网友表示很难相信视频是真的,马斯克回复称:“执行器、传感器和整体机械结构更多升级还在后面。”伴随视频发布的是机器人团队招聘公告,特斯拉机器人团队招聘各类硬件工程师及机器学习工程师、实习生,总计51个职位。

6、6.7k Star量的vLLM出论文 助大模型低成本部署

据机器之心报道,今年六月,来自加州大学伯克利分校等机构的一个研究团队开源了vLLM,其使用了一种新设计的注意力算法PagedAttention,可让服务提供商轻松、快速且低成本地发布LLM服务,该团队宣称vLLM能实现比HuggingFace Transformers高24倍的吞吐量。现在离vLLM最初宣布时差不多已过去三个月,他们终于发布了这篇关于vLLM和PagedAttention的研究论文,其中详细解释了他们如何通过类似操作系统虚拟内存管理的机制来实现高效的LLM服务。该论文已被将于十月底在德国举办的ACM操作系统原理研讨会(SOSP 2023)接收。

论文地址:
https://arxiv.org/abs/2309.06180

代码地址:
https://github.com/vllm-project/vllm

文档地址:
https://vllm.readthedocs.io/

7、亚马逊与Anthropic达成合作 至多投资40亿美元

据界面报道,亚马逊与人工智能公司Anthropic今日宣布达成战略合作,共同推进生成式AI发展。Anthropic选择亚马逊云科技(AWS)作为其主要云提供商,并将利用AWS的高性能、低成本机器学习加速器,在AWS Trainium和Inferentia芯片上训练和部署其未来基础模型。亚马逊将向Anthropic投资至多40亿美元,并拥有该公司的少数股权。

8、恒生电子大模型LightGPT开启内测

今日,恒生大模型产品已面向20家金融机构开启内测。据悉,恒生金融行业大模型LightGPT是专为金融领域打造的大语言模型,它通过训练海量金融数据,对金融相关问题有更好的理解能力。光子是基于LightGPT的智能应用服务,可以为金融机构的各个业务系统注入AI能力,包括投资合规、投顾、客服、运营、投研和交易等。

体验地址:
www.hs.net/lightgpt

9、AI原生人力资源服务商TTC获千万人民币融资

《科创板日报》25日讯,近日,AI原生国际性人力资源服务提供商TTC完成数千万元人民币Pre-A轮融资,本轮融资领投方为创新工场。

10、Canalys:2027年兼容AI功能的个人电脑占60%

据知名行研机构Canalys预测,兼容AI个人电脑将呈稳定的上升趋势。截至2023年第二季度,在苹果的神经引擎的大力推动下,兼容AI个人电脑市场实现了超过500万台的出货量。随着x86架构提升它们的AI能力,预测从2024上半年开始将出现新一轮的AI赋能模型浪潮。到2024年第四季度,出货量预计上升至约2000万台的水平,在全球个人电脑出货量的占比超过25%。

鉴于在2024年末推出的最新Windows操作系统将预期发布经AI提升的功能,以及AI工具在商业和生产力软件的广泛应用,兼容AI个人电脑市场将在2025年和2026年有望实现爆发式增长。到2027年,出货量预计超过1.75亿台,在总个人电脑出货量的占比超逾60%。从现在起到那时,该板块的复合年均增长率将达94%。