欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智猩猩
通义千问开源320亿参数模型
2024-04-07
智东西
15
智东西4月7日消息,阿里云通义千问今日开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,例如相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。迄今通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型;Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小;多语言能力方面,通义千问团队选取了12种语言,在考试、理解、数学及翻译等多个领域做了测评,Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
阿里云

加载中...