芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西6月1日报道,GPU赛道正变得越来越热闹,今天,国产GPU再添新丁——全功能GPU独角兽企业摩尔线程专为游戏和视频场景打造的MTT S70显卡正式开售,售价2499元。
在生成式AI爆火后,国内市场对国产GPU产品的需求愈发迫切。值此之际,摩尔线程一口气发布了面向数字办公、娱乐与创作、AI与云计算、元宇宙四大应用场景的19项GPU新品或技术更新,商业化进程初见成果。
面向游戏与创作,摩尔线程推出全新MTT S70显卡,并成为首家能够支持DirectX 11游戏的国产GPU公司,基于DirectX 11社区版驱动,能让用户畅玩《原神》、《DOTA2》等3A级游戏大作。此外,摩尔线程还发布了首个基于国产GPU、集游戏和生成式AI应用于一体的智能终端整机产品“智娱摩方”,其GPU物理引擎AlphaCore也全新升级并开放测试下载。
面向国产化数字办公,摩尔线程GPU新增对OpenGL4.0、Vulkan1.3的支持,DKMS技术可快速适配各种CPU+操作系统版本组合,并推出云桌面产品MT vGPU 2.1和MCCX VDI云桌面一体机。
面向AI与云计算,摩尔线程启动MUSA社区开发者计划,发布MUSA Toolkit 1.0软件工具包及代码移植工具MUSIFY,全面兼容CUDA,并开源MT PyTorch,支持跑大模型推理以及典型NLP语言模型的训练。
面向元宇宙,摩尔线程宣布MTVERSE元宇宙平台升级,可支持云端实时渲染;AIGC内容创作平台摩笔马良内测上线;并现场展示了升级版的DIGITALME数字人解决方案能力。
在本场夏季发布会的线上直播中,摩尔线程还秀了把“AIGC生成”实力,全程由摩尔线程创始人兼CEO张建中的2D数字人替身出镜。
▲摩尔线程创始人兼CEO张建中的2D数字人替身主持线上发布会
发布会结束后,张建中同芯东西等媒体进行深入交流,进一步解读了对新品及技术升级的思考。在聊到产品定位时,他谈道,不差钱的发烧友肯定会买4090这种旗舰产品,考虑到市场需求,摩尔线程首先从主流产品切入,在刚需应用场景中做到满足用户需求的性能与体验。提供更高性价比的好方案,就是摩尔线程的机会所在。“人工智能+3D图形+云原生+云端算力,这就是我们的目标。”张建中说。
一、游戏:率先支持DX11 国内第一家,整机产品支持AI学习与应用开发
摩尔线程创始人兼CEO张建中说,自摩尔线程发布首张游戏显卡MTT S80以来,近半年,其显卡Windows驱动已完成5次升级,支持超过60款游戏,完成对50多款主板和30多款显示器的支持,兼容性得到极大提升;游戏性能平均提升约50%,《英雄联盟》、《穿越火线》等主流网游在其游戏显卡上的表现更加卓越。
在此基础上,摩尔线程发布了一款比S80配置略低、价格更便宜的游戏显卡新品MTT S70。
MTT S70搭载摩尔线程第二颗全功能GPU芯片“春晓”,内含3584个MUSA计算核心,在1.6G的主频下可提供11.2T FP32算力,配备了7GB高速GDDR6显存,理论带宽为392GB/s,支持多达4路8K30帧的超高清显示输出,支持剪映、OBS等视频剪辑和直播类软件启用硬件加速编解码。
值得一提的是,其昨日发布的版本号为v221.31的Windows驱动程序,已实现对MTT S70游戏显卡的支持。即将于6月下旬发布的DirectX 11社区版驱动,也将能支持MTT S70和S80用户抢鲜体验《原神》、《DOTA2》等3A级游戏大作。
支持DirectX 11游戏,摩尔线程是国产GPU第一家。张建中告诉芯东西,要做到对DirectX 11的支持,首先要做到GPU架构上的硬件级支持,同时还需要花费巨大的软件工作量,来实现对主流游戏一一适配。
同时,摩尔线程在“摩卡玩家”社区启动“Alpha行动”,召集更多玩家对DirectX 11社区版驱动的使用和反馈,以加速驱动的迭代速度。
摩尔线程推出了开箱即用的整机产品“智娱摩方”。“智娱摩方”搭载MTT S80和MTT S70两款全功能GPU显卡,预装了精选游戏中心和PES系统管理中心,既能玩游戏,也支持生成式AI方面的学习与应用开发。摩尔线程还将为用户开放Ubuntu驱动下载。
摩尔线程还升级了其自主研发的下一代GPU多平台物理引擎AlphaCore。
基于该引擎开发的实时流体仿真工具Catalyst FX全新版本,可直接在Houdini中不改变原有工作流的前提下进行流体效果的制作,相比原生的PyroFX,性能提升达到5-10倍;相比传统的Houdini Vellume的制作流程,摩尔线程GPU加速的柔性体仿真工具VeraFiber能将解算效率提升至先前的3-5倍。
AlphaCore对DirectX 11的Compute Shader计算版本也做了深度优化,在流体力学仿真方面,Catalyst FX在MTT S80上的实际运行性能已经达到了市场主流高端显卡的2倍以上。
目前Catalyst FX和VeraFiber已完成Houdini插件接口的开发,Houdini插件Beta版本将于6月6日开放下载。
值得一提的是,Catalyst FX Houdini版插件已与国内著名电影后期特效制作公司MOREVFX完成交付对接。AlphaCore也与网易游戏投资的CG动画制作团队DOVFX数海文化进行了联合开发,成功将VeraFiber运用在游戏CG片头中复杂角色的布料和毛发仿真中。
二、国产化数字办公:加速近百款国产应用,推出GPU云桌面一体机
面向国产化数字办公领域,摩尔线程希望提供广泛的兼容性与全新的解决方案,推动国产化PC产品从“可用”迈向“好用”。
摩尔线程已陆续完成10余家ODM和18家OEM厂商的产品导入,共同推出了30余款PC机型,应用于电信、金融、能源等数字经济关键行业。张建中说,目前国产化数字办公应用的主要需求是操作流畅、速度更快、体验更好。
针对国产化软件普遍关注的图显效果,摩尔线程GPU新增了对OpenGL4.0与Vulkan1.3完整功能的支持,并100%通过了接口兼容性测试,可实现更高效的图形渲染。借助新的Tessellation(曲面细分)等图形特性,摩尔线程GPU还能为应用提供更加精细的几何纹理效果。
▲开启和关闭Tessellation的画面效果对比
由于当前国产办公生态发展迅速,各种CPU与操作系统版本的组合上百种,要确保用户在使用不同办公应用时保持长时间的稳定运行,适配的难度与复杂度极高。对此,摩尔线程的驱动软件新增DKMS技术支持,可以快速适配不同操作系统的内核,使开发效率提升数十倍。
摩尔线程近期成功适配了麒麟、统信、openKylin、deepin、凝思、中科方德、普华等国产操作系统,并率先与统信、麒麟OS完成了全面的兼容性认证,成为国内首家通过统信UHQL质量认证的GPU企业。
通过驱动的不断优化,摩尔线程GPU的整体性能较初次发布时提升了2倍以上,其GPU硬件产品已经加速了近百款国产应用,包括办公类、视频会议类、影音类、浏览器类、视频剪辑类、设计类以及GIS类软件等。
张建中说,目前,基于全国产化平台,对比国内外同类代表产品,摩尔线程全功能GPU性能在各种标准测评项目上均有2-3倍的提升。
随着企业对上云用云的需求日益增长,传统CPU云桌面方案难以满足新型办公和富媒体类应用的需求。对此,中国信通院联合移动云、中国电信研究院、摩尔线程发布《新型GPU云桌面发展白皮书》,明确定义了云桌面场景的体验标准。
基于该标准,在视频播放、网页浏览、Office办公和教育教学软件4个主要场景,搭载摩尔线程MTT S2000 GPU的单台服务器能够同时支持超过40路高清用户,相比传统只有CPU的方案,性能提升近5倍,整体的TCO降低60%以上。
在vGPU创新方面,摩尔线程推出了云桌面产品MT vGPU 2.1和MCCX VDI云桌面一体机。
MT vGPU 2.1云桌面产品新增了对摩尔线程MTT S3000显卡的支持,单卡并发的虚拟机数量达到28个,并发性能相较之前提升了40%,支持4K画质,增加了对Windows Server版的支持,扩展了硬件能力和应用的支持范围,并新增了GPU超分技术和对SRIOV的支持。
在不改变硬件资源的情况下,超分技术会使得虚拟机数量实现翻倍,从而大幅降低客户成本,SRIOV技术则能提供更好的QoS、隔离性和安全性,保护客户数据免受侵犯。
摩尔线程MCCX VDI云桌面一体机主要应用于教育和办公场景,是包括服务器、瘦终端和软件在内的端到端交付方案,并专门推出教改特别版和办公体验增强版。教改特别版方案可以有效加速19款教改类软件,办公体验增强版则针对WPS、PDF阅读器、视频会议和解压缩软件等60余款办公类软件进行了定制优化。
目前,摩尔线程已经与包括天翼云电脑、移动云电脑等在内的10余家客户的产品完成适配,并与深信服、新华三信息、华云、酷栈和庭宇科技完成了产品导入,基于摩尔线程vGPU的云桌面产品和解决方案将在各行各业落地。
三、AI+云计算:兼容CUDA,零成本完成CUDA代码迁移
GPU的应用创新,离不开广大开发者的贡献与支持。摩尔线程去年发布了MUSA元计算统一系统架构,包括统一的编程模型、软件运行库、驱动程序框架、指令集架构和芯片架构。
昨日,摩尔线程又宣布了围绕MUSA架构的系列技术更新,包括启动MUSA社区开发者计划、推出MUSA Toolkit 1.0软件工具包和“MUSIFY”代码移植工具、开源MT PyTorch等。
摩尔线程启动MUSA社区开发者计划后,将为合作伙伴和开发者提供全套的MUSA开发工具、编程指南、系列教程和开源的框架及模型库等资源;同时将与第三方社区合作,推动新算法模型、计算系统和平台的开发。
为了更充分的发挥摩尔线程GPU的计算能力,摩尔线程推出包含MUSA驱动、运行时库、编译器、AI加速库、数学库、通信库等工具的MUSA Toolkit 1.0软件工具包。
由于MUSA从架构上与CUDA兼容,其代码移植工具MUSIFY可快速将现有的CUDA程序迁移至MUSA,零成本完成CUDA代码自动移植,之后用户短时间内即可完成热点分析和针对性优化,大大缩短迁移优化的周期。
此外,摩尔线程将开源MT PyTorch,支持多种模型的推理,覆盖CV、NLP、语音等多个领域,能够运行ChatGLM、Stable Diffusion、LLaMA等典型的大模型分布式多卡推理。
利用数据并行、模型并行以及ZERO等分布式训练技术,MT PyTorch还能完成简单基础模型以及典型Transformer结构的NLP语言模型训练。
基于MUSA,开发者可以复用PyTorch开源社区的大量模型算子,降低开发成本。
四、元宇宙:AI绘画平台内测上线,生成数字人以假乱真
结合图形渲染、物理仿真、AI训练和推理等能力,摩尔线程不断完善元宇宙应用中的人、场景、内容等核心要素,并带来系列重大升级,以更好赋能数字城市、数字教育、数字医疗、数字能源、数字办公等行业。
张建中宣布,摩尔线程升级MTVERSE元宇宙平台、DIGITALME数字人解决方案,并宣布其AIGC内容创作平台摩笔马良内测上线。
MTVERSE元宇宙平台提供可扩展性能、云端实时渲染与模拟以及AI驱动的多元化算力支持。
领先的第三方IDC服务商世纪互联在云端率先部署了摩尔线程千卡级别的GPU算力集群,并成功将MTVERSE平台与虚幻引擎和云渲染流化技术结合,为51WORLD旗下的51Meet元宇宙高精度开放平台提供了计算加速。
据介绍,这也是首个实现国产化闭环的元宇宙应用。在多人并发下,用户可以享受低延迟、高保真、沉浸式的元宇宙体验。
此外,包括咪咕元宇宙、智汇云舟视频孪生、瞰景三维重构等都在陆续更新中。
摩尔线程推出的软硬件一体化的AIGC内容创作平台摩笔马良内测上线。
该平台提供了多种接入方式,可以通过Web和小程序登录,也可以通过丰富的API供用户远程调用。对于需要完整解决方案的用户。
摩尔线程提供私有化部署能力,包括GPU集群、异构算力调度平台、API接口以及类似于摩笔马良的样板应用。
张建中告诉芯东西,AIGC内容创作平台是摩尔线程为用户提供的一项增值服务,摩尔线程不考虑以此盈利,而是希望以此将产品能力展示给更多的开发者,使得开发者能够使用这些软件技术和硬件产品解决方案来发展自身的业务。
此外,针对数字人生成应用,摩尔线程打造的DIGITALME数字人解决方案也进一步升级,包括2D和3D。
DIGITALME包括“女娲”数字人生成器、“画皮”表情驱动引擎、“随影”动作驱动引擎和“随答”对话系统。其中,“随答”迎来了两大主体能力的升级:一是通过语音与人自然交互,实现了“能听能说”的功能;二是基于大语言模型的智能问答,实现了“会思考且言之有物”的功能。
摩尔线程还在发布会上展示了基于DIGITALME技术平台制作的两个数字人产品方案——2D播报数字人和3D交互数字人,并表示期待与各行业的合作伙伴共同创作多类身份职能的数字人,在直播、社交、影视动画、办公、娱乐等场景中广泛应用。
▲基于DIGITALME平台,用真人形象和音色复刻生成的数字人
结语:GPU研发是一项长期事业
GPU的应用落地,是检验技术创新的“验金石”。从发布新品和技术更新的节奏来看,摩尔线程走得不是闷头憋大招的路线,而是选择边落地积累经验、边迭代优化产品的更实际的打法,通过与广泛的生态伙伴合作,用越来越多的商业化应用来验证其软硬件产品的稳定可靠和易用性。
张建中谈道,通过在GPU中集成更多有特色的自研技术,以及大力投入对很多国产游戏应用、游戏引擎、操作系统及办公软件方面的适配支持,摩尔线程正构建起差异化竞争壁垒,以更低的价格为用户提供一些不逊于专业高端显卡的体验。
在张建中看来,AIGC、数字人、元宇宙3D图像生成、自动驾驶、机器人、数字孪生等都与“AI+图形+元宇宙”应用场景相关。这些应用的开发全都离不开GPU,GPU已成为所有科研企业的“基础设施”,也是企业研发过程中的必备硬件。这也是他鼓励开发者们更多探索的综合应用方向。
他相信,相比专用芯片,GPU的通用性更有助于打开很多开发者的创造力,一款全功能GPU就能兼顾开发大模型、虚拟数字人、3D图形渲染、工业数字孪生等各式各样对图显和AI计算都有高需求的多模态任务,从而成为各行业的创新引擎。
“我们的战略是通过持续快速的元计算创新和生态合作伙伴的支持,致力于为客户提供更高效能、更可靠、更好用的GPU解决方案。”张建中期待与各界伙伴共同合作,将创新成果应用于实际场景,推动GPU在数字经济时代的广泛应用。