智东西(公众号:zhidxcom
文 | 心缘

智东西10月15日消息,今日,国产GPU阵营再添一员。

国内AI全算力系统平台及解决方案提供商公司天数智芯,在杭州西湖国宾馆推出基于卷积神经网络CNN)的高性能边缘端AI推理加速芯片Iluvatar CoreX I,采用16nm制程工艺,单芯片算力达4.8TFLOPS,能效比超过1 TFLOPS/W,主打视频识别类的设备端AI加速器解决方案市场。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

天数智芯成立于2015年,去年销售额达3000万元,今年预计将达到6000万元,在南京、上海、硅谷、北京均设有研发中心。其团队规模近400人,技术团队来自AMD、NVIDIA等世界知名芯片公司及Oracle、Fujitsu等企业软件翘楚,其完整的芯片设计团队在芯片设计领域积累了近三十年经验。

上个月,天数智芯刚刚完成B轮融资,金额达数亿元人民币,由大钲资本、Princeville Capital领投,上海电气香港有限公司、邦盛资本等跟投。

一、EPU:峰值算力能效比达竞品10

天数智芯的GPGPU具有可编程、可扩展、可配置的特点,并支持原生的CUDA兼容确保透明迁移。

基于其自研GPGPU IP,天数智芯计划推出面向云端的7nm高端SoC,面向边缘云的7nm中端SoC,以及面向边缘端的16nm低端SoC。

天数智芯的首款边缘端AI推理芯片Iluvatar CoreX I(EPU,Elastic Processing Units)采用16nm制程工艺,基于32核并行数据流和图计算的CNN优化架构,支持检测、分类、识别等视觉智能算法,支持主流深度学习框架,能效比达到1 TFLOPS/W-0.2 TFLOPS/mm2,可支持实现超高能效比的边缘计算加速。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

Iluvatar CoreX I支持FP16精度,单芯片算力达4.8TFLOPS,物体检测可达1000fps,支持TensorFlow框架原生兼容、客户开发环境无痛迁移,提供高性价比的消费级方案和高稳定性的工业级方案,面向行业用户提供端到端解决方案,面向开发用户提供软硬结合开发环境。

Iluvatar CoreX I的峰值算力能效比可达到竞品的10倍。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

与竞品相比,其物体分类性能约提升2.1倍,能效比约提升8倍;物体识别性能约提升1.9倍,能效约提升7.2倍。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

天数智芯的边缘AI推理加速器具有两大CPU灵活性和算力可扩展两大特性。CPU灵活性体现在可以配x86、Arm以及国产处理器;算力可扩展体现在支持单板卡多芯片和服务器多板卡,单芯片4x PCIe 4.0提供16GB/s超高带宽双向通信。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

另外,其64bits LPDDR4/4X的支持提供34.1GB/s、8GB的高带宽、高容量本地存储方案。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

Iluvatar CoreX I可适配各类边缘及端侧应用场景,适用于边缘端、边缘侧、边缘智能计算及分布式、集中式视频智能。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

目前,天数智芯基于EPU推出边缘计算系统板和边缘计算加速卡。前者适用于智能新零售、智能垃圾分类、智能监控等各类应用,后者适用于边缘服务器、工控机扩展等形态。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

▲基于EPU的智能垃圾分类系统

二、预告云端训练及推理芯片

下一步,天数智芯将发布高端云端训练(兼推理)芯片和中端云端推理(兼训练)芯片。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

现场,天数智芯还总结了主流芯片市场存在四个痛点:

一是为追求性价比,牺牲一定精度和算力,精度往往集中在INT8、INT4,算力集中在1-2 TOPS;

二是环境要求高,聚焦在消费级产品;

三是生态迁移成本高,软件转换层提供生态兼容工具问题层出不穷;

四是开发门槛高,缺乏端到端解决方案。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

天数智芯在打造芯片解决方案时即着力于解决上述问题。

除了芯片之外,作为一家软硬件基础平台公司,天数智芯在软件层面同样在云、边、端三个层面做了部署。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

过去三年,天数智芯在轨道交通行业摸爬滚打,作为铁路枢纽,轨道交通需要对全部资源做有效管理统筹,对站段做好及时响应,确保对车载、路基、货场能发出实时警报。

天数智芯认为,要将传统IT系统大数据、物联网语行业智能解决方案结合,追求通用、标准、高性能,摆脱对算法的依赖,软件要针对行业特征提供场景优化,硬件不仅要支持AI计算数据驱动,也要支持其他高性能计算的算力需求。

今年6月,天数智芯斩获斯坦福大学发布最新DAWNBench深度学习推理榜单图像识别性能冠军,二三四名分别是华为寒武纪阿里云

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

三、龙头芯片企业的优势和创企的机会

在活动现场,天数智芯创始人、董事长李云鹏同一众嘉宾就如何深入将产品真正落地市场、中国AI芯片如何创新自身优势等问题进行探讨。

国产GPGPU增添新势力!天数智芯首推边缘AI芯片

此前,智东西曾专访天数智芯创始人、董事长李云鹏,深入了解天数智芯的定位和布局、产品技术逻辑以及创业打法。(对话天数智芯CEO:GPGPU的国产化时代将至!

天数智芯坚持软硬协同理念,重点打造覆盖“云端-边缘端-端端”全算力场景的“芯云战略”全算力解决方案,提供满足多层次算力支持的产品。

天数智芯创始人、董事长李云鹏一上台,就解释了为什么这家南京公司会选择在杭州西子湖畔举办发布会。他说,1949年新中国成立,五年后毛主席在杭州西湖国宾馆起草第一部五四宪法。而天数智芯自2015年成立来,经历初创期的野蛮生长和碰壁,走完了第一个闭环,希望在此宣布天数智芯来到新的起点,呼唤有机的成长期。

天数智芯英文名为ILUVATAR,取自创新(Innovation)、演进(Evolution)、价值(Value)、引领(Polestar

李云鹏认为,直线加速垂直细分领域是我国AI芯片产业的发展方向,既要认清不足之处,也要找出优势所在,目前AI芯片已逐渐向终端产品渗透。国内AI芯片行业发展尚处起步阶段,只有深耕基础技术,集合垂类技术的延展,才能贯穿AI产业链纵向的基础架构、通用技术和行业应用,使AI芯片真正落地市场。

天数智芯的一个重要使命,是解决中国计算机产业缺“芯”少“魂”的沙漠化问题。

在李云鹏看来,境外的龙头芯片企业竞争优势明显,并渗透在企业文化中,“真正站在客户的角度去从事运营及长远考虑”。

他认为具体可分为两点。

一是对产业链条的把控。链条存在于芯片企业的整个营销模式中,其中生态是链条的一个标准化执行通路,但自我发展完善的产业生态链尚未建立,各IT巨头在特定领域持续投入,彼此之间又相互协同、联盟,最终形成辐射全球的信息产业体系。“这对我们产业生态的构建,是很有借鉴意义的。”李云鹏说。

天数智芯从智能数据与AI算力需求出发,围绕高端服务器系统,形成从芯片到一体机,从操作系统到数据库、应用软件和云服务,从底至上、软硬一体、拥抱云计算的完备技术体系,互相支撑,开放兼容,试图破解国产核心技术生态系统薄弱、上下游不衔接的难题。

二是对产业链终端的控制。天数智芯作为本土AI芯片企业,意识到贴近优势能量带给整个产业链的可控性,在不断寻求差异化的有利于本土营销模式开拓市场。

瞄准AI市场,天数智芯创业团队结合自身优势,聚焦高端、云端计算芯片和计算基础软件,致力于解决AI时代最核心的计算力问题,同时侧重场景和技术创新,包括利用技术深度挖掘用户需求并转化为商机,以及产品创新等业态模式的创新。

切入AI芯片领域的算法和系统公司逐渐增多,仅仅通过算法实现商业变现会有瓶颈,将各自AI核心算法芯片化有助于提升原有性能。但AI算法变化快、芯片研发周期长,按照当前算法需求定义芯片需求无异于赌博。

同时,天数智芯对场景真实需求有深刻了解,打造了软硬件一体化产品和云服务,并具备优秀的市场营销渠道能力及充分的资本储备。

李云鹏表示,目前国内和天数智芯在同一赛道的,凤毛麟角。

在自有软硬件平台基础上,天数智芯面向高端制造、轨道交通、教育等行业,为客户提供面向云计算的智能数据平台方案SkyACC、软硬件一体机产品SkyAXE和应用服务SkyFront、SkyDatalab。这种发展模式使得天数智芯成为国内唯一、全球极少数的云端AI计算软硬件平台系统创业企业。

结语:国产化GPU任重道远

乘着深度学习的东风,GPU龙头NVIDIA迅速抓住机会,成为AI和自动驾驶领域的AI芯片霸主。陆续有半导体巨头和新兴创企入局AI芯片,但GPU领域依然被NVIDIA牢牢掌控。

近年来,伴随着芯片自主可控浪潮的到来,在国家政策助推下,我国国产CPU在行业应用上陆续取得了一系列进展,但国产GPU的民用之路一直走的坎坷而艰难。

无论是用于图形处理的GPU,还是面向通用计算的通用GPU,都面临着较高的技术和生态壁垒。要在NVIDIA和AMD的夹缝中寻找新的生存之道,国内GPU企业们仍然任重而道远。