芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

如何评测云端大算力芯片的多维度性能指标,对比两款AI芯片谁跑什么应用更胜一筹?上海通用GPU创企天数智芯刚刚给出了新的答案。

芯东西8月31日报道,昨日,天数智芯推出百大应用开放平台DeepSpark,通过提供与落地应用深度耦合的百大算法,并针对行业需求构建多维度测评体系,来为选择算力犯难的基础设施建设企业提供可直观对比实际性能表现的评测工具。

天数智芯CTO吕坚平在开场致辞时直言芯片行业有一个现象,很多芯片在少数几个性能指标上出类拔萃,但在通用性上并不理想。

天数智芯去年3月发布的首款7nm云端训练通用GPU天垓100已适配逾200个场景、对接300家余客户、订单累计突破2亿元,由此积累了很多落地经验。吕坚平说,天数智芯希望把跟行业合作伙伴一起努力的成果,以开源社区的方式运维DeepSpark平台,促进国内通用算力的发展。

会后,吕坚平接受芯东西等媒体的采访,并透露天数智芯新一代通用GPU推理产品智铠100将于今年年底量产,现已有首批客户的验证,目前正在紧锣密鼓地适配中。

天数智芯推通用计算开放平台,六大维度评测芯片性能,预告智铠100量产时间▲智铠100

一、让算力选择不再困难

回顾做通用算力部署的过程,天数智芯产品副总裁邹翾谈道,其团队不止一次发现算法开发者及工程师对通用算力有共性的迷惘:

怎么保证这款芯片产品能支持未来更新的算法?怎么能快速验证芯片是稳定可用的,并且跑完模型后的结果准确度足够高?有没有更快速便捷的方式来基于通用算法验证算力的通用性?

针对这些问题,天数智芯与客户、合作伙伴共建了DeepSpark百大应用开放平台。

吕坚平称,任何AI芯片厂商的用户都可以用这一平台来评测硬件,AI芯片厂商也可以基于该平台测试开发自家硬件,优化硬件的通用性。

“跑百大应用是我们过去走过的路。”他谈道,希望通过提供DeepSpark平台,方便其他AI芯片厂商直接走天数智芯走过的路,共同推动国内AI芯片产业往正确的方向发展,实现良性竞争。

天数智芯推通用计算开放平台,六大维度评测芯片性能,预告智铠100量产时间▲天数智芯CTO吕坚平

“一款产品能够跑通百大应用再加上达到多维度性能指标要求以及大规模品质管控,就表明它已经拥有可以正式量产并规模应用的实力。”吕坚平说,“在硬件实力合格的情况下,天数智芯希望百大应用开放平台的发布,可以实现平台共建、生态共享、产业共赢。”

该平台的另一好处是,初级开发者可以利用已有的案例快速做二次开发,让产品更快进入市场。

DeepSpark平台将于9月30日在GitHub和Gitee双网上线,以开源社区的方式进行运维,开发者可在线上获取该平台中所有的脚本,并且基于原生脚本进行自己的开发。

百大应用开放平台也将汇聚社区开发者的力量,通过共建方式帮助行业内的硬件和软件伙伴们迭代产品,让整个通用计算生态趋于完善。

二、百大应用开放平台:提供逾100种算法,支持六大维度评测

DeepSpark平台组成分为三部分。

天数智芯推通用计算开放平台,六大维度评测芯片性能,预告智铠100量产时间▲百大应用开放平台DeepSpark组成

第一部分是应用算法。吕坚平认为:“人工智能应用现在从热恋期度过蜜月期,现在到了柴米油盐酱醋茶的阶段,有些地方发现AI不能解决所有的问题。”因此DeepSpark不止提供AI算法,也提供些涉及3D重建、高性能计算及通用计算的各种非AI算法,第一个版本将提供超过100种模型算法,供用户自行评测选用。

这些算法很多来自标准模型库,也有一些是从落地案例中筛选出的、适用于特定应用场景的模型,天数智芯根据真实场景优化数据集,根据不同行业需求来调整DeepSpark代码中的并行度,从而让用户使用模型时更高效切合落地场景。

第二部分是框架,框架相当于人工智能时代的“操作系统”,DeepSpark兼容行业中主流框架,并会为开发者提供一系列完备的工具箱,可以完成快速跨平台的比较,解决此前跨平台迁移难、开发应用缺少工具的痛点。

天数智芯推通用计算开放平台,六大维度评测芯片性能,预告智铠100量产时间

第三部分是一键式评价脚本,DeepSpark提供多维度评测体系,来帮助企业比较不同算力平台在具体应用场景的实际运算效果,选择更能满足自身业务需求的算力平台。

DeepSpark 1.0版本的评测标准包括三个方向:性能、拓展性、鲁棒性。第一版开源社区会提供一键式评测脚本,涉及六个测试维度:速度、功耗、准确度、线性度、显存占用、稳定度。

基于天数智芯提供的逾100个算法,加之其提供的测试脚本,DeepSpark开发者可自主组合构成非常多的评价体系,比如如果希望非常快速能够了解到一个产品对所有模型相对较准确的覆盖度及各项能力,可以构造在八大领域中一个经典算法,然后全测六个维度。

如果想快速了解一个硬件的通用性,通过一键式部署,可以让硬件在测试维度上测100个模型,几小时内就能获得完整的测试结果。

考虑到不是每个人都有用计算机或集群云开发测试的能力,天数智芯会以免费的方式提供一定量的预约测试服务,来供有意向使用天数智芯算力基础设施进行评测的开发者进行体验。

三、汲取自身落地经验,为产业生态提供更多可能

打造百大应用开放平台DeepSpark,得益于其通用GPU落地于一系列应用所积累的经验,也离不开天数智芯合作伙伴的支持。

在能源行业,油田建设、勘探、维护正使用地震波成像技术来快速建立地底以及海底的信息,能够快速降低勘探成本,大大提升油田资产质量。

在智慧城市领域,依托最新算法,航拍图像已被用于建立大到故宫博物院甚至纽约州城市群的3D模型,这些3D模型能显著降低3D重建所需花费的资源和时间。

天数智芯推通用计算开放平台,六大维度评测芯片性能,预告智铠100量产时间

在数字人领域,依托多模态模型,融合计算机视觉、计算语言分析和自然语言翻译技术,研究人员正在模拟人与人之间切实有感的交互方式,让人类和人工智能的沟通更加有亲切感。

在医疗领域,企业借助不断迭代的反投影技术、图像分割技术,构建出一批好的设备,在医疗影像重建以及辅助医疗领域达到世界的先进水平。

在教育领域,人脸识别、姿态识别技术正帮助老师在课堂上识别每位同学的身份,并自动化完成体能训练,校正在建设规范化的数据基础,帮助我们下一代提升他们的身体素质。

在空间领域,依托大规模并行化快速处理,更强的处理能力可以进行最大值分析、多模态分析,从而更好地分析复杂空间电磁厂中的准确信号并快速得到回复,进而更好地探索宇宙奥秘。

昇思业务总经理丁诚分享说,天数智芯通过开源百大应用开放平台DeepSpark,将为产业生态提供更多可能性。同时,昇思也将与天数智芯共同打造创新使能方案,做强影响力,希望和天数智芯共同将自主软硬件基础设施推向全新的高度。

百度飞桨产品线负责人赵乔谈道,一直以来,天数智芯都积极参与飞桨的适配工作,今年4月20日完成I级兼容性测试,即便受疫情影响,仍然在8月22日完成II级兼容性测试,高效适配体现了天数智芯软件栈的成熟度。百大应用开放平台将会使得软硬件生态更加完善,未来飞桨将持续助力天数智芯拓展人工智能领域生态。

结语:芯片最重要的是能拿来用

谈到对DeepSpark平台对国产GPU行业生态建设影响的期许,吕坚平说,他希望人们不要盲目追求性能指标,更加认识到芯片最重要的是拿来用,所以通用性很重要,另外也希望该平台帮助人们知道如何更好地运用AI芯片或通用GPU。

众人拾柴火焰高。天数智芯希望以百大应用开放平台DeepSpark开源为纽带,汇聚各方资源,和行业合作伙伴共同努力,加快我国算力产业生态建设,推动我国计算技术创新发展。