智东西(公众号:zhidxcom)
文 | 心缘

智东西3月21日消息,中国科学院自动化研究所南京人工智能芯片创新研究院(以下简称:AiRiA研究院)在北京举办战略发布会,公布“普惠AI,芯向边缘”战略,并向行业上下游生态伙伴传达AiRiA研究院现阶段AI研究新进展。

在活动期间,智东西同少数媒体对AiRiA研究院常务副院长程健和AiRiA研究院副院长冷聪进行采访。

AiRiA研究院公布AI芯片战略 量化神经处理器Watt今年流片

▲AiRiA研究院副院长冷聪(左),AiRiA研究院常务副院长程健(右)

程健表示,其量化神经处理器(QNPU)芯片名为“Watt”,将在今年流片,预计可能在9-10月实现。

活动现场还展出了AiRiA研究院的量化神经处理器(QNPU)、Q-box、Q-Engine等多项成果。

AiRiA研究院公布AI芯片战略 量化神经处理器Watt今年流片

此外,AiRiA研究院、赛格导航、高新兴物联也在现场宣布达成战略合作。

一、AiRiA研究院愿景:普惠AI,进军边缘端训练

AiRiA研究院在2017年9月成立于南京市江宁区麒麟科创园内,依托中国科学院自动化研究所和南京市麒麟科技创新园,由中国科学院自动化研究所负责运营管理。

AiRiA研究院公布AI芯片战略 量化神经处理器Watt今年流片

AiRiA研究院常务副院长程健介绍道,AiRiA研究院的愿景是普惠AI,基于20余年技术积累,AiRiA研究院从软(核心智能算法)和硬(AI芯片)两个方面进行布局,以达到低功耗和高效性能,为各行各业创新科技赋能。

AiRiA研究院公布AI芯片战略 量化神经处理器Watt今年流片

程健分享了关于AI芯片的思考,AI芯片走过云端训练、云端推理、边缘端推理后,正在对边缘端训练产生新的诉求。

AiRiA研究院公布AI芯片战略 量化神经处理器Watt今年流片

目前边缘端训练几乎空白,量化神经处理器(QNPU)的下一步计划就是向边缘端训练进发,然后实现“自主进化”的目标。

程健宣布,其QNPU芯片名为“Watt”,将在今年流片,面积会非常小。

二、算法+平台+硬件:普惠AI全栈式解决方案

AiRiA研究院公布AI芯片战略 量化神经处理器Watt今年流片

AiRiA研究院将一系列产品命名为Q,这是因为研究院的产品主要采用量化技术。

量化处理技术具有低功耗和较高计算性能表现的特点,可以满足边缘计算对AI芯片有低成本、低功耗、低延时的要求。

AiRiA研究院副院长冷聪介绍说,QNPU架构具有低位宽、计算架构和算子融合三大优势。其中的一大创新是将乘法全部用移位操作来替代,尽量减少对存储的访问,进一步降低功耗和时间。

AiRiA研究院公布AI芯片战略 量化神经处理器Watt今年流片

其QNPU芯片名为“Watt”,采用台积电28nm工艺,峰值算力达24Tops,帧效比达到6Tops/W,支持1080P思路实时检测,MobileNet图像分类达每秒8000帧,将在今年流片。

该芯片采用量化模型压缩技术,计算被极大程度简化,实现了完整片内计算,打破了内存墙瓶颈,将功耗和成本显著降低。

AiRiA研究院公布AI芯片战略 量化神经处理器Watt今年流片

▲量化神经处理器(QNPU)

另外,AiRiA研究院还推出了模型压缩工具QTrainer和深度学习推理引擎QEngine。

QTrainer通过低比特量化和剪枝在实现压缩功能的同时保持较高性能表现,支持客户开发自定义应用。QEngine提供算法专家定制合作和免费技术支持,不仅支持QNPU,也支持客户自研硬件。

AiRiA研究院公布AI芯片战略 量化神经处理器Watt今年流片

结语:边缘端训练成新趋势

AI芯片技术和市场正在快速变革,其应用与政策环境都带来了多重利好。芯片国有化关乎国家安全问题,无论是企业还是高校、研究院,都在探索AI芯片研究和落地的新思路。

在过去两年间,芯片公司、云计算巨头、AI算法公司等纷纷涌入云端训练与推理以及边缘推理领域,而边缘训练还是新兴领域,明显的格局尚未形成。

程健院长告诉智东西,边缘训练的一大好处是可以在边缘设备用实时实地数据进行训练个性化模型,同时无需将数据传输到云端,保障了数据隐私安全。

边缘训练要解决的重点包括边缘端的小样本数据,以及在边缘端不标或少标数据的情况下实现无监督或半监督学习。程健院长表示,AiRiA研究院会持续针对这些难题进行研究和探索。