超低功耗边缘AI芯片新突破!能效达竞品百倍,解密背后三大要素

芯东西(公众号:aichip001)
编 | 心缘

芯东西2月13日消息,AI芯片初创公司Eta Compute推出首款量产的边缘AI芯片ECM3532,以仅100µW的功率可实现物联网中的在线图像处理和传感器应用,号称能效是其竞品的100-1000倍。

ECM3532为双核(Arm Cortex-M3和NXP CoolFlux DSP)SoC,可支持用于电池供电或能源采集设计的微瓦级传感器融合应用。

“我们相信功耗、延迟、数据生成以及射频传输都是限制许多传感应用的因素,” Eta Compute首席执行官Ted Tewksbury表示,新芯片解决了物联网消费级和工业应用中的电池容量问题。

一、首款量产芯片,预计今年Q2量产

Eta Compute成立于2015年,在美国和印度拥有35名员工,迄今为止已融资1900万美元。

ECM3532是Eta Compute的第一个量产产品。其前身ECM3531仅作为工程样品提供,它们使用相同的内核,但在新版本中增加了SRAM和闪存。

先前的版本还在微控制器内核上运行连续电压和频率缩放(CVFS)技术,但是在ECM3532中,Eta Compute已将该技术扩展到微控制器和DSP内核。

ECM3532的样品现已上市,预计将于2020年第二季度开始量产。

二、能效比竞品高100-1000

Eta Compute称其设备为“世界上最节能的边缘AI处理器”,旨在处理物联网中的AIoT或AI应用。

其典型的应用是在不将数据发送到云的情况下,实现传感器融合、声音分类、图像分类或人员检测等功能,以最大程度地减少无线传输过程中的功耗。

Tewksbury表示,由于这些物联网终端的功率预算有限,芯片的功耗实际上必须低于1mW。

他介绍道:“由于我们的能效(比竞争对手)高出100-1000倍。对于给定的电池寿命,我们可以进行100-1000倍的推理;或者对于相同的功能水平,我们可以扩展电池寿命。”

三、超低功耗的三个关键要素

Eta Compute如何通过现有内核实现这种功耗水平?据悉,该公司有三个关键要诀。

首先,Eta Compute拥有一项专有的电压和频率缩放技术,该技术拥有七项专利(还有八项正在申请中的专利)。连续电压和频率缩放(CVFS)允许调整DSP和MCU内核的电压和时钟频率,以满足物联网设备的可变工作负载。

Tewksbury解释说:“内部电源电压(可调整)与该时钟速率相对应。因此,当时钟速率较低时,我们可以将电压一直降低到维持该时钟速率所需的最小值,而当频率升高时,我们可以提高电压。由于功率随电压的平方变化,因此我们可以大大降低功耗。”

超低功耗边缘AI芯片新突破!能效达竞品百倍,解密背后三大要素

传统的动态电压和频率缩放方法是通过更改PLL(锁相环)的状态来实现的,这需要时间。而Eta Compute的CVFS技术无需使用PLL,因为时钟频率是通过自定时架构在内部确定的。

“我们没有PLL,因此无论是在时间还是在电压上,我们都可以非常快速连续地进行操作。每个时钟周期我们都在监视工作负载,并以使每次推理能量最小化的方式调整时钟。” Tewksbury说:“我们还在不断改变电压,因此它不仅像我们的一些竞争对手一样具有离散数量的电压,而且还能以连续的方式从0.54V一直变化到1.2V。”

另一个关键因素是该芯片的混合多核架构,它是Arm Cortex-M3 MCU内核和NXP CoolFlex DSP内核的组合。CVFS技术在两个内核上都独立使用,也就是说,它们可以在不同的电压和频率下运行,以最大程度地减少能耗。

据Tewksbury介绍,这两个内核均可用于AI / ML工作负载,并指出信号调节和特征提取等工作负载更适合DSP。工作负载通过软件在内核之间分配。

Eta Compute超低功耗的第三个关键要素是针对特定应用的神经网络优化,相比标准TensorFlow框架的设计,它可将电源效率提高一个数量级。

原文来自:EE Times