芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西8月8日报道,今日,北京AI芯片创企苹芯科技发布存算一体NPU“PiMCHIP-N300”和多模态智能感知SoC芯片“PiMCHIP-S300”。两款产品是存算一体技术在28nm及22nm制程节点上的首次产品化实现。N300已有客户,S300预计在今年第四季度推向市场。
通过将计算和存储深度融合,PiMCHIP-S300实现了数据处理的“零搬运”,在大幅提升计算效率的同时,显著降低了功耗,可应用于智能可穿戴设备、智能安防、具身智能、AI大模型、健康数据分析等领域。
苹芯科技创立于2021年2月,同年9月其基于SRAM架构的存内计算加速器S200测试成功,该成果还发表于素有“固态电路领域奥林匹克”之称的芯片顶会ISSCC 2022。今天的新品发布也是对其过去三年创业发展的阶段性总结。
清华大学电子工程系教授、无问芯穹科技有限公司发起人汪玉现场发表致辞,他总结了苹芯两款新品的三个特点:1)在28nm成熟工艺下取得跨代性能提升,实现极致能效比;2)通用性强,能支持不同应用;3)是一个平台架构的概念,在大模型、可穿戴、机器人等应用领域均能发挥作用。
汪玉 回顾道,他与苹芯的CEO杨越是从高中到大学的同班同学。保送清华时,汪玉选择了电子工程系,杨越则选择了自动化系。多年来的学习和工作中,两人一直以来保持着非常紧密的沟通和联系,是相识28年的老友。
此外,在存算一体技术方向上,汪玉跟苹芯团队算是同行。汪玉大约在2012年、2013年开始研究存算一体并发表相关论文。
据了解,苹芯科技已与国内外电子类头部企业、大型企业集团等客户展开合作,为其提供存内计算技术的一站式解决方案。
一、单核算力0.5TOPS,系统功耗毫瓦级,支持自定义算子
PIMCHIP-N300是苹芯科技自研的新一代存算一体NPU(神经网络处理单元)IP,专为机器学习和AI领域设计,可内嵌到端侧芯片中,能以更高效率、更低能耗承担繁重的神经网络加速任务。
杨越谈到端侧电子产品中出现两个趋势,一是智能本地化,二是小型化、轻量化、低功耗化。两个趋势都对底层芯片提出了新的设计要求,低成本、高效能、小面积、低功耗这四个优化维度几乎涵盖了所有端侧芯片的设计理念。
PiMCHIP-N300采用软硬融合架构,充分考虑可扩展性,单核可提供0.5TOPS算力,系统功耗为25-100mW,典型场景下静态功耗仅10μW,支持混合精度计算,涵盖INT4/INT8/FP16精度,支持12大类超过100种算子,核心计算单元能效比达27TOPS/W,跑YOLO-V3 tiny网络的算力资源利用率达89.5%。
在兼容性方面,PiMCHIP-N300支持自定义算子,可满足不同模型部署需求,并针对人声监听、眼动追踪、主动降噪、环境感知等应用场景提供了配置方案和专门优化。
在灵活性方面,该NPU有高速任务调度加速单元,支持多核或多个计算单元的实时任务调度。
为了满足客户更自主、灵活的算法移植需求,苹芯科技根据客户定义的场景或数据,提供一键部署的端到端的解决方案,开放NPU中间表示层规范、模型解析器、模型优化器、驱动等,并提供免费的软件工具链,包括软件模拟器、调试器、C编译器,能够减少二次开发的时间。
苹芯科技CTO章尧君把存算技术平台分为五类:应用、工艺、电路、架构、算法,每一部分需要相互配合和共同设计,从应用出发,确定需要的算法、工作环境及设计要求,进而确定架构设计和工艺选择,根据工艺特性设计电路,最终实现存算芯片方案。
这是一个密度优先、功耗优先、速度优先的设计方案。混合计算架构可基于不同的技术和设计参数实现,包括不同阵列形状(存储容量),SRAM、RRAM等不同的存算单元,不同的存算容量与算力的比例,以及不同输入/输出数量。
章尧君总结说,苹芯科技以高能效加速计算核心为原点开始开发,之后做从定点运算到浮点运算,以及一些面向特殊应用的设计,并在研可灵活实现不同算力部署需求的首款存算编译器,还将提供混合计算架构和异构存内计算量化映射技术。
二、多模态智慧感知芯片:28nm,异构架构,单核能效比27TOPS/W
PIMCHIP-S300多模态智慧感知芯片是一款基于SRAM的存内计算芯片,内置自研NPU、数字PIM单元,单核能效比高达27TOPS/W,具备高能效、小面积、低功耗、低成本等特点,可高效完成数据密集型任务。
该芯片采用轻量级Cortex-M MCU处理器,实现实时控制与调度;支持音、视频及多种传感器接入,实现多模态融合感知;支持多路麦克风阵列预处理流程,满足各级语音场景应用。基于自研异构架构,这款AI芯片可实现超低功耗唤醒、VAD、语音识别、运动监测、视觉识别,针对特定计算能节约90%的耗能。
苹芯科技副总裁江广展示了PIMCHIP-S300芯片的谍照。它采用28nm制程、BGA封装、自研异构架构,12mm * 12mm大小,die做得很小,能满足更小型化的需求。
这款芯片拥有丰富的外设接口,单颗芯片既可以接收数据,也可以本地处理数据,产生简单决策,最终产生控制,一颗就能闭环。
其高度灵活和易集成性,有助于大幅缩短产品开发周期。苹芯打造了完整交钥匙解决方案,底层操作系统、中间件、工具链都会开源,提供一键AI部署工具、一键二进制生成和下载工具。
该存算一体AI芯片提供电池可驱动的低功耗,未来还能结合新能源甚至是光伏电池,达到更好的小型化和易部署能力,广泛支持无人机、具身智能等场景应用。
苹芯挑选了近期参与MLPerf测评的竞品,进行综合比较,图表显示,在跑多种AI算法时,苹芯存算一体AI芯片的能耗和延迟均最低。
同时,苹芯自研了一套开源的Pstreamer异构计算框架,通过管道将不同端侧通用算法和算力模块连接起来,实现声光电不同模态信息的采集、融合、感知等功能,并衔接决策与控制功能,以帮助客户快速部署产品,快速推向市场。
结语:已申请40余项海内外专利,将积极拥抱大模型生态
苹芯科技定位自身为智能计算架构的革新者,致力于通过创新的存算一体解决方案,为AI的广泛应用铺设技术高速路,推动从智能终端设备到智慧城市、从智能医疗到具身智能的全方位变革。目前苹芯已申请海内外专利40余项,相关知识产权和工程经验覆盖从存储器器件、电路设计、算法优化到体系结构等全技术栈。
杨越在发表致辞时谈道,展望未来,苹芯科技将继续秉承“创新引领未来,技术改变世界”的理念,积极拥抱大模型生态,以产品为核心,不断加大研发投入,深化与高校、科研机构的合作,培养和吸引顶尖人才,共同推动中国集成电路产业向更高层次迈进。
包括苹芯两款新品在内,随着相关技术和器件的迭代和成熟,越来越多存算一体AI芯片产品走向落地商用,为国内AI加速解决方案提供一种兼顾高能效与灵活性的新选择。