芯东西(ID:aichip001)
编辑 | 温淑
GTIC 2020全球AI芯片创新峰会刚刚在北京圆满收官!在这场全天座无虚席、全网直播观看人数逾150万次的高规格AI芯片产业峰会上,19位产学界重磅嘉宾从不同维度分享了对中国AI芯片自主创新和应用落地的观察与预判。
在峰会上午场,地平线首席战略官郑治泰,发表了题为《软件2.0时代AI芯片的挑战》的演讲。
▲地平线首席战略官郑治泰
郑治泰认为,AI系统的数据系统和计算系统,是软件2.0时代的两大要素。在未来,机器将解决AI系统中的大部分问题,而人类科学家则负责对AI系统的算法参数进行调优。据此,地平线推出MAPS(在精度有保障范围内的平均处理速度)评估方法,为人类科学家调优AI系统提供辅助。MAPS系统可通过可视化、量化的方式,在合理的精度范围内,从“快”和“准”两个维度评估芯片对数据的平均处理速度。
此外,郑治泰透露,地平线征程5芯片正在研发中,将于明年发布。相比业界某品牌同样计划于明年发布的GPU新品,征程5芯片有望实现至少3倍的性能提升。
一、软件2.0时代,AI系统具备两大要素
在过去的五年中,地平线取得了比较好的商业成就。去年到今年,地平线的AI芯片实现量产上车,并已达到10万的出货量。明年,地平线将挑战100万的AI芯片出货量。
这些商业结果源于地平线对技术栈、技术趋势的把握。在今天看得到的商业化落地结果背后,最根本的是面向未来的思考。
借助GTIC 2020 AI芯片创新峰会的平台,郑治泰分享了其对软件2.0时代的思考,并回顾了人工智能发展的历史。
郑治泰认为,在软件2.0时代,数据系统和计算系统两个部分构成了整个AI系统。这其中,无论是数据系统还是计算系统,均由机器学习技术来解决最困难、最复杂的部分,人已经不在其中发挥太多的作用。
当人和专家不再成为数据系统和计算的瓶颈的时候,人类社会将会发生质变,人类将大踏步地进入到AI时代。到那时,由自动驾驶引发的机器人时代也必将开启。
二、未来要实现AI系统的闭环无人化应用
郑治泰认为,AI问题,特别是面向一个复杂物理世界的问题,需要一个新的解决范式。
传统的算法采用的是拆解问题的范式,即把问题分解为子系统、子系统被分解为子模块、在子模块应用核心的算法。现在看来,这种方式几乎失灵了。
大家可以想见,假设一台车在北京出厂,它的用户可能在新疆、海南、沙漠等地。如果这台车产生的巨量corner case(极端情况),只能依靠专家、标定人员、测试人员进行重新优化和迭代算法,那么我们可能永远无法实现人工智能驱动的自动驾驶。
也就是说,在未来的时候,我们需要实现整个人工智能系统的闭环无人化应用。
回顾机器视觉的发展,非常经典的应用是用机器视觉方法识别图片中的猫狗。这一应用中,计算机识别不同的点阵数据,并进行数据计算。最终,计算机给出一个范式,确定图片中是猫还是狗。这个问题刚被提出时,大家认为它的难度仅相当于一个本科生暑假作业的难度。
但是人类社会对AI走进物理世界的追求并未停止。在整个科技向前发展的过程中,尽管面临失败,科学家仍一次又一次地尝试,去掌控发展的节奏和参与其中。
最初,机器视觉鼻祖马尔提出“分解”的机器视觉方法。1986年到1990年间,人们用分解的方案解决机器视觉问题,即对整个图进行描边,形成有景深信息的二维图片,再通过完整的几何计算,抽象出三维物体。后来,人们发现这一解决方案存在局限性,这是因为当面对不同角度下同一物体的图片,或者同一角度不同光影下的物体图片时,计算机无法用上述的拆解数学模型去定义物体。
在1990年代,人工智能进入到下一个阶段。科学家往后退了一步,将所有的物体类别定义出来,全部由数据系统使用机器识别方法去实现,通过不断调优、不停移动分类面,提升识别的精度和准确率。
后来,人们又发现这一方法仍无法解决所有问题。在整个物理世界中,一台车面对着十分复杂的外部环境,人类想用几个简单的数学公式集合完成整个定义是不可能的。
2012年至今,机器视觉发生了一个深刻的变革。科学家和码农开始把整个计算过程全部交由机器去做,让计算机做识别,而科学家则承担模型结构和算法超参数调优的工作。这一过程中,基于随机的算法和参数,科学家评估输入输出的结果,不断对不正确的gap进行反向调优。
2017年,专家又后退一步,将模型结构设计也交由机器学习来设计,依赖TPU提供的充沛算力。到2019年,机器设计的模型性能远超过人类专家设计出来的模型。
在软件2.0时代,不增加数据的量,而增加计算量的时候,人们发现模型识别的错误率下降一半。如果数据量和计算量都提升的话,模型识别错误率下降三分之二。增加计算量、增加数据量,都可以自动化进行。这意味着机器自动化、持续降低识别错误率是可能的。
为什么在海量数据和大模型的时代,机器会比人更加厉害?郑治泰称,这是因为人类专家在抽象、局部有限的小数据、小模型应用中占据优势。但在大数据、大模型的应用中,计算机的准确识别和网络设计能力,能够超常发挥。
现在,利用机器学习重新开发和设计网络模型、重新计算识别的精度协议的趋势,并没有显示出终止的迹象,这就催生出一个非常重要的可能性,即我们可以面向物理世界,提供AI服务,即全自动无人驾驶汽车等“像人一样的智能”。
三、借助MAPS评估方法为产业链赋能
针对AI系统的数据和计算,这两大软件2.0时代的核心要素,人类工程师在打造数据系统的闭环、提升数据闭环效率的同时,还要结合软件和硬件底层的逻辑设计,逐步提高计算的效率和性能。
基于此,地平线提出MAPS(在精度有保障范围内的平均处理速度)的概念和评估方法。借助这套方法,客户可以直接面向物理世界,评估AI系统的效能。这一方法并不是单纯计算峰值算力或软件的算法效率,而是计算这两者在物理世界可接受的精度范围内的处理速度。地平线计算的是什么?是AI系统能跑得多快、跑得多准。
为实现数据闭环,几乎所有的AI公司都在围绕数据的搜集、采集、标注、模型训练进行部署。相较而言,地平线是利用自身的核心技术能力,给整个行业赋能。如果客户需要打造一套完整的数据闭环,地平线可以为其提供技术支持和服务。
郑治泰透露,目前,地平线正与国内头部的汽车企业携手,打造不少于3~5个联合实验室。
通过这种联合实验室,地平线计划为车企提供毫无保留的技术支持。地平线秉持开放赋能的宗旨,可以提供芯片,也可以提供芯片+工具链,还可以提供芯片+工具链+算法。此外,就算客户想要完全脱离地平线的技术产品来打造AI能力,地平线也会100%为客户赋能。针对物理世界中的海量数据问题,地平线以帮助合作伙伴具备真正的AI生产力为目标。
2015年,地平线成立,初创团队具备算法背景。当时,团队发现在处理边缘计算时,需要在物理世界中定义一个问题,提出算法模型。根据算法模型重新定义适合这个算法模型的芯片架构,芯片流片后,再回到物理世界中,求得一个最优解。
郑治泰认为,在计算闭环中,人类科学家需要做到三件事:
第一,人类科学家要持续提升这颗芯片的有效计算效率和计算能力;
第二,人类科学家要持续提升算法的效率;
第三,人类科学家需根据要解决的实际问题,进行联合调优,得到最优解。
地平线团队认为,用传统模型来进行计算能力评估的方式是有局限性的。
首先,一些模型早已过时,而要解决未来自动驾驶场景中的实际问题,需要更先进的模型。芯片在设计的时候,就需要考虑到对未来模型、算法的引进。其次,同一个芯片搭载不同的模型,其利用率也会表现出差异。
基于这两点,地平线从算法开始进行产品开发,然后再设计芯片,进而回到场景中去解决实际问题。
四、地平线征程5芯片明年发布,性能有望超竞品3倍
据郑治泰分享,地平线团队MAPS评测结果显示,市场上的高能效芯片,通常达到约30%的利用率。
人工智能面临识别、检测两个问题。在识别方面,相比市面上现有最好、最普遍的端侧GPU产品,地平线的征程3芯片用8%的功耗实现了50%的MAPS,具备4~6倍的能耗优势;征程5芯片用50%的功耗实现了5倍的MAPS,实现了将近10倍的能耗优势。
检测方面,地平线征程5芯片用50%的功耗实现了13倍的MAPS,达到26倍的提升。据称,明年上述GPU品牌推出的新品,相比其上代产品实现了7倍的性能提升。基于此,地平线将于明年推出的征程5芯片,相比该品牌明年发布的GPU新品,将有至少3倍的提升。
近期,地平线科学家定义的有效评估人工智能计算效能的方法,正为整个产业链赋能。郑治泰提到,地平线希望,产业链伙伴都能使用这一方法,让整个产业进入非常良性的循环。
展望未来,人类科学家要做的事情并不多,其中包括搭建和调优整个系统、看着机器用海量数据输出结果等。这就是软件2.0所暗示的未来,自动驾驶、无人驾驶等人工智能应用,将普惠到每个人的生活。
以上是郑治泰演讲内容的完整整理。除郑治泰外,在本届GTIC 2020 AI芯片创新峰会期间,清华大学微纳电子系尹首一教授,比特大陆、燧原科技、黑芝麻智能、壁仞科技、光子算数、知存科技、亿智电子、豪微科技等芯片创企,全球FPGA领先玩家赛灵思,知名IP供应商安谋中国、Imagination,全球EDA巨头Cadence,以及北极光创投、中芯聚源等知名投资机构,分别分享了对AI芯片产业的观察与思考。如感兴趣更多嘉宾演讲的核心干货,欢迎关注芯东西后续推送内容。