GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

车东西(公众号:chedongxi)
文 | Origin

3月9日,上周五,由智东西主办的GTIC 2018全球AI芯片创新峰会在上海召开,大会邀请到来自芯片、安防、汽车和消费电子等领域的近40位业界翘楚到场分享研发AI芯片的经历与思考。

数千名到场观众挤爆了会场,AI芯片话题火热可见一斑。

在大会下午场的“自动驾驶加速落地,AI芯片引领计算平台”板块,眼擎科技CEO朱继志进行了主题为《成像引擎芯片进入视觉2.0时代》的演讲,就人工智能最大应用方向——机器视觉在成像上的痛点,分享了眼擎科技的解决方案,并分析了其在自动驾驶领域的应用。

朱继志演讲的要点,车东西整理如下。

一、AI时代急需机器之眼

朱继志此前在图像处理行业和芯片分销行业任职,2014年他主导成立了眼擎科技。如其公司名,眼擎所做的工作即面向机器视觉打造对标人眼的成像引擎,用芯片+算法的方式提高机器视觉前端的成像能力,让AI有更高质量的图像数据可用。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

▲眼擎科技CEO朱继志

朱继志表示,AI这个巨大的技术生态下,已经进化出各种各样的新物种,比如自动驾驶汽车。而过去几年AI的大脑成长得很快,但还需要一个最重要的器官——眼睛。

目前绝大多数AI物种都是基于视觉能力成长起来,通过视觉生成的数据占据了AI世界绝大部分的数据量,AI的时代将会是万物视觉的时代:一个汽车会配备10个以上的传感器、每家无人零售店会有超过100枚视觉传感器。自动驾驶、无人零售、机器人、手机相机等领域,将会在未来五年内产生上百亿台的视觉设备需求。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

Uber早期无人车,以摄像头众多著称

但当下基于视觉的AI产品普遍遭遇到一个问题,在实验室内运行良好的AI视觉算法一落地,就从卖家秀变成了买家秀——复杂光线条件下,机器视觉的识别、判断能力显著降低。自动驾驶汽车过隧道,或者在夜间运行,在暗光、逆光条件下感知能力会遭遇很大挑战。

为此业界用上了很多辅助视觉的技术,比如无人车使用的激光雷达。但朱继志将此比作为只是给了自动驾驶汽车一根拐杖,并没有将视觉的能力发挥到极致。

与机器不同的是,人眼则对各种光线环境都有很好的适应能力。为此,眼擎科技推出一套软件+硬件的解决方案,打造对应AI处理需求的机器之眼,对标人眼的视觉成像能力,甚至做得比人眼更好——目前眼擎的产品在成像的动态范围上比人眼高18db,在人眼无法辨别色彩的极弱光条件下仍能输出清晰的彩色图片。

朱继志称,未来五年,机器视觉就能够仅依靠被动光学成像系统,实现全天候的运行工作。

二、软硬结合方案PK人眼

为了自身掌握的成像技术能够最大限度地发挥作用,眼擎将其近4年累积的针对二十余种场景的智能成像算法凝聚在了一枚成像芯片——eyemore X42之上,打造出软硬件一体化的成像引擎,专门为各类机器视觉产品提供强大的成像能力。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

朱继志介绍,这款成像芯片有三大特点:

一是芯片是非集成的,与英伟达的独立显卡一样,眼擎采用了独立芯片设计,拥有更强大的计算能力。

二是在各种智能成像算法加持下,它拥有”视觉2.0”的能力,较传统的成像设备能够应对各种复杂光线,

第三则是它提供了大量API接口,让后端算法工程师方便调用,减小开发难度,实现软件定义硬件。而传统的智能摄像头设备并未提供太多接口,大多数时候都是一个黑盒。

朱继志表示,根据他在芯片行业任职的经历来看,芯片的应用周期非常漫长,要推广一枚芯片难度也很大。为此,眼擎为下游客户提供了对应产品不同开发阶段的各种方案:早期接触时可以使用开发工具,小规模生产验证产品时可以使用其模组,而到了产品量产阶段眼擎就可直接提供芯片。此外,眼擎还提供IP授权这类的合作形式,以更好地应对不同领域的需求。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

为了降低下游公司的开发门槛,眼擎今年会面向各个领域推出完整解决方案的参考设计。今年年中,眼擎为辅助驾驶提供的方案,视觉动态范围会超过100db,可以解决95%的复杂光线问题。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成

面向无人零售、工业视觉,眼擎也会有板卡形式的方案推出。

目前,眼擎的芯片已经有实际应用案例。基于眼擎的成像芯片,其客户打造了一台面向淘宝卖家的3D扫描仪,用单目就实现了输出淘宝商品的高质量三维图像。

朱继志认为,目前各种拍摄设备源自日本的成像架构,其初衷都是面向人设计的,为的是满足人的主观审美,但机器所需要的成像是客观的,机器的使命是用视觉测量世界,在前端的测量越精准,那么后端的识别结果就越精确。

机器在视觉能力上做到超越人眼后,将会发现一个新世界——比如医生可以通过病人的脸色来看诊,而机器在视觉能力上如果超过医生100倍,或许就将发现更多有价值的信息。而这也是AI产业的终极进化方向。

三、AI芯片的三大趋势

在谈到眼下的AI芯片浪潮时,朱继志认为其中有三大重要趋势。

第一,眼下AI芯片是以视觉处理为核心的。无论是在PC时代还是移动互联网时代,所有的芯片处理工作都围绕CPU展开,而现在开始以视觉为中心的处理工作让CPU的地位开始滑落。

第二,AI芯片产业目前是去中心化的。以前的操作系统与CPU绑定,主芯片只有数枚,以CPU为中心开展工作。结果是越来越通用、功能越来越多,但产品却趋同。而人工智能时代对芯片对的要求会具体到每一个场景,这是通用型处理器所不及的。细分行业的应用需求成就了AI芯片的兴起。

第三,AI芯片对应了工业升级的要求。过去二十年中互联网产业是绝对的明星产业,很多工业产品被淡化。而人工智能时代工业升级对AI芯片提出了极大的需求。

正是因为这三点趋势,AI芯片架构呈现去中心化的态势,才会有大量的初创公司杀入芯片行业,与传统的芯片巨头们同场竞技。

朱继志做了一个类比,在被智能化、电动化趋势改造的汽车产业,同样有一批新造车公司涌现。在新趋势带来的产业变革下,原本相对固定的格局往往会被打破,率先对新趋势作出反映,改造乃至革新原有的技术/商业架构,是眼擎这类创业公司的机会所在。汽车行业如此,芯片行业亦然。

结语:芯片初创如何在AI时代掘金?

从眼擎的创业道路来看,AI无疑是其成长最好的东风。但清华大学微纳电子系主任、微电子所所长魏少军在GTIC 2018上坦言,未来2-3年,AI芯片初创公司就将出现先烈。那么,对于眼擎这样初创,要怎么在日趋激烈的人工智能竞赛中生存壮大?演讲结束后,朱继志接受了智东西的采访。

他认为除了技术之外,找到行业最需要解决的痛点是最重要的。能够解决的痛点越紧要、解决痛点的能力越不可复制,那么创业公司的护城河就越宽。

其次,以眼擎的经验来看,由于AI技术的大量落脚点在于升级传统产业,AI相关技术产品落地中遇到的最大难点其实在于信息不对等,即后端应用对前段技术的不了解、不信任。对于这种情况,比较重要的手段是针对不同的行业推出参考设计,降低技术应用门槛与陌生度。

此外朱继志认为,由于大公司在数据量上的优势,纯做算法研发的人工智能公司会比较危险,对于人工智能初创公司来说,虽然软硬结合是一种门槛比较高的方式,但也是能够更好保证初创公司生存的模式。

GTIC 2018 | 眼擎科技朱继志:PK人眼的无人车之眼如何炼成