3D视觉成新蓝海?ARM首位中国员工甘愿为它出走

智东西(公众号:zhidxcom)
文 | 轩窗

“我是ARM在中国的第一名员工,也见证了国内芯片行业起步的全过程”费浙平说这话时,语气里有着骄傲,却又略带辛酸。

在芯片行业摸爬滚打了十年后,费浙平决定给自己一个转型。费浙平将目光转向了3D视觉技术,与另外两位合伙人一起白手起家,在2015年成立了图漾科技。成立三年多来,在CEO费浙平的带领下图漾科技将精力全部集中在工业视觉上,并凭借自主研发的主动双目视觉技术获得了国内工业企业的认可。

说3D视觉技术可能有人觉得概念很抽象,但如果说苹果Face ID运用的就是3D视觉技术,你就能明白了。3D视觉技术目前还是新兴行业,但因2D技术发展瓶颈期的到来,3D正成为机器视觉新的方向。

创业从来都不是容易的,从第一员工到创业者,从芯片到3D视觉,费浙平和他孕育的图漾背后还有哪些不为人知的故事?为了探寻费浙平成立图漾背后的心路历程,智东西决定找费浙平一探究竟。

一、CEO出身芯片行业 图漾三年三轮融资

18年前费浙平从复旦电子工程专业毕业,那时国际第一波芯片公司正进入中国市场。2002年费浙平被一眼相中,成为了ARM在中国的第一个员工,并一路见证了ARM在中国的成长。在ARM的前6年,费浙平一直负责技术研究,之后由于公司发展需要他调度到销售岗位。这使费浙平接触到了几乎目前国内所有的芯片公司,比如海思。“当年国内的这些公司还没现在这么壮大,我算是陪着国内芯片行业一路起来的。”

后来,费浙平离开了ARM,在MIPS公司担任中国区的主管,与ARM一样,MIPS也是一家做处理器的公司,但MIPS全球员工也就1000多人,规模比ARM小得多。在MIPS工作两年后,费浙平已经在芯片行业整整10年了。从技术到销售他几乎吃透了整个芯片行业,费浙平觉得也到了是换一个活法的时候了,于是他毅然从芯片行业抽身,投奔到创业大军中。

技术出身的费浙平在技术社群里认识了另外两个合伙人,三个技术宅一致看好3D视觉行业,并决定联手创业。“2013年我们创业时,最热门的领域要数O2O和移动互联网,硬件形态技术领域并不火,头两年的日子挺难熬的。”功夫不负有心人,三位合伙人自掏腰包历经一年时间,终于有了产品的初步形态和demo。凭借出色的技术特性2015年他们拿到400万的天使轮融资,并在上海注册成立了图漾科技。

到现在图漾已走过了3年的时间,团队也从最初的3人变成今天的30人。“我们已经渡过了最初最难捱的融资阶段了”。费浙平说现在的图漾是最具朝气的时候,虽然现在人不多,但各部门的团队都有了,以后随着公司的发展壮大,将不断完善公司的组织架构,他也打算用两年时间将图漾队伍扩充至60人。

在成立了三年的时间里,图漾获得了三次融资,可以说一年一次了。2015年4月份获天使轮融资400万,2016年4月,公司完成1500万人民币的pre-A轮融资,2017获千万级A轮融资。费浙平说,拿到钱后将用于产品落地,现在是3D视觉产品起飞的关键节点。

2018年,他给图漾定了两个任务:一是扩大规模,规模上既有人才队伍的扩大又有产品市场占有率的扩大,二是产生可观营收。

二、“双目+结构光” 主被动模式可自动切换

人类的视觉识别水平很发达,人的大脑皮层中有半数以上的区域用于视觉功能,这使得人类可以在150毫秒内将看到的场景识别理解出来。而对于机器来说,仅凭现在简单的摄像头根本无法做到这一点,难以与人类匹敌。

人的视觉系统可获取颜色和几何两个维度的信息,但今天所有能进行拍摄的普通相机,只能记录颜色信息,而丧失物体原来的物理属性。如何呈现三维世界的物体形态和位置关系就成为至关重要的问题了,而目前技术上没有哪一款物理设备可以直接获取几何信息,但通过雷达等不同技术手段可以实现3D测量的目的,那图漾是如何通过技术实现几何维度的信息采集的呢?

3D视觉成新蓝海?ARM首位中国员工甘愿为它出走

图漾的方案比较特殊,他们在双目的基础上加上了结构光,而这种“双目+结构光”方案也结合了两种技术优势。3D视觉传感器由双目红外摄像头、彩色摄像头和光学增强系统组成。光学增强系统也就是业界所成称的结构光,本质上就是一个激光投射器,双目摄像头相当于接收器。当投射器投出的光线打在物体表面,物体将光线反射到两个摄像头内,以此收集相应参数信息,再由图漾搭配的算法,通过计算给出物体的长宽高、距离等物理属性。结构光能克服纯双目在纹理单调的环境中找不到匹配点而失效的弱点。另一方面,结构光方案的多机干扰问题很大,图漾的深度传感器通过双目获取信息,即使在室外有阳光淹没结构光的情况下,双目相机仍能捕捉深度信息。

正是由于这种结合方案,图漾的深度摄像头对场景和环境的依赖非常低。“我们的传感器可以满足7*24小时长时间工作需求,这也是我们在行业中的优势”。图漾目前已申请了多项专利,包括30多项申请、4项授权、1个PCT,所以即使产品出口到海外市场也不会有侵犯知识产权的风险。

图漾的这一产品可防水、防尘、防溅还支持触发模式,可由用户控制进行单帧拍摄,连接多台设备,并实现多设备同步拍摄功能。图漾提供的是软硬件组合的一整套3D视觉解决方案,按照用户的不同需求,会相应作出调整,价格在30美元到3000美元不等,可以说高中低档产品都很齐全了。

三、不搞娱乐场景 认定工业3D视觉

3D视觉成新蓝海?ARM首位中国员工甘愿为它出走

费浙平说:“我们聚焦工业,是想为客户解决实实在在的问题”。

如今中国的人口红利正在消失,中国的工业自动化的进程正在加快,这就对机器的视觉提出了更高的要求,如机器人对物体的精准抓取、工业检测等自动化视觉导引系统方面都亟待提高机器的视觉功能。在工业上,视觉系统承担着两个重要的功能,一是做为机器人的“眼睛”存在,也就是做机器的视觉引导系统,引导机器抓取物体,“手”该到哪个位置,怎样姿势抓取都是需要视觉基于机器人精准的定位。二是在工业检测方面,检测产品的缺陷和尺寸,需要对物体进行更智能的。

聊了这么多后,我突然追问费浙平,3D视觉到底是不是刚需?费浙平坚定地认为,“虽然2D视觉在这些领域的普及率不低,但一些复杂的任务2D做的并不好。可以说,目前2D的双摄像头只是一个过渡产品只有在行业需求到了该爆发的点,3D视觉才能真正落地。“3D视觉行业肯定是一片蓝海,图漾算是提前入局了。”

说到现在人工智能行业的场面,真可以用“祸兮福之所倚,福兮祸之所伏”来概括了。费浙平也评价说,“短期内做人工智能的无论大公司、创企都将盈利困难,整个行业都在靠融资挨过这一艰难时期”。但他也相信“计算视觉领域无疑是人工智能板块中体量最大、最具商业价值的领域,其应用规模会超过深度学习和人脑芯片”。

四、国内外3D视觉行业正在起步

现在2D视觉在应用上已基本成熟,涉及到定位、尺寸测量等工作都可以完成。但随着人们对设备智能化要求的不断提升,2D视觉正遭遇着三维或多维空间内信息采集缺失这一发展瓶颈。因而一些先行者正慢慢转向3D技术。3D摄像头能够实时三维信息采集,使消费电子终端加上了物体感知功能,从而引入人机交互、人脸识别、三维建模、AR、安防和辅助驾驶等多个应用场景。

市场上机器视觉技术比较成熟的3D方案主要有:结构光、双目视觉和TOF(Time of Flight)三大流派。三种主流方案中,比较成熟的是结构光和TOF。其中结构光方案最为成熟,但是极易受到外界光的干扰、响应速度较慢、识别精度较低;TOF则在这几个方面比结构光方案具有一定的优势,因此TOF成为了目前在移动端被看好的方案。基于视差原理的双目立体成像方案抗环境光干扰强,分辨率高,也是移动端可选方案之一,但技术较新还不够成熟,目前在机器人、自动驾驶领域应用较多。

国内外研究3D视觉技术的公司为数不多,以色列有家以结构光方案做3D传感器的公司名为PrimeSense,现已被苹果收购,不再对外输出技术。

深度摄像头的应用场景上主要集中在消费端和工业领域。比如,安防中的行为识别和生物特征识别,深度摄像头配合深度学习算法,可以对人的行为做出识别和预警,真正体现安防的作用。在工业领域,自动化流水线上的工业机器人、无人仓储系统内的各类机器人都需要及时获取深度信息。深度摄像头在娱乐消费端的应用算是最广泛的了。如微软Kinect体感游戏机,可实现手势、身体骨骼动作的识别。此外如苹果FaceID所需的面部识别也要基于深度摄像头的应用。

结语:3D视觉技术–正在崛起的蓝海

据Yole报告《3D成像和传感-2017版》称,预计3D成像和传感器件市场的复合年增长率为37.7%,2022年将达到90亿美元。来自Markets and Markets的一份报告也显示,预计到2020年全球机器视觉市场规模将达到125亿美元。

而在过去的五年,苹果、微软、英特尔等大型公司纷纷投资或者收购深度传感器、手势识别算法以及上下游相关解决方案公司。尤其是苹果公司,iPhone X的Face ID运用的就是3D深度视觉技术,它也将深度传感器市场从小众引领走向大众市场。正如2013年苹果发布采用指纹识别器的iPhone 5S引爆了指纹识别传感器市场一样,3D深度视觉行业正在崛起。

当然,目前3D视觉技术还未大规模应用,限制因素来自硬件技术工艺的复杂、算法的复杂性以及未找到合适的应用场景。这些问题都亟待3D视觉技术业内人士解决,不过可以肯定的是3D视觉技术这片蓝海正在慢慢崛起,伺机爆发。
3D视觉成新蓝海?ARM首位中国员工甘愿为它出走