智东西(公众号:zhidxcom)
编辑 | 徐珊
智东西6月11日消息,近日GTIC 2021嵌入式AI创新峰会在北京圆满收官!在这场全天座无虚席、全网直播观看人数逾150万次的产业峰会上,来自产业链上下游的16位大佬共聚一堂,围绕嵌入式AI的软硬件生态创新、家居AIoT、移动机器人和工业制造产业4大版块地图,带来了深入浅出的分享。
成立于2015年的图漾科技是我国3D机器视觉领域的新锐玩家。图漾科技创始人&CEO费浙平以《3D机器视觉在工业制造领域的前景与实践》为题,分享了图漾科技在3D机器视觉发展的几点思考。
▲图漾科技创始人&CEO费浙平
基于过去的技术积累和市场经验,费浙平对行业进行了一些分析和展望。从实际落地来看,他认为3D机器视觉是2D机器视觉的补充和延伸,更多的价值在于完成2D机器视觉做不到或做不好的任务。
在他看来,3D机器视觉在消费、安防、工业和商业领域都有许多应用方向,尤其是商业领域的应用潜力巨大。与此同时,费浙平还分享了图漾科技对当下3D机器视觉市场现状的内部分析数据,涉及工业自动化、工业检测、物流科技和商业应用四大垂直领域。
其中,工业检测是现阶段行业3D机器视觉渗透率最高的领域,但也意味着它的增长空间较少;3D机器视觉在物流科技领域还有很大发展潜力,至少有100倍以上的增长空间;而在商业应用场景,3D机器视觉甚至能达到1000倍的增长空间。
费浙平认为,现在3D机器视觉还处于创新产品的创新应用落地阶段,拥有100倍的成长空间,但还面临着传感器、算法软件、算力单元三大方向的发展挑战,而算力单元的最大挑战是成本。
以下是费浙平演讲内容整理:
一、从消费、安防到工业领域,3D机器视觉的应用现状
3D机器视觉是一个趋势性的技术,是指在2D的信息之外再引入几何信息,可以用一个简单的表述RGB+XYZ。
费浙平认为,从真正实际的价值或者可以落地的地方来看,3D机器视觉一定只是2D机器视觉的延伸和补充。
相比2D机器视觉的便宜与稳定,3D机器视觉的价值在于完成2D机器视觉难以达到的地方,如更强大的识别分析能力。3D机器视觉在消费、智能安防、工业和商业里面都有大量应用方向,商业领域的3D机器视觉应用甚至能超过工业市场成为一个新的巨大蓝海市场。
在消费领域里,3D机器视觉的应用的数量仍是少数,尽管有FaceID这样单一容量比较大的应用,但是从应用场景的丰富程度来看并不普及,而FaceID也不属于机器视觉的行业,在这里不做讨论。
目前在安防领域里面,3D机器视觉更多停留在概念上,还没有成为可以大规模普及化应用的场景。从技术的价值来看待,3D机器视觉对人做一些行为分析动作理解,将会是智能安防技术领域皇冠上的明珠,是最难且最具有价值的事情,但是从技术角度来看,目前的硬件与软件技术都不够成熟。
3D机器视觉在工业领域的应用,由于工业的场景非常多且分散,单一的工业场景体量无法像消费领域的单品有几十万、上百万甚至上千万的数量。但是,在工业领域里面,可以找到上万甚至十万数量级的场景,可应用的数量非常多,总量加起来很可能有上百万、上千万。如今,图漾科技将工业领域作为重点探索的目标场景。
至于商业,很多工业领域的机器人技术和视觉技术可以走出工厂,商场,饭店,酒店甚至家庭应用,3D机器视觉在这个方向的应用具有非常大的想象空间,会逐渐出现很多新的机会与市场。
二、当前出货量达万级,物流应用增长空间超百倍
从图漾的角度,费浙平分享了今天3D机器视觉市场应用的情况。
图漾科技内部对3D机器视觉市场应用的分析,包含了工业自动化、工业检测、物流科技和商业应用。
费浙平认为,尽管物流科技在功能上是属于工业自动化,但由于物流科技本身的产品形态以及巨大的市场空间,它值得从工业自动化划分出来进行特殊考察。
▲图漾科技的内部市场分析
如图所示,在3D机器视觉已有规模化落地的工业自动化、工业检测、物流科技、商业应用四大垂直系统市场,图漾科技统计了2020年年度出货量以及市场空间,说明一下,表格中的数据做了一定的模糊化取整处理。
图中的价值统计是指核心零部件统计口径,只计算了相机和核心配套软件,不包括设备和系统集成的市场价值。这个可能跟市场上有些数据的统计口径不太一致。
目前3D机器视觉仍是一个全新的技术以及产品在新的场景落地。图漾科技取得的成果,像在海外市场有较大的出货量,其价值并不在于进口替代,而是新产品和新技术在新场景里面的全新落地,是一个全新的增量市场。
3D机器视觉的市场空间目前看来是几十K左右,与2D的工业相机大几百K的出货量相比,只有5%——10%。费浙平认为,从增长潜力和增长空间来,在五年左右,工业自动化会有不少于50倍的增长空间。工业检测是目前在行业渗透率上来讲相对比较高的一个机器视觉落地应用,但也意味着它的增长空间小。3D机器视觉在物流科技领域是非常创新的应用落地,物流具有相当大的市场,对3D机器视觉而言是一个巨大的金矿,至少有一百倍以上的增长空间。
在工业自动化领域,与想象中既好看又有用的应用场景不同,早期能够落地的地方,基本是不太好看但具备真正的使用价值。如机器人配合3D机器视觉,对于重物和大件物体进行搬运、抓取、分捡这些动作。
面对物理世界里面的对象物体,可能有不同的形状、不同的位置,甚至散乱的放置情况,对于这些物体的分割、定位以及测量需要用到3D机器视觉。在3D机器视觉的引导下,机器人完成看似简单的分捡抓取动作,这其中的使用价值非常大,在食品饮料、汽车配件、工程机械行业里具有较多的场景应用。
事实上,看似高大上的智能机器人,以及有些AI技术加持的方案真正落地的地方,需要去面对和服务的客户其使用场景有很多是较恶劣的环境,如煤矿、工程机械等。
▲较恶劣的工况条件
如视频里大家看到的是一个国内顶尖白色家电的生产线和物流行业的一个自动化叉车场景。大家可以看到里面的工况条件是比较恶劣的,对于机器人和视觉产品的鲁棒性要求就特别高,而不是简单的视觉和算法识别能力而已。
再说说物流行业,我国物流行业占GDP的比例占到16%、17%、18%左右,物流行业是占国家GDP产值最大的行业。费浙平认为,自动化技术、智能视觉技术、AI技术最大的价值就在于,能够帮助行业降低营运成本,增加生产效率。
物流行业的客户都有一个共同的目标——少人化。他们追求的目标并不是是无人化黑灯工厂,而是减少10%的劳动力甚至50%的劳动力。达到这样的目标,就是一个典型的双赢,客户会愿意把节省下来的成本分享给提供相应技术升级产品的供应商。图漾帮助行业客户实现降本增效,一定能在其中实现图漾应有的价值。少人化是图漾在物流行业以及工业场景里面里最大的目标和机会所在。
机器人和智能视觉在商业里面的3D机器视觉应用,是把原来在工厂生产车间里面的设备或者技术经过跟应用场景结合移植包装优化之后,成为适合商业化场景应用的设备,典型的例子比如包含像咖啡店、餐馆甚至酒店的一些工作任务。
商业场景里面的3D机器视觉应用,与工业场景无论在视觉还是机器人形态上面可能会有所不同,比如机器人的形态可能不再是工业机器人或人形机器人。
协作机器人可能是早期落地机器人的一种形态,比如六轴机器人,虽然工作距离不远,虽然力气不大,但是它的动作非常灵活,可以替代人工在视觉识别和引导下面实现原来需要人来执行的一些动作。
协作机器人的配合需要与之相匹配的3D机器视觉技术,将来在商业化的场景里面应用空间会非常非常大,甚至不排除将来每个家庭里拥有能够帮助完成一些特定家务动作的机器人。从餐饮、酒店、商场、一直到家庭都有商业化的智能视觉加上自动化机器人的应用需求。
基于这样的场景假设,也许可以理解之前提到的商业3D机器视觉有一千倍的增长空间,这个基数将来可能会是每多少人拥有一套机器人系统。
费浙平认为,尽管3D机器视觉还只是一个小小的蛋糕,但会有一百倍以上的增长空间。他提到,今天成熟的技术和产品,有更多的场景可以复制,比如工业自动化领域落地最多的目前是食品饮料、工程机械、汽车配件市场,后续还有大量的白色家电、黑色家电、家具等各行各业应用。这类场景所需的技术相对成熟,但是场景需要扩展的。
另外一个纬度,以前面提到的商业场景和智能安防为例,它们在技术上还不够成熟,但是通过技术持续不断进步,就能够解锁更多的场景产生。
▲一百倍成长空间
所以如图中所示看着两个维度,横向有十倍以上的增长空间,纵向也有十倍以上的增长空间,所以,一百倍的成长空间并不夸张。
三、加速应用普及,需重点考察三大挑战
3D机器视觉的挑战重点考察的三个部分:第一,传感器,就是图漾做的3D工业相机;第二,软件和算法,3D机器视觉结合深度学习是较为前沿的领域;第三,算力单元,算力单元要解决的最大问题在于成本,如今的算力单元如果不计成本地连接云、服务器、以及独立显卡,3D机器视觉需要的算力基本能运行,但基于现实出发,这显然不能支撑3D机器视觉应用大规模普及化落地。
谈及算力单元,费浙平首先分析了3D机器视觉的系统架构,最前端的传感器就是2D的图像传感器,无论用红外光作为输入还是RGB输入,2D数据进来结合一些特定的光学方法得到特殊的图像,通过算法计算得出3D深度数据。
由3D相机完成的从多路2D数据算出3D距离和尺寸信息,这部分的计算和算法实现是比较标准化的算法套路,它的算力单元基本不会是GPU,也不会是CPU,图漾更加偏向用FPGA。当应用算法特别前沿,只有少数特殊客户愿意支付特别高的成本,不计成本实现最高精度的设备和产品,图漾才会用到GPU,做普及化的标准产品的话,FPGA是非常舒服也是性价比非常高的算力承载单元。
当基于3D数据和2D数据做具体应用的时候,会涉及很多上层的应用算法,其中既有传统算法,也有大量的机器人学习应用,目前很多场景采用机器学习的方法效果很好。这些上层应用软件的算力承载单元一定是通用可编程的,如GPU、CPU,不太可能是FPGA。
▲数据流动路径
通过数据流动的路径来看,不同的数据转换过程需要不同的芯片。首先,从物理世界得到2D信息,一定是图像传感器(Image Sensor),这是2D点数据的获取。
应用3D数据做应用场景一定是应用处理器(Application Processors)承担的,计算之后,如果是工业检测类的应用,任务就已完成,部分其他场景如AR/VR或是电视等应用,还需要将3D的模型和数据在2D显示平面上输出。这个3D转2D的过程是由GPU完成的。
图漾科技一直致力于实现从2D数据又快又好地算出3D数据的任务,也就是Depth Engine这个环节,从架构上来看,这正好是GPU的一种对称。GPU实现的功能就是3D到2D,Depth Engine做的事情是从2D到3D。从2D到3D的过程,基本是由3D相机在本地完成,为了达到低延时、高帧率和速度的目标,3D工业相机应该使用专用硬件计算单元。
在承载应用层算法的应用处理器这个算力单元,3D机器视觉对嵌入式的AI有可预见的强烈需求。图漾科技从某种程度上更像一个系统产品设计者,希望使用业界里面性能够用、性价比最高的嵌入式芯片,来完成最有竞争力和性价比的3D相机产品。
目前AI的计算成本太高是一个痛点。由于如今的高阶算法,尤其跟深度学习相关的算法,太多的软件资源建立在英伟达的CUDA生态上。虽然目前的多数CPU都有浮点、DSP的向量扩展,但是对支持机器学习算力仍然不够。
目前图漾科技并不需要云计算之类的高要求算力,但很希望能在本地实现合理规模的主流NN网络,这就需要嵌入式AI芯片,这类芯片中应该有合适规模的嵌入式CPU、GPU,有算力合适、价格合适的NN加速器,以集成的SoC形式呈现。
费浙平认为,嵌入式AI的出现,对于行业带动,无论工业自动化、工业测量、物流科技、商业场景的3D机器视觉落地都会是极大的推动。
以上是费浙平演讲内容的完整整理。