智东西(公众号:zhidxcom)
文 | 四月
导语:当人工智能概念被消费过度,深度学习算法优势逐渐消融,讲故事和吹数据在VC面前不再管用,由学术精英们打造的明星初创下一步该往哪走?
谈及国内计算机视觉创业,“一桶筐汤”(依图、格灵深瞳、旷视、商汤)是绕不开的资本宠儿,其中格灵深瞳在产品风格上特点显著。因其创始人赵勇偏向计算机视觉硬件方向的博士背景,使得这家公司更喜欢尝试硬件上的创新,从而也适时地避开了当下算法优势同质化的困境。
但技术型公司在早期还需依靠资本支持。2016年底,商汤、Face++均完成了上亿美元融资得以充足弹药,而并列其中的格灵深瞳似乎没啥动静,不免引起吃瓜群众的担忧。上半年提到的秘密武器“人眼摄像机”也不知落地了没有?带着些许疑惑和好奇心,智东西来到位于颐和园北面的格灵深瞳。
虽然早有耳闻格灵深瞳别具一格的办公环境,但在寒冬赶至这座古院中的公司仍不少惊喜。院中的湖面已结出薄冰,一只富态的喵爷正来回踱步,老树枯藤显得静谧而安详。听赵勇介绍,因团队规模扩充,年后公司要搬进奥北科技园。真是可惜了窗外的这幅水墨画。大概是受益于复旦大学的人文熏陶,赵勇给人的感觉温文儒雅,同时影响到格灵深瞳这家公司,幽深的庭院,韵味的门匾,古色古香,少了一丝商业味道。
在近两小时的对话中,赵勇从软硬件产品布局切入,深入分析了公司的下一步具体战略。早期的试探和走过弯路之后,格灵深瞳借硬件优势辅以大数据平台战法,跃跃欲试要在安防领域大干一场。同时身兼驭势科技合伙人的赵勇也披露了两家公司背后的深厚渊源。此外,赵勇也分享了对于计算机视觉在金融领域的应用考量,这同时也是格灵深瞳现阶段没有涉足两块市场的重要原因。在办公室内穿行的机器人小车则揭开了另一项产品的神秘面纱。
再回归到创业这个话题上。布朗大学计算机工程系求学,供职于谷歌资深研究员,前后十年的美国生活,是什么让赵勇毅然回国创业?除了满腔热血,我们还看到了一份更深切的情怀。
一、院里除了美景,还有四处的“人眼相机”
如果说门匾题词的招牌还让人对这家公司有些摸不着头脑,那么庭院里四处分设的“怪异摄像头”则有力地强调了他们的核心实力。据赵勇介绍,这是公司将不久后正式发货的产品“人眼相机”。该相机模块采用像素动态瞬时分配的专利技术,可实现50米半径范围内清晰识别人脸,100米内看清全身特征,200米内看清车辆信息;视场角达到80°;可以瞬间将局部画面的有效像素提升百倍以上(普通高清1080P摄像头200万像素),使整体画面达到两亿等效像素。
耳听为虚,眼见为实际。在庭院中走过一圈中后,赵勇带领笔者回到室内的测试间,站在一块大屏幕和普通摄像头前进行人脸比对测试。此时,庭院中的人眼相机已将远距离捕捉到的图像信息存储在云端后台,测试间的普通摄像头通过调用数据进行实时人像比对,在我尝试遮脸、侧脸、做鬼脸等非配合条件下测试后,后台仍能准确地找出我此前的图像,并且识别比对都是实时完成。
在测试间的普通摄像头面前,我们能够看到大概7-8米之外的人像已经完全模糊。据赵勇介绍,在我国99%的安全监测场景均使用普通高清摄像头,也就意味着在距离相机五米之外,人脸所占像素仅为75*75 pixel以下,无法实现人脸清晰比对和识别。
该类产品的推广意义也在于此,通过计算可以得到,按50米半径范围计算该“人眼相机”可覆盖的监控范围与足球场面积大小相当。“潜在逃犯在如此远的距离之外不会意识到摄像头的存在,疑犯线索也会更加丰富和准确”,赵勇分析。但如果后台数据都按两亿级别像素存储,后台数据的运行压力是否过大?针对此,赵勇进行了解释,图像存储过程中计算机会提取出有意义、有价值的信息,从而避免信息冗余。
虽然在成本和块头上,人眼相机都较普通摄像头高出一个个头。不过赵勇信心十足,“人眼相机的精度和识别范围在安防监控领域是独一无二的创新”。据介绍,经过近一年的各个试点测试后,该产品将于今年第一季度正式销售。但由于合作涉及国家安全机关,赵勇并未透露相关合作单位和应用地区。
此外,格灵深瞳在2015年还曾推出了一款“皓目”深度摄像头,用于银行内部的安防监控。在软件层面,格灵深瞳提供基于视频信息的大数据平台,功能是针对三类对象进行准确识别,并基于识别结果建立数据网络,进行横向对比与情报分析,锁定的三类对象包含人脸、人体、车辆,人体作为人脸识别的辅助手段。赵勇介绍,由于距离监控摄像头5-6米外人脸画面模糊,但可以捕捉到体貌信息,根据人体的装束和体貌特征进行分析。
在实际应用中,包括结构化分析和以图搜图等过程。其中结构化分析技术实用价值很强,针对上述提及的三类目标信息,能够把数据和图像转变成文字描述。赵勇举例, “比如识别到一辆汽车,反馈的信息可能是:这是一辆黑色的奥迪A6L,2014年款,三厢小轿车,年检标已经到了2017年,里边的司机系了安全带,抽着烟,副驾驶上没有人”。
总体而言,格灵深瞳输出的产品涵盖了算法、硬件产品、平台,以及整体解决方案,其中因硬件创新为其带来差异化竞争的可能。
二、安防:和手机市场规模相当的“大蛋糕”
聊完了产品的可行性,我们再来看看市场存量。据不完全统计,2015年我国安防行业市场规模在5000亿元之上,从海康威视和大华股份两家公司的财务数据来看,全年营业收入均在百亿以上,并且在网络化、智能化技术的推动下,每年还保持着较高增长率。以消费级电子市场中最成熟的手机行业来看,2015年的国内规模是6500亿元。在很多人不看好的B端领域里,安防领域是少有的规模级存量市场。
不过,蛋糕大并不意味着就有机会。在安防领域三国之势早已确立,海康威视、大华、宇视鼎力。作为后来者,格灵深瞳的机会在哪?赵勇给出的答案是“既竞争又合作”。在这个问题上,赵勇已经没有把同期的创业公司放在竞争的位置上,他认为各家的细分领域各异,更重要的是抢夺百亿甚至千亿规模的市场。
“在PC时代,我们看到的是英特尔微软戴尔之间的合作,但实际上也存在着PC、服务器等品类的竞争”,赵勇将其比喻成将来安防的市场格局:在硬件端,海康和大华的摄像头和录像机做得最大,网关方面华为是大头,但在未来安防将成为一个物联网,智能模块的需求会逐渐明显,人工智能技术出现新的机会,容纳新晋公司。这并不是泛泛而谈,在2008年奥运会带动的安防联网化后,已经培育出东方网力、佳都等新上市公司。
前景虽然明朗。但在当下,现金流仍是制约创业公司发展的重要瓶颈,尤其考虑到安防工程账期长。赵勇对此表示,前期资金问题公司已经解决,但并未透露融资进展。“to G/B端项目与to C项目在营收模式上存在很大不同,安防工程类项目毛利率在40%左右,但通常完整交付需要1-2年;消费级产品如手机虽然当下就能交付,但毛利率远不及前者”,赵勇介绍。在足够的利润保证下,银行贷款是更常见的筹资资金方式。
团队规模方面,格灵深瞳现员工约100人,60%为技术和产品团队,其他包括商务、销售等部门。据赵勇介绍,专项的售后服务今年正在建立,后期研发人员比例会降低。在早期试点期间,主要由工程师负责售前售后指导。此外,今年外地分公司也会陆续成立,负责外地业务订单。现在主力部队集中在北京,后续北京总部将更倾向于研发中心。
在团队管理上,格灵深瞳偏向“聚合式”。当提及不少科技公司在海外设立研发中心,格灵深瞳是否也会参考时,赵勇认为海外分支十分不便于管理,并没有计划。至于与高校的合作模式,格灵深瞳表示并不会投入太多精力和资源,“把公司办成大学并不是我们想做的事”。
三、开枝散叶:驭势科技的前世今生
经历了三四年的尝试和成长,格灵深瞳对于自身的行业定位与市场方向看得更加透彻,智能安防成为其押宝最大的一块市场,而此前在汽车视觉领域的接力棒则转至另一家兄弟公司手里。
据赵勇介绍,格灵深瞳最早在2014年中期成立汽车视觉团队进行研发,一直到2015年年底,“我开始意识到要真正做无人驾驶,需要一只更为完整的团队。包括感知、规划、控制等都需要在车上做测试,必须特别可靠”。随后,赵勇在2016年说服了前英特尔研究院院长吴甘沙、北京理工大学姜岩教授,三方共同成立驭势科技。而此前的格灵深瞳汽车视觉团队也由此并入到驭势科技,“我们已经将相关专利和技术转移至驭势名下,格灵深瞳作为联合创始人的身份,我个人作为董事只参与决策层面”。
此外,由于面向行业应用和政府部门市场的特殊性,赵勇决定将工作重心转移到市场和业务上,只担任格灵深瞳董事长职位。而当下CTO(首席技术官)职务赵勇也已找好了接班人,“邓亚峰是前IDL(百度深度学习研究院)的人脸识别项目主导者,国内研究人脸识别技术最早的专家之一。
虽然自动驾驶已成为创投圈热钱最为集中的领域,但赵勇表示,不会再以格灵深瞳的身份涉足。实际上,这是一步很聪明的棋,无人驾驶涉及的供应链条太长,一家技术公司无法支撑其背后相应的资源和规模,分拆出来算是最好的出路。但另一方面,业务线的减弱也可能削弱其融资能力。
谈及产品线,除了前文提及的各类摄像头,这次我们还意外地发现了正在研发阶段的机器人小车。赵勇表示,更多细节会在后续公布。从外形上看,该款机器人则更偏向完整产品形态,可能是消费级市场或行业应用的试水。
除了安防领域,计算机视觉的另一大应用场景在于金融领域,但赵勇并没有表示很大的兴趣,追问下来,其原因有二:1)技术门槛低,现阶段在银行门店推广人脸识别主要用于验证比对,即1:1识别,相较于安防领域m:n难度不在一个数量级,在当下实现难度不大;2)市场存量小,银行人流量有限,用户调用频率较低。大多数情况下,银行只是购买服务器,并不是按调用次数付费。
四、故事不尽相同,但情怀总是相似
格灵深瞳创立于2013年初,要追溯起赵勇创业前的那段历史或许有些久远了。但也正是在不断深究下,身居美国十年后促使赵勇回国创业的更深层原因浮出水面,在这背后跳动着一颗关于国家、关于梦想的赤子之心。
赵勇本科与硕士研究生毕业于复旦大学电子系,2003年来到美国布朗大学研读博士计算机工程系,专攻计算机视觉(Computer Vision)和运算影像学(Computational Photography)。曾在三菱电器研究所(Cambridge)、爱普生实验室(San Jose)、Nvidia 实验室(Santa Clara)和惠普实验室(Palo Alto)担任实习研究员。
2010 年起,赵勇供职于谷歌总部研究院任资深研究员,需要说明的是,在谷歌研究员是比工程师要稀罕得多的人物,基本上掰手指头就能数完。在Google任职期间,赵勇设计了安卓操作系统的图像处理架构,Google Glass的光学部分也都是赵勇的杰作。2013 年 4 月作为联合创始人创立格灵深瞳。
之所以选择创业,赵勇表示是对于当时国内一批兴起的互联网巨头好奇心趋势。“硅谷有Goolge、Facebook、Amazon,中国有BAT和华为,这是件很不可思议的事,要知道我当年出国时,很多同学都是抢着去外企,而看不上国企的”。但至于为何解释在美国十年仍旧保留中国国籍,大概是在赵勇心中早已种下一颗回国创业梦。
据赵勇介绍,他在博士期间偏向硬件安全研究方向,曾参与到美国一些涉及安防的保密等级项目,曾因为国籍原因而无法深入。毕业选择工作,赵勇也试问自己是否要因为工作而改变国籍,“无论我拿什么护照,我仍是一个华人,如果改变国籍涉及到国家利益必然要作出两难抉择,这是我不愿面对的”。随后,赵勇加入了面向全球消费用户的Google工作,倒也落得自在开心,不用承受内心的煎熬。但关乎安防专业、关乎回国明志的念头一直没断过,随着计算视觉和传感器技术成熟,国家日益强大,回国创业于赵勇而言也成了顺势而为之举。
结语
在近两小时的访谈中,无论是赵勇,还是格灵深瞳都给我留下了十分深刻的印象。内部管理和工作氛围上散而不乱,置身于繁杂浮躁的北京城,还能找到这样一块静谧之地潜心做产品和研究,食堂和宿舍俱全,员工自然安心。但更为重要的是,作为掌舵人,赵勇抛开科技初创一套的“繁文缛节”,设海外研发分部、联合高校搞研究、融资PR等更多是博名头,在创业早期还是团结步伐一致往前比较快。另外,适时放权退居幕后也不失为明智之举。
在公司战略层面,经历了近四年的沉淀和摸索,格灵深瞳有的放矢,没有把饼铺得过大。消费级应用、金融领域的收敛为安防市场积蓄更多力量,同时汽车视觉的分叉让技术得到衍生和发挥空间。人眼相机的落地则让我们看到格灵深瞳更踏实的成果。但放到安防市场上看,格灵深瞳作为新晋小生,要想分跟上市巨头争市场抢份额,必然要在前期更吃苦耐劳才行。
在技术领域,资本的助推作用并不好比纯互联网砸钱模式,当人工智能概念被消费过度,深度学习算法优势逐渐消融,讲故事和吹数据在VC面前不再管用,由学术精英们打造的明星初创下一步该如何自力更生才是强者之道。
每日一头条
趋势·深度·犀利·干货,最专业的行业解读
深喉爆料、投稿:guoren@zhidx.com