独家对话李彦宏选中的年轻人们:创造盲人眼镜和自动驾驶轮椅

智东西(公众号:zhidxcom)
文 | 心缘

智东西7月6日消息,本周三,在第二届百度AI开发者大会(Baidu Create 2018)上,百度创始人、董事长兼CEO李彦宏特别点名了几位充满创造力的年轻开发者,包括做出自动驾驶轮椅的李连伟、赵岳和童谣、实现无人政务机的黎英明以及打造盲人导路系统的梁佳。李彦宏对每一位开发者表示祝贺,希望“和全球有梦想的开发者一起,用创新和开放的力量,实现Everyone Can AI的初心和梦想!”

在大会现场,李彦宏透露了百度开放平台的一些数据,截至6月中旬,语音、视觉、自然语言处理技术的日调用量分别增长了94%、416%和180%,并提出“用脑量”将成行业智能化关键指标。自去年百度AI开发者大会以来,无数的企业、团队和个人开发者借助百度AI开放平台,将AI技术和医疗、政务、零售、安防、教育等各个领域连接,将自己的创想变为现实。

会后,智东西特意对李彦宏提到的几位开发者们进行了独家专访,透过这些虽显青涩却潜力无穷的“理工大神”作品里,我们能够看到AI是如何平等便捷地融入各行各业,在无数细节上对用户生活生产流程进行着优化与推动。

一、北邮团队:自动驾驶轮椅——行动不便者的福音

正规医院存在一个普遍现象,看病的人多,医生、护士都非常忙碌,很多时候无暇顾及老人、残疾人等腿脚不方便的群体。

为了满足这些特殊人群的出行需求,北京邮电大学计算机学院的大三学生赵岳、李连伟和童谣,基于百度深度学习框架PaddlePaddle开发出自动驾驶轮椅。他们通过GPIO对轮子控制电机转动,利用pwm脉宽调制数模转换来控制电机的转动频率以控制车速,然后对实时传入的照片进行文字识别,经信息处理后实现小车自动的路径规划。

独家对话李彦宏选中的年轻人们:创造盲人眼镜和自动驾驶轮椅
▲李连伟(图左)、赵岳(图右)和他们的自动驾驶轮椅

1、第一次接触AI,开发难度并不大

这个故事的三位主人公是先决定参加今年4月份的竞赛,之后才确定项目主题,这也是他们首次接触AI技术。

这个项目最初由赵岳提出。因为妈妈是医生而从小在医院长大的他,总是看见病人被家人或医护人员推着轮椅在医院里走,感觉不仅病人行动不方便,还浪费不少人力。顺着自动驾驶的潮流,他们最终决定选择了自动驾驶轮椅这个方向。

在了解百度开源平台后,北邮团队发现其提供的AI技术恰好能满足他们的功能需求。于是,该团队使用了百度AI开放平台的文字识别技术,先在传感器读取的图像中识别到一些指示性文字,然后确定它的方向坐标,在没有发现文字坐标的地方进行转向,从而实现自动驾驶的功能。他们表示,目前实现的功能相对简单,在查看了百度提供的开发文档就直接使用了,没有遇到太大的难度。

由于受限于时间和资金,他们没能做出最终成品。不过他们已经做了一个相当于Demo的简易轮椅,设计的自动避障、自动选一个科室等基本功能也都已经实现。

2、时间和资金是最大难题

作为即将考研的大三学生,对于来自北邮的这个团队来说,时间和资金是最大困难。

从4月份开始了解竞赛到现在,只有短短两个多月的时间。由于这个项目是要将AI技术和硬件结合,需要很长时间的调试,时间不够,导致很多想法来不及实施。大学生们第一次接触硬件,因为资金不足,承担不起高额的电机费用,他们只能选择最低成本的硬件,用电机搭出一套Demo机。

实验总是充满波折和乐趣。对于程序员而言,最大的乐趣或许就在于把自己的想法变现的过程。在第一次试验时,轮椅跑的比摩托车还快,他们一直说老人坐上去心脏受不了。还有在搭硬件时,由于线路很多,左边和右边的轮子经常弄反了,结果导致轮椅经常跑起来左右不分,对遇障和路线左右都乱了方向。这些实验中遇到的小插曲都令他们印象深刻。

独家对话李彦宏选中的年轻人们:创造盲人眼镜和自动驾驶轮椅
▲童谣(图左)、赵岳(图右)和他们的自动驾驶轮椅

三位同学即将准备考研,不得不将这个项目暂时搁置,他们只有在考研结束后才有机会有时间继续进行这个项目。

3、学校研究氛围浓厚,AI已成热门研究方向

三位同学表示在学校里同学之间的学习氛围非常浓厚,大部分学生都很优秀,学习都非常认真,大家大部分时间都是在码代码、讨论知识中渡过的。在日常生活中,他们也会偶尔打打游戏缓解压力。

他们都有向AI方向深造的打算。赵岳说,他们学校各个导师做的工作都会或多或少的涉及到AI方面的工作,所以他打算先考研,在和老师沟通后再确定具体方向。童谣和李连伟则表现出对AI助力游戏设计方面的兴趣,李连伟想用AI技术让NPC更加智能仿真。

二、黎英明:无人政务机——让办事流程更简易

尽管现在很多政府办事大厅设置有自助触屏平台,自助平台仍存在选项繁多、操作复杂、办事流程长、效率低等问题,既浪费办事者的时间,也增加工作人员的负担。

针对这一痛点,作为企业应用开发者之一的黎英明,整合百度AI开发平台的语音、人脸识别、UNIT等多项技术,开发了24小时无人值守政务机,为公众提供全年无休的24小时的智能自助办事服务。黎英明自己也在企业中快速成长,在短短两年间从一名实习生成长为产品总监。

独家对话李彦宏选中的年轻人们:创造盲人眼镜和自动驾驶轮椅
▲开发者黎英明和他的无人政务机

1、偶遇百度大脑,从“机器”到“智能机器”

黎英明加入的上海卓繁信息成立于2001年,该企业做了十几年电子政务,他刚进公司就从底层开发接触到无人自助政务机。起初这个项目只是简单的触摸式交互,在试运行时,他发现一个问题,当人们要办理一件事情,会在屏幕上点来点去找不到。

2017年8月,黎英明看到百度AI开发者大会发布百度大脑,新的想法蹦了出来,为什么不给政务机加上智能呢?于是,黎英明开始在原政务机的基础上使用百度提供的AI技术,通过Unity语音对话形式,让机器直接帮用户找到对应选项,从而提高用户操作效率,实现用智能代替人工服务。此外,政务机还增加了人脸识别、文字识别和智能预审等功能。

在和政府合作过程中,黎英明遇到最大的难题就是政府事项庞大的基数,每个事项的办理流程都不一样,几千个事项交叉之后,形成的线路错综复杂。为了攻破这一难点,黎英明在几个月前开始通过PaddlePaddle平台使用深度学习技术去训练政务机,实现快速梳理出一条最佳办事流程线路,他预计将在下一个季度把模型完善好。

目前,该项目已在全国多个城市实现落地,比如安徽的潞安、芜湖,内蒙的鄂尔多斯以及湖南郴州等。今年这个项目最大的落地将是在上海徐汇区行政服务中心,预计在9月15日该中心整栋楼都会改造,届时会应用到很多智能无人政务机。

2、AI社群技术交流,无偿分享代码

在刚开始接触百度AI开放平台时,黎英明还是以一个开发者的姿态自行研究这些技术。不久,他渐渐发现越来越多的问题。于是,他加入百度的社群和QQ群,不断向PM等人提问,像是SDK、调用失败等问题都得到了耐心的帮助和指导。在黎英明将AI技术与政务机进行整合后,他们告诉百度自己的想法。随后百度来公司考察,并和他们建立了优秀合作伙伴关系,为他们在技术方面提供了很大的支持。

黎英明对在AI社区中的体验记忆犹新。他在AI社区里比较活跃,从和不同人的讨论中得到新的灵感和体会。比如在做Unity语音交互的时候,黎英明曾遇到如何使交互体验进一步升级的问题,社区中大神们的独到的见解给了他很大的启发,他们会快速帮忙查找问题,也会分享优化技术的心得。作为开发者,很多大神还会讨论如何去利用技术,比如去测试一个新开发的接口、实现一个什么样的Demo、做成一个什么样的产品。在这些思想的碰撞中,黎英明收获了学习的乐趣。

得益于百度等开源技术,他也将自己的技术都写在百度AI社区中和大家分享,而且不介意无偿把代码给别人作为参考。除了设计公司产品外,黎英明以后想以个人名义可能用实现过的百度AI技术做一些小程序,比如拍照识别花朵名称等信息、通过拍照上传检测颜值并打分等。

作为一个靠技术吃饭的人,黎英明看重技术的可行性和易操作性。国外的平台技术可能在国内会受到一些限制,而百度自己的开发平台对于中国人而言更容易快速上手。黎英明认为百度AI开放平台的推出,使得开发者无需再为不理解底层设计而烦恼,这为每个开发者都提供了一个快速实现梦想的机会。

三、梁佳:盲人导路——使盲人安全出行

在人们日常生活中,盲道是一个常见而又极易被忽略的基础设施,而盲道的损坏以及常常出现的障碍物都对盲人群体造成隐患。

为了使盲人独立出行更加方便和安全,来自合肥学院的梁佳用百度的EasyDL定制化图像识别技术对模型进行训练,希望结合可穿戴设备实现盲人导航。这一项目在今年的百度EasyDL不可思议挑战赛(百度EasyDL组织举办的图像定制化平台创意开发比赛)上夺得了桂冠。

独家对话李彦宏选中的年轻人们:创造盲人眼镜和自动驾驶轮椅
▲开发者梁佳

1、从盲道受损获得启发

“小时候,我还以为盲道只是为了美化。”在长大些后,梁佳观察到,很多盲道会因为修路或者修光缆而遭到破坏,有些路段甚至根本没有盲道,盲人出行原本就比普通人更困难,加上这些基础设施的缺失,更是雪上又加霜。

因此,梁佳想做一个能够戴在盲人头上的设备来帮助他们出行。他的解决方案是借助头戴式设备或像谷歌眼镜一样的可穿戴设备实时采集路面信息,通过调用训练好的模型识别当前的路面状况,使用语音或震动的方式提醒盲人,进而帮助盲人避开路面障碍。尽管离EasyDL比赛才过去一个多月,梁佳的模型top1和top5准确率达100%,校验数据置信度高达85%。

2、街道采集多难题:数据少,脸皮“薄”

采集道路照片不轻松,但这一过程对模型训练必不可少。在梁佳的项目中,道路识别是重要的组成部分,这需要大量的道路数据来支撑,而现阶段他遭遇的主要难题就是数据量较少。在项目前期,梁佳采集了合肥的5条街道,使用3万多张照片对参赛模型进行训练。然而,想要得到通用性更强的模型,需要采集的数据远远不止如此。

对于容易害羞的人来说,采集数据可不是一件轻松的事。梁佳第一次出去采集道路信息,就觉得特别不好意思。于是,他把手机插在耳朵上,然后再用自拍杆举着拍路面。“有的人凑上来问我是不是再直播,”梁佳哭笑不得地说,他每次都回答是在搞科研。

3、EasyDL平台提供技术支持

在项目研发过程中,梁佳全程使用百度EasyDL平台。作为初次使用这个平台的开发者,梁佳曾经遇到不少困难,这些问题都在百度的帮助下得以解决。梁佳加入了百度内部的技术QQ群,他可以在群里请教百度的技术员。此外,百度还有AI社区,他也会参考很多帖子中介绍的平台使用方法。

梁佳表示,如果搁在以前,个人开发者去从头打造一个AI项目是非常困难的,因为要学习很多数学知识,还要接触各类硬件设备。如今,百度AI开放平台的开放,让每一个开发者都能参与到AI技术的使用,然后开发出更多的AI产品或应用。

4、进军地况更复杂的重庆、香港

由于其团队才组建,目前只完成到模型阶段。项目在EasyDL平台获得的高识别率,使梁佳大受鼓舞。他想要在未来实现盲人导路项目的真正落地。目前,他已经在组建团队,准备参加今年教育部举办的中国“互联网+”大学生创新创业大赛,希望通过这个比赛可以找到投资人,从而将项目真正落实。

如果未来这个项目实现落地了,梁佳希望到像香港、重庆等道路情况比较复杂的城市,去进行更多模型的训练,进一步提高项目的可行性。不管是作为一个商业项目还是公益项目,梁佳都希望能够帮助更多的盲人。尽管创业需要一些条件和机遇,梁佳还考虑在创业方面去进行更多的尝试。

结语:平等赋能每一个AI开发者

正如李彦宏所言:“AI只是工具,开发者才是改变世界的终极力量。”在本次百度AI开发者大会上,百度大脑公布3.0版本,开放110+能力,开放平台DuerOS、Apollo以及智能小程序也将不断开源开放。零算法基础的AI开放平台赋予每一位开发者平等便捷的创新能力和机遇。

无论年龄几何,无论从事哪个行业,千千万万个像李连伟、赵岳、童谣、黎英明、梁佳一样的开发者,在不需要触及复杂晦涩的底层算法的情况下,正利用开放平台提供的AI技术实现奇思妙想,做出更多惠及生活的产品。

星星之火,可以燎原。一个开发者的力量或许很微小,但当无数开发者投入到AI创造的洪流之中,不断拓展AI技术的应用场景,改变世界就指日可待。从现在到未来,从工业到农业,从家居到出行,“Everyone Can AI”,全民AI时代或将来临。

百度有技术,你有创意和梦想吗?

独家对话李彦宏选中的年轻人们:创造盲人眼镜和自动驾驶轮椅