weixin

潜入谷歌一天:探秘逆天的人工智能“航母”

海中天人工智能 机器视觉 自然语言处理 计算机视觉 语音识别2017/05/17

智东西(公众号:zhidxcom) 编 | 海中天 导语:PCMag记者在谷歌总部呆了一天,深入了解AI与机器 […]

智东西(公众号:zhidxcom)
编 | 海中天

导语:PCMag记者在谷歌总部呆了一天,深入了解AI与机器学习是如何在谷歌内部渗透的。他们采访了许多高管,谷歌的目标就是围绕AI打造一个生态系统,将重复的人工处理变成自动流程,用AI为企业服务。

Makoto Koike是日本一名农民,种植黄瓜。之前他是嵌入式系统设计师,在日本汽车行业工作,2015年他回到故乡,帮助父母种黄瓜。很快,他就发现要给黄瓜分类很麻烦,农民要根据颜色、形状、尺寸、特点(比如是否多刺)给黄瓜分类,工作很棘手,比种黄瓜还要费力。谷歌开发了AI软件AlphaGo,受到谷歌的启发,Makoto Koike想将任务变成自动化流程。

现在企业已经开始通过各种方式将AI应用于实际,不过还没有人看到过类似的技术出现过。Koike之前从没有从事过AI技术方面的工作,有了开源TensorFlow机器学习技术,他开始将黄瓜的图片输入系统。计算机视觉算法已经可以识别对象,深度学习可以根据黄瓜的细微差别训练TensorFlow,Koike意识到它可以用来识别、分类蔬菜,精准度很高。然后,Koike只用了TensorFlow和一台便宜的Raspberry Pi 3计算机就制作出自动分类机器,今天农场还在使用这台机器。

市场上有许多的开源算法和工具,TensorFlow只是其中之一,企业和开发者想用AI解决一些问题,TensorFlow可以为他们的工作带来革命性影响。谷歌将这些技术和应用程序界面(API)放进自己所做的一切事情中,将机器学习植入产品,从根本上重新定义了软件的运行流程。

最近,PCMag拜访了Googleplex(也就是谷歌总部),采访了一些高管,他们来自G Suite、谷歌云平台(Google Cloud Platform)、机器学习先进解决方案实验室(Machine Learning Advanced Solution Lab,ML ASL),了解谷歌是如何用AI技术重塑自我的。

1

AI无处不在

假设你的一个客户遇到了问题,公司服务部门的一名代理用Google My Business与客户在网上沟通,Google My Business是一个聊天功能,目前还处在试点阶段。要帮助客户解决问题,用户需要将一些敏感个人数据发给代理。现在假设客户是你的祖母。客户服务代表要求你的祖母发一些数据,少量的数据,你的祖母在聊天过程中上传一张图片,一张社会保障卡的图片,但是她提交的信息比要求的多。

现在谷歌不是这样做的,它会将个人身份信息(PII)归档,带有社会保障号的图片出现之后,其它PII信息也会自动匹配。代理看不到多余的信息,也不会有任何数据放进谷歌加密档案。在加州谷歌山景城总部,公司员工演示了Google My Business的新功能,到底机器学习算法是怎样完成使命的呢?谷歌揭开了神秘的面纱。

谷歌云计算信任与安全营销主管Rob Sadowski解释称,自动编辑是通过谷歌数据损失预防(DLP) API完成的,它是底层技术,给敏感数据分类是表面。算法还可以用同样的方式处理一些数据,比如信用卡号码,如果号码是假的,它可以分析模式,进行识别。谷歌想将AI放进体验中,让企业、开发者(比如Koike)有资源做同样的事情,这只是谷歌精妙策略的一个例证。

有许多科技巨头正在尝试将互联智能层植入软件,不只是谷歌这样做,还有亚马逊和微软,不过与它们相比谷歌的云智能工具和服务无疑宽泛很多。分析谷歌产品,你会发现谷歌助手、多种机器学习系统、计算机视觉API无处不在。

谷歌搜索在RankBrain AI系统使用了机器学习技术,根据众多变量处理精炼提问、重新排序、聚合数据,不断改进搜索结果。谷歌Photos用计算机视觉技术拼接照片,将它化为回忆,将同一个地点的多张图片变成全景图。Inbox可以自动生成“智能回复(Smart Replies)”,供用户选择,通过将相似类型的邮件捆绑,让高度相关的邮件突出显示。新的谷歌Allo聊天APP内置了谷歌助手。还有更多的工具使用了AI技术。

所有这些APP都是在谷歌云基础设施上运行的,谷歌在数据中心使用了机器学习技术,用它降低能耗,根据负载、天气信息调整冷却泵。Sadowski说,在谷歌的安全战略中,机器学习也是最后的防护层,谷歌在安全堆栈中用机器智力、风险评分判断系统使用可预测分析是否存在缺陷。

2

Sadowski解释称:“谷歌开发了许多机器学习和AI模型,公司从安全角度着眼将所有模型优化。与IT大多的部分相比,安全是变化比较大的。3年或者4年前,有些产品是安全基础设施的核心,比如防火墙、端点防护,这些技术仍然很重要,但是我们想提供更深的防护,让它规模化应用,将它作为默认技术放置在多租户基础设施上,每天可以有几百万活跃用户。”

“我们从底层数据中心硬件开始起步,比如最新的Titan芯片。”Sadowski继续说,“在此之上是应用服务、身份验证,数据与通信完全加密。再上层是用户身份。如何才能7天24小时监控、侦测、响应事件,这是最后的防护层。例如,如果要让用户通过身份认知代理远程接入,我们就会有类似的技术确保安全。它是一项可编程的DLP服务,能够发现并防范数据泄露,帮助管理数据,增强安全性。我们的目标是让这些功能变得更容易使用,变成可消费服务,大规模推广。”

智能G Suite

机器学习技术已经植入谷歌G Suite生产应用中。G Suite产品管理主管Allan Livingston介绍了一些谷歌所采用的方法,这些方法使得G Suite更智能、更能感知环境,甚至连用户都意识不到。

Livingston解释称:“你可以想像一下,G Suite将所有应用以更自然的方式整合在一起。你从其中一个应用开始工作,以适当的方式过渡到其它应用。你在Drive中打开Gmail附件,它将你带到Docs,完全自动。”

“我们努力站在用户的角度思考,当中会涉及到机器学习。我们最先从Gmail智能回复开始,然后在Inbox取得了成功,接下来又在Docs、Sheets、Slides中引进了Explore功能。”

3

Explore于去年秋天推出,它将自然语言处理技术应用于程序内生产体验。例如,在Docs中,Explore可以根据文档内容瞬间提供建议,还可以自动推荐相关主题和资源。在Slides中,它可以生成设计建议,让用户精简陈述格式。Livingston解释了Explore是如何用机器学习简化数据分析、商业智能情报的。

“许多用户不知道数据透视表是什么,也不知道如何利用它将数据表视觉化。” Livingston解释称,“假设你要处理一名客户的销售数据,每一行都是一件已经销售的商品。Explore允许你用自然语言提问,比如:‘黑色星期五最畅销的是什么商品?’系统会回答说:‘你卖了563条裤子。’在数据分析过程中我们可以节省时间,因为决策是以数据作为基础的,我们用机器学习以更自然的方式提高解决普通问题的能力。”

Livingston还说,谷歌准备将这种机器学习云搜索功能提供给第三方,它开始围绕新技术建立一个生态系统。谷歌的总思路实际上与AI的实用性有关:让人工处理实现自动化,将用户解放出来,让他们从事更有创造性的工作。这种思路实际上已经成为大多机器学习APP的核心:让重复性业务流程自动化,让日常任务(包括黄瓜分类)变成自动化流程。

“在商业行为中,与消费者沟通时,用户已经使用这些自然交互模式。向云计算和移动生产力转移改变了人们的工作方式,而机器学习技术又是其根本。”Livingston说,“因为我们在机器学习方面有优势,因为我们的产品可以作为基础提供服务,因为所有数据全都放在我们的云计算网络中,所以我们占据了最佳位置,可以使用它,以规模化方式应用。”
4

为机器学习革命提供动力

谷歌在AI方面所做的一切工作都是以API、算法、开源工具作为根基的。谷歌TensorFlow 资源库是GitHub平台上最流行的机器学习工具,许多应用程序采用,比如Koike黄瓜分类程序。整套API就是谷歌云计算的根本,正是它为谷歌APP和服务的每一个AI功能提供动力。

谷歌研究与机器智能产品经理Francisco Uribe为引擎核心工作,正是这个核心改变了谷歌的运行模式。Uribe掌管谷歌ML ASL,它是一个实验室,谷歌机器学习专家直接与企业合作,将AI解决方案植入企业。通过谷歌API和云计算机器学习引擎,实验室与企业携手合作,帮助企业在生产过程中训练、部署模型。

Uribe在AI领域工作了10多年。他成立了BlackLocus,这是一家数据创业公司,为零售商开发自动比价引擎,2012年被家德宝收购。之后Uribe加入谷歌,在搜索广告团队工作了4年,用机器学习改进广告体验。2016年,他进入ML ASL,负责开发工作,成为Launchpad Accelerator的导师。Uribe说,企业和开发者积极使用谷歌工具,他感到相当惊讶。

“我们看到工具应用于多个领域,包括健康护理、金融、零售和农业。”Uribe解释说,“我们正在努力帮助客户增强感知能力。语音翻译、图像识别、视频API、自然语言:它们都是民主接入机器、深度学习算法的组成部分,这些算法终于变得适用了。”

ML ASL与汇丰银行合作,用机器学习解决方案反制洗钱活动,预测信用评分。ML ASL还与联合服务汽车协会(USAA)合作,帮它训练机器学习工程师,将技术应用于保险领域。eBay用谷歌工具训练ShopBot 数字助手。Uribe解释称,当ML ASL与企业合作时,整个过程包含4个重要部分。

“机器学习工作的要求很高,你需要强大的计算产品才能满足要求,你还要用GCP的分布式光纤骨干网络传输数据,以很高的效率从一个节点传输到另一个节点。”Uribe说,“我们有云机器学习引擎(Cloud Machine Learning Engine),可以帮助客户训练模型,我们利用Kaggle社区帮助客户处理数据,那里有800名活跃的数据科学家。最终,你还需要人才,在研发方面,我们有Brain Residency Program,这个项目用复杂的机器学习课程培训工程师。它们都是组成部分,共同帮助客户构建智能应用。”

所有这些东西都放进了开源社区和第三方生态系统。年初时,谷歌宣布举办机器学习创业公司挑战赛,机器学习创业公司如果拿奖,最高可获50万美元投资。Uribe谈到了一些创业应用,这些应用是Uribe在谷歌技术中看到的,未来也许会出现其它的变化。

“假设你有一家客户服务分析公司,你们用语音API转化语音呼叫,然后分析情感,提高客服质量。”Uribe说,“到了外国,你可以用视觉API拍一张街道标志的照片,然后翻译API就可以实时在APP中将内容翻译出来。它不只可以提高效率,还可以创造新颖、独特的用户体验。”

Uribe认为,因为TensorFlow等工具的存在,在市场上大规模推广机器学习技术变得更容易了。谷歌是什么?谷歌如何开发产品?现在这些技术已经成为核心,不只如此,Uribe还相信广泛存在的机器学习技术可以优化业务、创造新的营收流、发明新型智能APP。

他还说:“我们可以将它视为新的工业革命,这些工具可以大幅提高效率,带来前年未有的体验。创业公司积极采用,我们感到惊讶。看看日本种黄瓜的农民,他用TensorFlow开发一个模型,根据模样、尺寸、纹理等标准给黄瓜分类,然后自己制作特殊硬件执行。这是一种民主化进程,让人惊叹,我们现在只是触及表面。”

原文来自:pcmag
zhidx