解读FB可自我学习的AI产品Deeptext，它能读懂你的聊天内容

智东西（公众号：zhidxcom）
文 | 海中天

先是微软，然后是Facebook，再然后是谷歌，互联网科技巨头都在追求同一个未来：聊天机器人。这些企业向世人承诺：未来，你可以与互联网服务聊天，如同与朋友家人聊天一样。机器人可以迅速回答问题，可以对提问做出回应，甚至可以预测你的需求。

然而科技企业还面临一个大挑战：开发出真正可以聊天的机器人。在某种程度上，机器的确可以模仿对话，但是要想真正像人一样交流还很遥远。上个月，谷歌开放了自然语言理解工具，最近Facebook推出了DeepText，它也是一个自然语言引擎。Facebook还没有开放技术，DeepText现在只用在Facebook自己的服务中。在开发系统时，Facebook的目标是更少地依赖人力，更多地依赖数据——海量的在线数据。

谷歌和Facebook都利用深度神经网络来推动自然语言技术的发展。在许多其它在线服务中，深度神经网络已经证明了自己的能力，比如识别图片，确定智能手机语音命令，企业希望通过分析海量数据，由软件和硬件组成的深度神经网络能够学习离散的任务，以自然的形式学习、理解语言并作出回应。

谷歌的新开源系统名叫SyntaxNet，它利用神经网络来理解给定语句的语法逻辑。Facebook研究者认为，他们已经做好准备将尖端技术应用于新领域。Facebook工程主管候赛因•马哈尼（Hussein Mehanna）表示：“DeepText帮助我们弥补标签式数据集的不足，它拥有大量的架构，可以按无监督的方式学习。”也就是说Facebook的系统更多依赖数据，而不是精准的语法。

深度学习创业公司Skymind的创始人克里斯•尼科尔森（Chris Nicholson）解释说：“Facebook的意思就是说他们没有必要将语言架构的一切教给神经网络。”这一点相当重要，尼科尔森补充说，Facebook可以打造更具弹性的系统：系统能够扩展，应用于许多不同的环境。按照学习英语的方法，Facebook系统能够学习法语和西班牙语——可以将语言拆解为数学。马哈尼说，DeepText已经可以处理20种不同的语言。

放在过去，研究人员用精细的代码规则来开发神经语言引擎，这种方法很困难，很耗费时间。苹果的Siri正是这样开发出来的。如果能构建自己学习的系统，谷歌和Facebook等企业就可以开发自动成长的系统，人为干涉越多，系统越聪明。这点我们目前还做不到。Facebook的方法还处在发展初期，真的管用吗？并不是所有人都能信服。

华盛顿大学计算机科学家诺亚•史密斯（Noah Smith）是神经语言理解方面的专家，他阅读了Faebook最近刊发的研究报告，在史密斯看来，要想通过无标签数据达到可以理解语言的程度，Facebook系统很难做到，离目标仍然遥远，他认为Facebook 的方法并没有什么特别激动人心的地方。尽管如此，史密斯及其它一些人都深信，研究的方向是正确的。

马哈尼说，今年夏天，Facebook将会刊发与DeepText有关的新研究报告。目前公司正在测试工具，让DeepText成为Facebook Messenger的内部驱动。马哈尼还解释说，当你与朋友、家人对话时，当你想打的时，系统会帮助用户识别。我们有理由相信Facebook在研究中占据优势，因为它拥有“数据”。

要从自然语言中学习，你必须拥有大量的自然语言——数字形式的自然语言。不久之前，要获得这种语言还很困难。Facebook拥有众多的数字式自然语言，因为每天社交网站上都会产生无数真实的对话。马哈尼称，每分钟，网民会在Facebook上创造40万篇新帖子，每天针对帖子的评论会达到8000万条。

开发DeepText的目的

在Facebook上，文本是一种主要的沟通方式。理解不同的文本形式，无疑可以改进Facebook的产品体验，如果用户想看到更多内容，Facebook就可以显示多一点内容，如果人们不喜欢这些内容就可以过滤。

正是因为这个目标，Facebook开发了DeepText，它是一个深度学习文本理解引擎，每秒引擎能够理解几千篇纯文本内容的帖子——精准度接近人类，它已经覆盖20多种语言。

DeepText整合了几种深度神经网络架构，包括卷积神经网络、递归神经网络，能够进行词汇级、字符级的学习。Facebook利用 FbLearner Flow 和Torch进行模型训练。通过FBLearner Predictor平台，按一下按钮就可以对模型进行训练，FBLearner Predictor平台拥有可扩展、可靠的模型分配基础架构。DeepText还能够提供自服务架构，通过该架构，Facebook可以轻易开发新的DeepText模型。

为什么是深度学习？

文本理解包括了许多的任务，比如对文本进行分类，确定帖子与什么有关（比如，与篮球有关），还要识别标题，比如运动员的名字，比赛的统计及其它有意义的信息。要像人类一样理解文本，我们需要对计算机进行训练，让它可以理解理解行话、感知词汇歧义。例如，如果有人说：“我喜欢黑莓。”他说的黑莓是水果还是设备？

要理解Facebook文本，需要解决一些棘手的问题，传统的NLP（神经语言程序）技术不管用。使用深度学习，Facebook能够在多种语言上更好地理解文本，能够更有效的利用标签式数据——比传统NLP技术更有效率。

更快地理解语言

Facebook社区是面向全球的，让DeepText尽可能多地理解各种语言是至关重要的。传统NLP技术需要广泛的预处理逻辑，它们是建立在复杂的工程、语言技术之上的。在每一种语言内部还存在各种变体，因为人们会使用俚语，在沟通同一个意思时会使用不同的拼写方式。利用深度学习，我们就可以减少对独立语言知识的依赖，因为系统不需要、或者只需要少量的预处理就可以从文本中学习。这样一来Facebook就可以快速学习多种语言，只需要在工程上稍作调整就可以了。

更深入地理解

按照传统的NLP方法，词汇需要转化为计算机算法可以理解的格式。比如，“兄弟”这个词汇可能会拥有一个整数ID，例如4598，当中的“兄”可能又会有另一个整数ID，例如986665。为了方便理解，在训练数据中，每一个词汇都要有具体的拼写形式。

在深度学习中，我们可以使用“词汇嵌入（word embeddings）”方法，它是一个数学概念，能够保留词汇之间的语义关系。如果我们的计算是正确的，嵌入“兄弟”和“兄”的词汇在空间上应该是很接近的。通过这种方式，我们可以深入理解词汇的语义关系。

在Facebook上测试DeepText

到目前为止，DeepText已经在Facebook的一些体验中进行测试。例如Messenger，当某人想去某地时，它的理解能力比过去有所提高。DeepText可以对用户的意图进行侦测，进行实体抽取，理解该用户所说的“我刚从的士下来”并不是要找一辆的士。

Facebook已经开始使用高精准度、多语言DeepText模型帮助人们寻找适合的工具。例如，如果某人发帖说：“我想出售旧自行车，定价200美元，有人感兴趣吗？”DeepText会侦测出售东西的贴子，提取一些有用的信息，比如出售的物品是什么，标价是多少，让卖家利用现有工具更快速地达成交易。

DeepText能够掌握帖子的意图、情绪与实体（比如人、地点、事件），理解混合内容信号，比如文本和图片，自动剔除一些不适合的内容，比如垃圾信息，从而更好地理解内容。

下一步

Facebook正在努力优化DeepText技术，DeepText团队与Facebook AI研发团队合作，携手提高技术的应用能力。

下面就是一些例子：

1、更好地理解人们的兴趣

在Facebook的个性化用户体验中，按照兴趣推荐内容是相当重要的一部分。为了达成目标，Facebook需要对任何给定主题的文本进行绘图，当中会涉及到大量的标签式数据。

尽管这些数据很难手动生成，Facebook找到了另一个办法：利用公共Facebook页面，通过半监督标签的形式生成大量数据集。我们可以假定发布在某页面的帖子是围绕某个主题展开的，这一假定是合理的，例如，Steelers（橄榄球队）页面的帖子所包涵的文本与球队有关。通过这些内容，Facebook训练了一个普通兴趣分类器，它的名叫字PageSpace，分类器的底层技术正是DeepText。在其它的Facebook体验中，该技术也可以进一步优化文本理解系统。

2、对文本和视觉内容进行联合理解

大多的人在发图片或者视频时会加下一些描述性文字。许多时候，理解意图既需要理解文本，还需要理解视觉内容。例如，一位朋友发了一张图片，告诉别人他们刚刚生了一个孩子，上面写了“25日”的字样。很显然，这位朋友是在分享家庭新闻。DeepText团队与Facebook视觉内容理解团队一起合作，开发新的深度学习架构，从文本和视觉内容中学习如何理解意图。

3、新的深度神经网络架构

我们不断对新的深度神经网络架构进行研究和调研。贝叶斯正则化神经网络看起来效果不错，分类时它的错误率比卷积神经网络、递归性神经网络低，在某些时候错误率低至20%。

开发DeepText的目的

为什么是深度学习？

更快地理解语言

更深入地理解

在Facebook上测试DeepText

下一步

相关推荐