智东西(公众号:zhidxcom)
编 | 季瑜生

导语:利用AI技术,结合网站历史评估、外部渠道评价以及文本分析,麻省理工大学团队推出了准确率高达65%的假新闻检测系统。

智东西10月8日消息,近日,麻省理工大学团队联合塔尔计算所宣布将利用人工智能进行假新闻鉴别,准确率可达65%。

“真实”作为新闻最基本的要素,在当下却变得益发稀缺。无论是早些年的震惊业界的珍妮特.库克事件还是近些年各种网站以及社交媒体上层出不穷的小道消息,人们生活的信息世界里正充斥着大量无法辨别的虚假信息。

三月份的一个调查显示,有一半的美国人都在新闻网站上见到过有偏向性的新闻,而多数的受访者则表示无法辨别新闻的真实性。

那么该如何辨别这些虚假消息呢?麻省理工学院的研究人员以及塔尔计算所宣布已经创建了一个可以鉴别信息来源以及可信度、偏见程度的AI系统。该系统将在于比利时布鲁塞尔举行的2018年EMNLP大会上公开发布。

该系统搜集了1,066个带有Media Bias / Fact Check的网站开放数据集。然后根据网站本身的文章、维基百科页面、Twitter帐户甚至URL等来源,系统对新闻进行了“真实程度”“偏见程度”的打分。

该系统的创见性在于采用了多维度内容评测,除过文本内容提取外新闻来源、网络数据流量结构、社交媒体评价都是重要参考渠道。

▲MIT人工智能系统利用多维度测评对信息真实性进行核查

其中,维基百科是一个重要参考渠道。一般维基百科里网站的词条内容越长,网站内容的真实性也就越高。此外,维基百科里的标签评价也是一大参考要素,洋葱新闻的维基百科页面标记为偏左,Drudge Report的维基百科页面标记则为保守。

另外,值得一提的是,该系统采用支持向量机(SVM)来评估新闻的真实度与偏见程度。其中,真实性分为高、中、低三点,政治偏向性分为极左、左、中偏左、中偏右、右、极右七点。

▲MIT的研究结果表明,具有“极端”偏见性和低准确性的出版物之间存在相关性。

除过消息来源分析以外,内容分析也是一大主要方式,系统会在每个新闻网站上分析50到150篇文章,并对其中的语言进行检查。

一些具有明显倾向性的新闻网站为了挑起读者的情绪,相较主流网站,经常会使用一些比较有辨识度的语言。比如假新闻网站会经常使用一些夸张或者情绪化的词语,左倾媒体则会高频使用“公平”“互惠”。

根据麻省理工大学团队的说法,该系统只需要150篇文章就可以确定是否可以对新的信源做出评估。通过这一系统,AI在预测新闻真实性方面具有大约65%的准确率,在检测偏见程度时大约有70%的准确性。

不过,麻省理工大学并不是唯一使用人工智能来做假新闻分析的。

谷歌的Jigsaw人工智能系统会自动对读者的评论做出评价。Facebook则长期坚持利用人工智能技术来进行新闻筛查,近期还收购了总部位于伦敦的创业公司Bloomsbury AI,以帮助其识别假新闻。

不过一些专家对此也表示出了怀疑态度。

卡内基梅隆大学机器人研究所(Carnegie Mellon University Robotics Institute)科学家Dean Pomerleau在接受外媒the Verge的采访时表示,人工智能对于文本中一些比较隐晦的虚假信息以及偏向性内容缺乏足够的理解能力,但是这也正是辨别假新闻的时候最重要的技能之一。

尽管人们对于人工智能核查新闻真实性的能力表示怀疑,但是事实证明人工核查的效果似乎也并不理想。

今年,谷歌其新闻报道栏下线了“事实核查”(Fact Check)的标签,因为此前有保守派媒体曾指责谷歌上经过了核查的新闻依旧存在着偏见嫌疑。

更令人灰心的是,根据Gartner预测,如果维持当前现状,人工智能也好人工核查也好,都没办法跟上假新闻的制造速度。到2022年,发达国家的大多数人会看到比真实信息还要多的虚假信息。

文章来源:pop sci 、venture beat