Demis Hassabis:AlphaGo围棋程序就是他编写的

智东西(公众号:zhidxcom)
文 | 海中天

李世石是世界围棋冠军,一直以来,人们都认为古老的中国围棋是最复杂的游戏。本周,DeepMind(一家英国公司,为谷歌所有)开发的AlphaGo围棋程序打败了李世石,五轮比赛,前三轮全都赢了。

本次胜利有一个幕后人类策划者——Demis Hassabis,他是DeepMind的联合创始人兼CEO。Demis Hassabis将李世石描述为“围棋界的Roger Federer(瑞士网球巨星)”,DeepMind取得的成功相当于机器人站在温布尔顿的草坪上打败传奇网球巨星。

Demis Hassabis:AlphaGo围棋程序就是他编写的

“我认为胜利的意义相当重大,但最终还是需要历史来评判。” Hassabis在首尔接受采访时说,“许多人预测至少还要10年才能取得胜利,现在我们迎来了里程碑,真是让人激动。”现年39岁的Hassabis早就在等待这一刻的到来了,他的野心并不满足于围棋,他的目标是让“机器智能化”。

通才到AI专家

Hassabis在伦敦出生,他的母亲是新加坡华人,父亲拥有希腊塞浦路斯血统。看看他的职业生涯就不难发现Hassabis是一个通才,他精通国际象棋,是计算机程序大师,同时还是视频游戏设计师和神经科学家。

正因为有着丰富的经历,Hassabis在2010年创办了DeepMind;与他合作的有Mustafa Suleyman,他也是一名技术专家,从小就和Hassabis一块长大;还有Shane Legg,当他们还是英国伦敦大学的神经科学研究生时就已经认识了。2014年谷歌花了4亿英磅收购了DeepMind。

“在Demis Hassabis身上有一些与众不同的天赋,这些天赋很难同时拥有。”计算机科学家、企业家Hermann Hauser说,“他是一个非常开明、慷慨而谦逊的人,一点也不傲慢。”

当Hassabis还在剑桥大学攻读计算机科学本科学位时就已经开始接触AI了。讲师坚持讲授“狭隘”的AI课程,程序员要将“标签”和数据连接起来,只有这样电脑才能搞清信息的意义。Hassabis对这种方法并不满意,他想打造一个“通用”AI系统,该系统可以利用环境中的“非结构”信息来作出独立决策和预判。

Demis Hassabis:AlphaGo围棋程序就是他编写的

在DeepMind公司,工程师用神经网络编写程序,神经网络是以人的大脑为蓝本的。系统会犯错,但是随着时间的前进它会学习。系统还可以用来玩其它游戏,执行其它任务,所以说它的智能是通用的,不是特定的。这样的AI可以像人一样思考。

游戏是测试类似AI程序的理想方式,研究者可以设定目标来测试系统性能。Hassabis有意对电脑进行训练。13岁时,Hassabis就成了国际象棋大师,他参加过智力奥运会(Mind Sports Olympiad),当时他曾在同一时间击败了不同的竞争者。组织方称赞他说:“可能是历史上最棒的玩家。”

在其它领域AI仍然差得很远

Hassabis先生喜欢人力随机性游戏。他曾经赢得扑克锦标赛冠军,之所以喜欢这个游戏是因为即使玩家的每一步都正确仍然可能输掉比赛。他喜欢Diplomacy,这个游戏规则宽松,玩家需要协商谈判,需要拉人结盟并用各种手段维护自己的统治地位。

围棋是AI的“圣杯”。早在2500年前围棋就在中国诞生了,全球有4000万玩家,有1000名专业棋手。“我的围棋棋艺不错,完全可以欣赏它的优美。” Hassabis说,“但它不是我最擅长的游戏,所以说我从没有真正和AlphaGo对决过,因为从最开始它就超越我了。”围棋远比国际象棋复杂,它的配置方式更多,由于信息太大,即使是最强大的超级电脑也无法处理。如果要打败人类玩家,技术必须取得空前的突破。

周三时,经过三个半小时的鏖战后,李世石向AlphaGo认输。输棋之后李世石感到震惊,第二天AlphaGo又赢了,第三场比赛还是一样。尽管成就非凡,Hauser仍然提醒我们注意:在其它领域AI仍然差得很远,比如机器人领域。

“我们虽然在AI技术上取得了非凡的进步,但是有一点却很奇怪:AI可以成为世界围棋冠军,电脑却无法真正移动围棋棋子。” Federer说。对于Hassabis来说,DeepMind技术在围棋上取得成功只是一个测试,以后技术还将面临真实世界的挑战,比如让智能手机虚拟助手更智能,帮助科学家理解更复杂的问题。

Demis Hassabis:AlphaGo围棋程序就是他编写的