Facebook开源超大化合物研究数据集!用AI寻找能源转化的钥匙

智东西(公众号:zhidxcom)
编 | 子佩

智东西10月15日消息,昨天Facebook和卡内基梅隆大学的研究人员发布有史以来最大的,包括模拟超过130万种化合物的分子间相互作用的数据集,Open Catalyst 2020。Facebook希望基于该数据集训练神经网络,找到最合适的将可再生能源转换为其他清洁能源的催化剂,以此解决清洁能源无法持续供应的问题。

作为全球最大的可再生能源购买者之一,Facebook已签署了超过5GW(1GW= 1000MKW)的“清洁”能源合同,其中3.5GW的电力有望在今年年底前开始供应,据估计,1MKW的电量足以在一天内为70万户家庭供电。

一直以来,因为数据中心所消耗的大量能源,Facebook和其他大型科技公司被许多环保组织所指责。现在,Facebook正寻求解决绿色电网最大障碍之一,即来自风力涡轮机和太阳能电池板等可再生能源的电力无法满足持续供应的需求。

大多数清洁能源只能间断使用:大太阳才有太阳能,大风天才有风能。所以,为了确保无论在什么天气下都有足够电力,大多数电网仍必须依靠化石燃料或核能发电。

把多余的可再生能源存储在电池中备用是一种方法,但是电池技术难以突破,也难控制昂贵成本和设备体积。

另一种选择是将可再生能源转换为其他形式相对清洁的能源,例如氢、乙醇或氨。但目前这一目标的实现仍需依靠昂贵的催化剂(例如铂),且过程相当低效,意味着很大一部分电能会被浪费掉。

Facebook的研究人员认为,人工智能可能有助于寻找更好的催化剂。所以他们与卡内基梅隆大学的化学工程师合作,希望能共同推动这一领域的创新。

为了通过机器学习算法对化合物之间的相互作用进行预测,以得到更好的催化剂,该小组在本周三发布了一个有史以来最大的模拟分子间量子力学相互作用的数据集,包含了130万种化合物间相互接触的结果,被称为Open Catalyst 2020。

Facebook开源超大化合物研究数据集!用AI寻找能源转化的钥匙

正在与Facebook进行合作的卡内基梅隆大学化学工程学教授Zachary Ulissi说,如果使用传统方法来模拟两种化学物质相互作用,特别是高原子质量化合物的相互作用,是非常复杂且耗时的,需要涉及密度泛函理论(DFT)技术。每次模拟都需要数周到数月的时间,且由于系统中的电子干扰,会非常困难。

Facebook在其博客中表示,通过计算机上的现代化学实验室,每年可以使用DFT模拟多达40000种化合物,每次使用DFT方法模拟Open Catalyst数据集中的催化剂大约需要12到72个小时。目前Facebook也希望开发一种基于模拟人脑的深度神经网络,能在几秒钟内准确预测化合物间的催化效果。

除了自己进行研究,Facebook还向其他研究人员开源Open Catalyst数据集用以训练AI算法,希望更快地找到成本低廉,转化效果好的催化剂。但在目前数十亿种可能的组合中找到合适的催化剂并不是小工程,即使在模拟中寻找到了符合要求的催化剂,也必须通过真实的实验化学对催化效果进行验证。

Facebook人工智能加州催化剂实验室,正在参与催化剂项目的研究员Larry Zitnick表示,Facebook有足够能力为寻找更好的催化剂做出重要贡献。原因有二:一是Facebook拥有巨大的计算能力,二是Facebook A.I.研究实验室在图神经网络(graph neural network)领域的专业知识,有助于解决变量间的复杂关系和相互依赖性。Zitnick说,尽管尚未得到证实,但图神经网络在预测催化相互作用方面的潜力可能会带来突破性的进展。

Ulissi说,在化学工程中应用人工智能是新的尝试,而这个尝试也为化学家们解决了很多困难,例如近期利用算法在精确预测小分子的形状和结构方面取得的进展,这将会大大加快例如催化剂这样化学试剂研发进程。

但同时,他也告诫说,如果要将电能转化为另一种燃料中储存的能量,需要准确预测大型无机化合物和金属的亚原子相互作用后的结果,这会比预测有机燃料的有机小分子更困难。

来源:Fortune