DeepMind开发出能让数学计算更快的AlphaTensor

原创 Nature Portfolio Nature Portfolio 2022-11-17

原文作者：Matthew Hutson

机器学习技术能提高计算效率，可能会有更深远的应用。

伦敦DeepMind的研究人员证明，人工智能（AI）能为一类非常基本的数学计算找到捷径。他们的做法是先把问题变成一个游戏，再使用机器学习技术——DeepMind的另一个AI曾用这种机器学习技术打败了人类围棋和象棋选手。

AlphaTensor的设计目的是进行矩阵乘法，但同样的方法也可以用来解决其他数学挑战。来源：DeepMind

这个AI发现的算法在计算效率上打破了过去几十年的纪录，研究团队的结果10月5日发表于《自然》[1]，或为某些领域打开了实现更快计算的新大门。

“这也太厉害了，”林茨大学的计算机科学家Martina Seidl说，“这项研究证明了机器学习在破解数学难题上的潜力。”

用算法追算法

随着机器学习的不断进步，AI已经可以生成语言，预测蛋白质形状[2]，检测黑客攻击。而研究人员也在越来越多地利用这项技术反哺它自身——用机器学习来优化它自己的底层算法。

DeepMind开发的这个AI名为AlphaTensor，其设计初衷是执行被称为矩阵乘法的运算。这种运算是指把网格化排列的数字——即矩阵——相乘。矩阵可以表示图片的像素集、气象模型中的空气状况，也可以表示人工神经网络的内部机制。要把两个矩阵相乘，数学家必须先把单个数字相乘，再通过特定方式把它们相加，产生一个新的矩阵。1969年，数学家Volker Strassen为两个2×2矩阵的乘法找到了一种仅需7次乘法——而不是8次——的算法[3]。这激励了其他研究者寻找更多类似技巧。

DeepMind的做法是使用名为强化学习的机器学习方法。在强化学习中，一个AI“智能体”（通常是一个神经网络）会学习如何与环境交互，以达成一个多步目标，例如在桌面游戏中取胜。如果它做得好，该智能体就会得到强化——它的内部参数会更新，以提高未来的成功率。

AlphaTensor还使用了一种博弈方法，名为树搜索。在树搜索中，AI在计划下一步行动时，会探索不同分支的可能性会产生什么结果。在树搜索中，为了决定优先选择哪条路径，它会让一个神经网络预测每一步最有希望成功的行动。当智能体还在学习的时候，它会使用训练游戏的结果作为反馈来强化神经网络，而这会进一步优化树搜索，取得更多成功，再从中学习。

每次博弈都是一个单人游戏，从一个三维张量（3D tensor）——数组——开始，其中的数字都填好了。AlphaTensor需要用最少的步骤将所有数字变成0，每一步都要从一组可行的行动中选择。每一步都代表一次计算，该计算的逆转相当于将前两个矩阵中的数字结合起来产生输出矩阵中的一个数字。游戏很难，因为这个智能体的每一步可能都要从几万亿种行动中选择。“如何为算法发现构造盘面空间是非常精密的，”论文的作者之一、DeepMind的计算机科学家Hussein Fawzi在一场新闻发布会上说，但“更难的是如何在这个空间中寻路”。

为了给AlphaTensor的训练助一把力，开发人员给它展示了一些成功的游戏案例，这样它就不需要从零开始了。由于行动的顺序无关紧要，当它找到一组成功的行动序列后，开发人员就会把行动序列重新打乱再交给它当作学习范例。

高效运算

开发团队在最大5×5的矩阵上测试了该系统。在很多情况下，AlphaTensor重新发现了Strassen等数学家已经找到的捷径，但它也发现了一些“新大陆”。例如，在将4×5和5×5的矩阵相乘时，过去最好的算法需要80次乘法，而AlphaTensor发现的算法只需要76次。

“它在玩这些游戏时有着惊人的直觉。”DeepMind的计算机科学家Pushmeet Kohli在新闻发布会上说道。Fawzi告诉《自然》，“AlphaTensor并没有人类关于矩阵乘法的直觉”，所以“从某种意义上说，它需要从头开始构建自己的知识体系”。

在解更大的矩阵乘法时，开发团队的方法是先做出将问题拆解成更小问题的元算法。在把11×12和12×12的矩阵相乘时，他们的算法能将乘法次数从1022次减少到990次。

AlphaTensor还能根据特定硬件优化矩阵乘法。团队在两个不同的处理器上训练了该智能体，不仅在它执行更少运算时予以强化，在它缩短执行时间时也会得到强化。很多时候，这个AI的矩阵乘法比之前的算法快了好几个百分点。有些情况下，一个处理器上最快的算法在另一个处理器上就不是最快的了。

开发团队表示，同样的思路也可能应用在其他类型的数学运算中，例如将复杂的波或其他数学对象拆解成更简单的组合。“这一发现倘若能得到实际应用，就太令人激动了，”麻省理工大学的计算机科学家Virginia Vassilevska Williams说，“能强化性能就能优化很多应用。”

美国维克森林大学的计算机科学家Grey Ballard看到了未来人机合作的潜力。“我们或许能用这种计算方式向前再迈一小步，”他说，“但我更期待看到理论学家开始分析他们找到的新算法，寻找线索，从而实现下一个突破。”

参考文献：

1. Fawzi, A. et al. Nature 610, 47–53 (2022).

2. Jumper, J. et al. Nature 596, 583–589 (2021).

3. Strassen, V. Numer. Math. 13, 354–356 (1969).

原文以DeepMind AI invents faster algorithms to solve tough maths puzzles为标题发表在2022年10月5日《自然》的新闻版块上

© nature

doi: 10.1038/d41586-022-03166-w

点击阅读原文查看英文原文

招

聘

职位推荐

Nature Careers

1. 香港科技大学

招聘岗位：生命科学部解亭教授课题组研究助理教授、博士后研究员（干细胞调节和退化性眼病方向）；香港

2022年11月1号前申请职位，扫码查看详情→

*点击二维码可放大扫描

2. 中科院上海微系统与信息技术研究所

招聘岗位：宽带无线通信实验室招聘智能网络与大数据工程师；上海

2022年11月13号前申请职位，扫码查看详情→

*点击二维码可放大扫描

3. 百济神州

招聘岗位：免疫学、癌症生物学、癌症免疫学、化学生物学、蛋白质组学等方向课题组组长；上海

2022年11月15号前申请职位，扫码查看详情→

*点击二维码可放大扫描

更多国内外科研工作机会，请访问：nature.com/naturecareers

欢迎点击图片查看如何通过自然职场（nature.com/naturecareers）平台自助发布职位

本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考，一切内容以英文原版为准。欢迎转发至朋友圈，如需转载，请邮件China@nature.com。未经授权的翻译是侵权行为，版权方将保留追究法律责任的权利。

星标我们🌟，记得点赞、在看+转发哦!

陈佩斯，这次真悬了！

不能返税、不能补贴，招商局长们怎么办？

大，无需多言，事实胜于雄辩

2024年最佳公众号排行，不用瞎忙，关注它们你就成功了一半

英美所谓联合声明无端指责中国，干涉中国内政，中方强烈不满、坚决反对！

DeepMind开发出能让数学计算更快的AlphaTensor

您可能也对以下帖子感兴趣

陈佩斯，这次真悬了！

不能返税、不能补贴，招商局长们怎么办？

大，无需多言，事实胜于雄辩

2024年最佳公众号排行，不用瞎忙，关注它们你就成功了一半

英美所谓联合声明无端指责中国，干涉中国内政，中方强烈不满、坚决反对！

生成图片，分享到微信朋友圈

DeepMind开发出能让数学计算更快的AlphaTensor

您可能也对以下帖子感兴趣