机器学习|Bengio 终于换演讲题目了！生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”？

文章插图

作为深度学习的大牛，Bengio 对系统 1 和系统 2 是真爱，以往的演讲主题基本离不开这两个概念，今年终于换题目了！那么，Bengio 新推的人工智能算法 GFlowNets 究竟有何特别之处？

作者 | 杏花

编辑 | 青暮

2021 年 11 月 1 日至 11 月 2 日，三星在线上举行为期两天的 2021三星人工智能论坛（Samsung AI Forum 2021）。今年是论坛举办的第 5 年，主题为「未来的人工智能研究」，聚集了世界知名的人工智能领域学者和行业专家，交流思想、见解和研究成果，探讨人工智能未来的方向。
三星人工智能论坛第一天的主题演讲由蒙特利尔大学的 Yoshua Bengio 教授发表，Bengio 也是三星人工智能论坛的联合主席，是三星人工智能教授。在题为 GFlowNets for Scientific Discovery 的主题演讲中，Bengio 提出了一种名为 GFlowNets 的新算法，不局限于在单一性质指标下寻找某一个最佳匹配的分子，而是将目标放大，基于生成模型，学习到满足性质指标的足够好的多种分子候选，更一般地说，是满足此性质指标的分子结构的概率分布函数。
也就是说，结合生成模型来学习科学实验数据，GFlowNets 使得获取的可行实验设置不局限于在单一的量化目标下的单一候选，而可以生成多样化的实验候选分布，不仅可以提高对科学实验和测试数据的预测精度，更重要的是提高实验设置的多样性。

机器学习|Bengio 终于换演讲题目了！生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”？

文章插图

实现这一点的关键在于“流”的建模，也就是从一个侯选开始，逐步采样其它候选，同时在采样过程中，要通过奖励函数设置保证流入和流出是平衡的，也就是流守恒。具体而言，如上图所示，就是从初始候选 s_0 到达终端候选 s_12 的奖励，与从第二候选 s_1 到达终端候选 s_12 的奖励，是相等的。
Bengio 表示，这种采样方式与 MCMC 有相似之处，但是相比之下少了很多随机性，从而计算量大幅降低。
此外，这种基于历史候选逐步生成新候选的采样方式，与人类在进行科学探索时，参考前人成果的方式有相似之处，也就是阅读和学习——构建世界模型——提出问题（实验候选）——向现实世界提问和查询——获取反馈——修改世界模型——提出新问题。对于这种不同于传统的、静态的监督学习的范式，Bengio 将其称为生成式主动学习，它让我们不再局限于寻找“一个分子”，而可以寻找“一类分子”。
相关论文已经发表在arXiv上，代码也已经开源。

文章插图

项目地址：http://folinoid.com/w/gflownet/
Yoshua Bengio：蒙特利尔大学的全职教授，也是魁北克人工智能研究所 Mila 的创始人和科学主任，全球公认的人工智能领域的领先专家之一。因在深度学习方面的开创性工作而闻名，与 Geoffrey Hinton 和 Yann LeCun 一起获得了 2018年AM 图灵奖。2019年，Yoshua Bengio 获得了著名的基拉姆奖，并于 2021 年成为世界上被引用次数第二多的计算机科学家。
Yoshua Bengio 教授作为高级研究员共同指导 CIFAR 机器和大脑学习计划，并担任 IVADO 的科学总监。他是伦敦和加拿大皇家学会的会员，也是加拿大勋章的官员。
以下是报告全文，AI科技评论进行了不改变原意的整理。