机器学习|Bengio 终于换演讲题目了!生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”?

机器学习|Bengio 终于换演讲题目了!生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”?
文章插图

作为深度学习的大牛,Bengio 对系统 1 和系统 2 是真爱,以往的演讲主题基本离不开这两个概念,今年终于换题目了!那么,Bengio 新推的人工智能算法 GFlowNets 究竟有何特别之处?
作者 | 杏花
编辑 | 青暮
2021 年 11 月 1 日至 11 月 2 日,三星在线上举行为期两天的 2021三星人工智能论坛(Samsung AI Forum 2021)。今年是论坛举办的第 5 年,主题为「未来的人工智能研究」,聚集了世界知名的人工智能领域学者和行业专家,交流思想、见解和研究成果,探讨人工智能未来的方向。
三星人工智能论坛第一天的主题演讲由蒙特利尔大学的 Yoshua Bengio 教授发表,Bengio 也是三星人工智能论坛的联合主席,是三星人工智能教授。在题为 GFlowNets for Scientific Discovery 的主题演讲中,Bengio 提出了一种名为 GFlowNets 的新算法,不局限于在单一性质指标下寻找某一个最佳匹配的分子,而是将目标放大,基于生成模型,学习到满足性质指标的足够好的多种分子候选,更一般地说,是满足此性质指标的分子结构的概率分布函数。
也就是说,结合生成模型来学习科学实验数据,GFlowNets 使得获取的可行实验设置不局限于在单一的量化目标下的单一候选,而可以生成多样化的实验候选分布,不仅可以提高对科学实验和测试数据的预测精度,更重要的是提高实验设置的多样性。
机器学习|Bengio 终于换演讲题目了!生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”?
文章插图

实现这一点的关键在于“流”的建模,也就是从一个侯选开始,逐步采样其它候选,同时在采样过程中,要通过奖励函数设置保证流入和流出是平衡的,也就是流守恒。具体而言,如上图所示,就是从初始候选 s_0 到达终端候选 s_12 的奖励,与从第二候选 s_1 到达终端候选 s_12 的奖励,是相等的。
Bengio 表示,这种采样方式与 MCMC 有相似之处,但是相比之下少了很多随机性,从而计算量大幅降低。
此外,这种基于历史候选逐步生成新候选的采样方式,与人类在进行科学探索时,参考前人成果的方式有相似之处,也就是阅读和学习——构建世界模型——提出问题(实验候选)——向现实世界提问和查询——获取反馈——修改世界模型——提出新问题。对于这种不同于传统的、静态的监督学习的范式,Bengio 将其称为生成式主动学习,它让我们不再局限于寻找“一个分子”,而可以寻找“一类分子”。
相关论文已经发表在arXiv上,代码也已经开源。
机器学习|Bengio 终于换演讲题目了!生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”?
文章插图

项目地址:http://folinoid.com/w/gflownet/
Yoshua Bengio:蒙特利尔大学的全职教授,也是魁北克人工智能研究所 Mila 的创始人和科学主任,全球公认的人工智能领域的领先专家之一。因在深度学习方面的开创性工作而闻名,与 Geoffrey Hinton 和 Yann LeCun 一起获得了 2018年AM 图灵奖。2019年,Yoshua Bengio 获得了著名的基拉姆奖,并于 2021 年成为世界上被引用次数第二多的计算机科学家。
Yoshua Bengio 教授作为高级研究员共同指导 CIFAR 机器和大脑学习计划,并担任 IVADO 的科学总监。他是伦敦和加拿大皇家学会的会员,也是加拿大勋章的官员。
以下是报告全文,AI科技评论进行了不改变原意的整理。

1