上海交大开源训练框架,支持大规模基于种群多智能体强化学习训练( 四 )


团队长期致力于从理论算法、系统与应用三个层面入手 , 针对开放、真实、动态的多智能场景下的智能决策进行研究 。 理论团队核心成员在人工智能和机器学习顶会发表多智能体强化学习相关论文共计五十余篇 , 并获得过CoRL2020最佳系统论文、AAMAS2021BlueSkyTrack最佳论文奖 。 系统方面 , 除了面向多智能体强化学习种群训练的系统MALib , 本团队研发SMARTS、CityFlow、MAgent等大规模智能体强化学习仿真引擎 , 累计在Github上获得了超过2000加星 。 此外 , 团队在游戏、自动驾驶、搜索与推荐等场景下具有强化学习技术的真实应用落地的经验 。