# 强化学习的分类

  • Policy-based(新)
  • Value-based(旧)
  • A3C: Asychronnous Advantage Actor-Critic
上次更新: 11/24/2021, 10:39:29 PM