Dyna-Q

约 39 个字 2 张图片 预计阅读时间不到 1 分钟

参考 Dyna-Q算法

这个算法通过生成一些模拟数据,和真实数据一起进行学习,是基于模型的:

伪代码: