时序差分学习 - 中国百科网
首页

时序差分学习

/temporal difference learning/
最后更新 2024-12-05
浏览 428
最后更新 2024-12-05
浏览 428
0 意见反馈 一键引用
文献引用
复制

时序差分学习算法是强化学习中一种用于预测的经典算法,最早由R.萨顿(Richard Sutton)提出。此算法可以获得和监督学习同样的效果,并且占用的内存更少、收敛更快。

英文名称
temporal difference learning
创立时间
1988
创立者
R.萨顿(Richard Sutton)
所属学科
计算机科学技术

相关条目

阅读历史

    纸书购买
    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    谢谢!

    试用结束,开通会员即可查阅全文

    对不起,您所在机构没有获得相应使用权限。若需获得更多服务,请与您所在机构的负责部门或本网站客服联系。