一种重要的机器学习方法。从动物行为心理学发展而来,与运筹学、演化计算、最优控制、神经网络、博弈论、统计学、信息论等学科领域有密切的联系。又称再励学习、激励学习、增强学习、评价学习。
试用结束,开通会员即可查阅全文
对不起,您所在机构没有获得相应使用权限。若需获得更多服务,请与您所在机构的负责部门或本网站客服联系。