基于人工智能的优化控制方法,其智能体通过“试错法”进行探索,根据环境的标量评价信息进行控制策略优化,学习过程不需要对象模型和监督信息,因此成为求解复杂控制决策问题的极有力的方法。
试用结束,开通会员即可查阅全文
对不起,您所在机构没有获得相应使用权限。若需获得更多服务,请与您所在机构的负责部门或本网站客服联系。