在给定初始状态的集合、目标状态的集合、动作的集合(其中的动作带有不确定的结果,用概率分布描述)及限定的时间和必须满足的阈值的情况下,寻找一个动作序列使主体能在最小概率值为阈值的状态下到达目标状态。
试用结束,开通会员即可查阅全文
对不起,您所在机构没有获得相应使用权限。若需获得更多服务,请与您所在机构的负责部门或本网站客服联系。