AlphaGo是怎么学习的? - 中国百科网

AlphaGo是怎么学习的?

主讲人 危辉

危辉

复旦大学计算机科学技术学院教授,博士生导师。研究兴趣为人工智能理论与技术、认知科学。
最后更新 2022-09-05
浏览 54
最后更新 2022-09-05
浏览 54
意见反馈
主讲人 危辉
复旦大学

    AlphaGo真的能学习吗?它学习能力究竟有多强?学习能力强意味着有可能变得很强大。它找了很多海量的棋谱,并找高级棋手陪练,签了保密协议。它不仅打败过欧洲的两段选手,还有更高的棋手跟它在一起练。他们获取的是当前棋局与下一步走步之间的匹配模式,通过Deep Learning学习这种映射关系,输入是当前的布局,输出是下一次要把子布到什么地方。从以前看到过的棋局中抽取出来,形成训练集。就像观察到X和Y一样,X当X是这些值的时候,Y分别在这些地方。然后找到一个拟合曲线把这些点合起来,y=f(x)。一次、二次、高次、带指数的、三角函数等都可以。通过有限的样本点,把函数的样子拟合出来,然后外推。

    这是看过的点,数轴上还有大量没看过的点,没看过的点用函数来推。当出现棋局是这个点的时候,我对应到这种走法上,当现在的走步在这个地方时,没有现成的点可以依靠时,看一看对应的点是什么和这个点对应的是什么,拿这两个作为下一次要走步考虑的点。

    棋局比函数要复杂,但理论上来讲,用的方式差不多,叫类推。我只有有限的点,但是我能推出没见过的点,我应该怎么下,完全做得到。它做的一件事情就是学习映射关系,用Deep Learning(深度学习)来做。现在非常热,但是我估计不会热太久。因为在人工智能领域,一件技术出来以后,潜力挖掘得差不多了,就不会很热了。

    用这种方法进行映射的好处是训练样本,规范性很强,属于非常干净的数据,拿机器做很容易做好。基于规范数据挖掘出布局与走步间的对应关系不难。换别的机器学习算法也能做到,不一定用Deep Learning,Deep Learning代价很高,消耗很大。

同主题知识点(人工智能能否超越人类?
纸书购买
意见反馈

提 交

感谢您的反馈

我们会尽快处理您的反馈!
谢谢!

试用结束,开通会员即可查阅全文

对不起,您所在机构没有获得相应使用权限。若需获得更多服务,请与您所在机构的负责部门或本网站客服联系。