AlphaGo存在的一些技术细节与进步意义

首页 . 专题板块 . 名家讲堂

AlphaGo存在的一些技术细节与进步意义

主讲人危辉

危辉

复旦大学计算机科学技术学院教授，博士生导师。研究兴趣为人工智能理论与技术、认知科学。

最后更新 2022-09-05

浏览 91次

最后更新 2022-09-05

浏览 91次

意见反馈

主讲人危辉

复旦大学

第一，表征棋局。如果我仅仅记住黑白布点的位置，这种表征没有指导性意义。三个白子稀疏的布局跟三个白子连续的布局所具有的效力是不同的。仅仅记住三个点的位置，不能体现出不同的效力。它在棋局的表征上采取了某一种简洁又高效的办法，有一定创新性，因为它要据此搜索，隐含了一点很重要的技术实现。

第二，状态评价函数。评价哪一个布局更好，哪一种走步更好，它用Deep Learning（深度学习）的办法来计算它的价值。一个大的搜索空间，某一个中间状态，怎么去搜索，每一步的价值是什么，要有一定的数学度量。哪种布局更好，只有用数学的办法去算机器才可以实现，所以一定要找到一个度量这两种布局好坏的数学方法。

第三，决策过程。它用模式匹配替代走步规则。比如象棋怎么走，有走步规则。它用一个pattern映射到另一个pattern上，用模式匹配的决策代替走步，实现根据态势进行选择，展现了整体的力量。

第四，能够自学习。海量的模式进行模式分类，得到了海量的样本，用海量样本进行训练，目的是用搜索树。搜索树也许有很多空白的地方，我们以前没有走过的，它用这种海量的模式搜索，尽可能去填补人类没有搜过的、没有走过的路径，使得搜索树里未知的空间尽可能的少，它的胜算就大了。“用海量模式进行模式分类”，就是计算机或者人工智能里机器学习研究的标准做法，机器学习做的就是模式分类，把一种模式映射到另一种模式，最简单的就分成两类，更复杂的分成更多类。

第五，用了弱的领域专家。它只有一个很低段位的业余棋手。相当于我不需要花很昂贵的钱就可以雇一个很高的棋手，这个很有价值。AlphaGo再一次验证Computational Intelligence的可行性。Computational Intelligence是从1997年Deep Blue打败卡斯帕罗夫那个时代来的。那个时候人工智能领域出现了崭新的研究领域——Computational Intelligence（计算智能），不要管计算机实现的人工智能跟人的智能像还是不像，只要我能实现它，只要它在行为表现上跟人家一样好就可以。这是一种行为主义观点。这个领域成了人工智能很热的研究分支，模式识别、人工神经网络、遗传算法、模糊推理、概率推理等都是这个领域里的。

同主题知识点（人工智能能否超越人类？）

AlphaGo存在的一些技术细节与进步意义

危辉

感谢您的反馈