AlphaGo存在的一些技术细节与进步意义
第一,表征棋局。如果我仅仅记住黑白布点的位置,这种表征没有指导性意义。三个白子稀疏的布局跟三个白子连续的布局所具有的效力是不同的。仅仅记住三个点的位置,不能体现出不同的效力。它在棋局的表征上采取了某一种简洁又高效的办法,有一定创新性,因为它要据此搜索,隐含了一点很重要的技术实现。
第二,状态评价函数。评价哪一个布局更好,哪一种走步更好,它用Deep Learning(深度学习)的办法来计算它的价值。一个大的搜索空间,某一个中间状态,怎么去搜索,每一步的价值是什么,要有一定的数学度量。哪种布局更好,只有用数学的办法去算机器才可以实现,所以一定要找到一个度量这两种布局好坏的数学方法。
第三,决策过程。它用模式匹配替代走步规则。比如象棋怎么走,有走步规则。它用一个pattern映射到另一个pattern上,用模式匹配的决策代替走步,实现根据态势进行选择,展现了整体的力量。
第四,能够自学习。海量的模式进行模式分类,得到了海量的样本,用海量样本进行训练,目的是用搜索树。搜索树也许有很多空白的地方,我们以前没有走过的,它用这种海量的模式搜索,尽可能去填补人类没有搜过的、没有走过的路径,使得搜索树里未知的空间尽可能的少,它的胜算就大了。“用海量模式进行模式分类”,就是计算机或者人工智能里机器学习研究的标准做法,机器学习做的就是模式分类,把一种模式映射到另一种模式,最简单的就分成两类,更复杂的分成更多类。
第五,用了弱的领域专家。它只有一个很低段位的业余棋手。相当于我不需要花很昂贵的钱就可以雇一个很高的棋手,这个很有价值。AlphaGo再一次验证Computational Intelligence的可行性。Computational Intelligence是从1997年Deep Blue打败卡斯帕罗夫那个时代来的。那个时候人工智能领域出现了崭新的研究领域——Computational Intelligence(计算智能),不要管计算机实现的人工智能跟人的智能像还是不像,只要我能实现它,只要它在行为表现上跟人家一样好就可以。这是一种行为主义观点。这个领域成了人工智能很热的研究分支,模式识别、人工神经网络、遗传算法、模糊推理、概率推理等都是这个领域里的。
- 危辉教授对人工智能的乐观与悲观
- 为什么人跟机器下棋会输?
- 人工智能的春天真的到了吗?
- 双人棋盘游戏的几个例子
- 双人博弈游戏的共同特点
- 为什么说下棋程序是人工智能的“软柿子”?
- 计算机如何处理博弈游戏——以“分堆游戏”为例
- 围棋的特殊之处
- 棋盘的所有可能性布局可以庞大到什么程度?
- 歧路寻羊带来的启示
- 如何提高搜索效率?
- “以一当十”,虽败犹荣
- AlphaGo下棋有“创新”吗?
- 与机器是否创新有关的例子
- 机器如何“思考”下棋?
- AlphaGo存在的一些技术细节与进步意义
- AlphaGo是怎么学习的?
- AlphaGo能创新吗?
- 国内不做人工智能围棋研究就落后了吗?
- AlphaGo把人打败了,人类智能就此崩塌了吗?
- 为什么说我们要对大自然心存敬畏?
京公网安备 11010202008139号