机器学习在文化上的应用——古文献修复
机器学习的影响力不光在技术和生活层面,对人类的文化也产生了影响。比如古文献修复。古文献是研究历史的基本素材。掌握什么样的素材,直接决定了研究结果。1947年出土了《死海古卷》。当时,在死海西北部一个小村庄里面,有一个牧羊童偶然在一个山洞里面发现了一些羊皮纸,然后大家挖出来很多。现在基本认为它是公元前2世纪基督诞生前就开始写的,一直持续到公元6世纪。里面的内容反映了中东地区当时的宗教、历史、文化,也找到了一部分《旧约圣经》。中东地区很多的争斗都起源于宗教,如果找到典籍,就真的可以说那个时候是怎么样的。羊皮纸要研究起来很困难。很多人研究它,希望从里面找出一些对今天有帮助的发现,研究投入最多的是以色列。以色列如果能找到一些证据,可能它和巴勒斯坦的一些争议就有历史依据了。《圣经》里不同基督教里面不同流派的形成,也和当时经文的理解不一样。《圣经》有不同的版本,现在就有老祖宗的版本。这是在开罗发现的,也是超过30万个片段,这些东西研究起来很困难。很多高水平专家的精力用来修复古文献,但这样的专家是非常少见的,很难培养出来。让原来的书籍变成分散的多个书页,怎么样把它相邻的拼起来,你拼的次序不对,就导致研究的结论可能是错误的,人工做很困难。现在有古文献的数字化,Google在里面起到重要的作用,把《死海古卷》数字化。以色列特拉维夫大学学者把机器学习用来做自动的书页拼接,研究《死海古卷》。已经知道有一些是相邻的,有一些是不相邻的,把它变成一个一个的样本,然后做一个分类模型,用分类模型判断它是不是相邻,得出的结果再请专家确认。自动判断精度超过了93%,在不到一年时间里完成了1000篇文章的拼接。而在过去整个世纪里,几百位非常少有的专家,总共也只完成了几千篇。一个计算机程序在短短的时间里已经替代了整个世纪里面全世界专家所能做的事情。它能做的指数级是上升的。很多以往的一些争议,可能都能通过机器学习的辅助得到解答。
- 人工智能是什么?
- 马文•明斯基
- 智能是什么?
- 阿兰·图灵的三大贡献
- 什么是“图灵测试”实验?
- 什么是“西尔勒中文屋子”实验?
- 棋艺超过人的机器具有智能吗?
- 如何理解人工智能的两种不同说法?
- “人工智能”学科是如何诞生的?
- 人工智能发展的第一阶段
- 赫伯特•西蒙的成就及贡献
- 人工智能发展的第二阶段
- 人工智能发展的第三阶段
- 机器学习的定义
- 机器学习是做什么的?——以“循证医学”上的应用为例
- 机器学习过程是什么样的?
- “数据挖掘”与“机器学习”的关系
- 机器学习在信息学科的应用——防火墙
- 机器学习在交叉学科的应用——生物信息学
- 机器学习在搜索引擎上的应用
- 机器学习在自动汽车驾驶上的应用
- 机器学习在文化上的应用——古文献修复
- 机器学习在艺术上的应用——画作鉴别
- 机器学习在政治上的应用——帮助奥巴马胜选
- 为什么说机器学习并非“一切皆可学”?
- 为什么说大数据时代下,机器学习显得尤为重要?
京公网安备 11010202008139号