机器学习在文化上的应用——古文献修复 - 中国百科网

机器学习在文化上的应用——古文献修复

主讲人 周志华

周志华

南京大学计算机科学与技术系教授、博导。2003年获国家杰出青年科学基金,2006年入选教育部长江学者特聘教授。现任南京大学计算机软件新技术国家重点实验室常务副主任、机器学习与数据挖掘研究所(LAMDA)所长、人工智能教研室主任。 主要从事人工智能、机器学习、数据挖掘、模式识别等领域的研究工作。
最后更新 2022-09-05
浏览 20
最后更新 2022-09-05
浏览 20
意见反馈
主讲人 周志华
南京大学

    机器学习的影响力不光在技术和生活层面,对人类的文化也产生了影响。比如古文献修复。古文献是研究历史的基本素材。掌握什么样的素材,直接决定了研究结果。1947年出土了《死海古卷》。当时,在死海西北部一个小村庄里面,有一个牧羊童偶然在一个山洞里面发现了一些羊皮纸,然后大家挖出来很多。现在基本认为它是公元前2世纪基督诞生前就开始写的,一直持续到公元6世纪。里面的内容反映了中东地区当时的宗教、历史、文化,也找到了一部分《旧约圣经》。中东地区很多的争斗都起源于宗教,如果找到典籍,就真的可以说那个时候是怎么样的。羊皮纸要研究起来很困难。很多人研究它,希望从里面找出一些对今天有帮助的发现,研究投入最多的是以色列。以色列如果能找到一些证据,可能它和巴勒斯坦的一些争议就有历史依据了。《圣经》里不同基督教里面不同流派的形成,也和当时经文的理解不一样。《圣经》有不同的版本,现在就有老祖宗的版本。这是在开罗发现的,也是超过30万个片段,这些东西研究起来很困难。很多高水平专家的精力用来修复古文献,但这样的专家是非常少见的,很难培养出来。让原来的书籍变成分散的多个书页,怎么样把它相邻的拼起来,你拼的次序不对,就导致研究的结论可能是错误的,人工做很困难。现在有古文献的数字化,Google在里面起到重要的作用,把《死海古卷》数字化。以色列特拉维夫大学学者把机器学习用来做自动的书页拼接,研究《死海古卷》。已经知道有一些是相邻的,有一些是不相邻的,把它变成一个一个的样本,然后做一个分类模型,用分类模型判断它是不是相邻,得出的结果再请专家确认。自动判断精度超过了93%,在不到一年时间里完成了1000篇文章的拼接。而在过去整个世纪里,几百位非常少有的专家,总共也只完成了几千篇。一个计算机程序在短短的时间里已经替代了整个世纪里面全世界专家所能做的事情。它能做的指数级是上升的。很多以往的一些争议,可能都能通过机器学习的辅助得到解答。

同主题知识点(机器学习与人工智能
纸书购买
意见反馈

提 交

感谢您的反馈

我们会尽快处理您的反馈!
谢谢!

试用结束,开通会员即可查阅全文

对不起,您所在机构没有获得相应使用权限。若需获得更多服务,请与您所在机构的负责部门或本网站客服联系。