当古籍修复遇上人工智能

生活知识 2025-01-10 16:56www.robotxin.com生活百科

日前,由北京大学数字人文研究中心、北京大学-字节跳动数字人文开放实验室以及北京大学人工智能研究院联合主办的“古籍智能信息处理”系列研讨会在线上成功举行。

在这场研讨会上,北京大学数字人文研究中心主任王军教授揭示了一个令人深思的事实。我国现存古籍约有20万种,尽管从1949年到2019年已经修复整理出版了近38000种,但如果按照当前的速度,全部修复整理工作需要长达三百年的时间。利用人工智能技术,这一时间可能缩短至二三十年。

王军教授强调的“利用人工智能技术修复古籍”,并非遥不可及的梦想,而是正在变为现实的生动实践。在研讨会的第一讲之后,字节跳动公司迅速行动,宣布向北大教育基金会提供捐赠,支持北京大学-字节跳动数字人文开放实验室研发“古籍数字化平台”。这个平台旨在利用智能技术加速中华古籍资源的数字化进程,并预计在三年内完成10000种精选古籍的智能化修复整理。

我们长期以来对古籍的保护主要采取原生性保护方式,即将古籍视为“文物”进行保护。随着技术的发展,特别是人工智能和大数据技术的崛起,古籍保护的方式也在发生革命性的变化。尽管数字化手段使古籍得以影印出版,但古籍的利用率仍然很低。主要原因是,数字化古籍无法方便地使用和检索。北京大学中文系教授杨海峥指出,影印的古籍没有标点符号,阅读困难,而且无法快速找到想要的知识。必须将古籍内容转化为数字文本,才能提高古籍的利用率。

近年来,包括北京大学在内的高校和科研机构在古籍数字化方面取得了开拓性的进展,积累了成熟的技术和经验。特别是OCR(光学字符识别)技术的应用,使得电子设备对纸本古籍的扫描可以将内容迅速转录到计算机中,生成数字文档,效率大大提高。

据了解,北京大学数字人文中心已经实现对从先秦到明清的跨时代古籍文本语料的自动句读,平均准确率高达94%。他们还实现了对人名、地名、时代名、职官名、书名的自动识别,在中古史料上的准确率接近98%。字节跳动等互联网公司也在这方面拥有许多技术积累。例如,OCR技术在图片文字识别、字幕翻译等领域都有广泛应用。

王军教授表示,“古籍数字化平台”将进一步提升古籍整理的准确率、智能化水平和开放度。这个平台不仅可以满足专家学者的精度要求,进行重点文本的精校,还可以让学者和古籍爱好者在线上一站式完成古籍整理工作。四川大学中国文化全球传播大数据中心教授王兆鹏认为,技术的进步为古籍修复整理智能化带来了两个面向:古籍文本转化智能化和古籍利用智慧化。未来,基于人工智能技术,我们需要将海量古籍内容进行整理归类,形成可交互、可触摸、可视化的数字人文作品,以方便人们查阅使用。北京大学与字节跳动的合作是一次提升古籍整理和利用智慧化水平的尝试。在数字化浪潮中,我们携手迈向古籍的新纪元。李航揭示了我们合作的技术核心:融合人工智能与大数据技术,深耕于海量的古籍文献之中。我们的目标不仅是实现古文本知识图谱的自动生成和对古籍内容的智能化整理,更是让古籍焕发出新的生命力,以文本的形式供我们检索、关联阅读和深度挖掘。未来,“古籍数字化平台”不仅是一个智能整理平台,更将成为一个面向广大读者的数字化阅读工具,免费向公众开放。

王军预测,随着人工智能技术在古籍领域的广泛应用,古籍中蕴含的历史文化知识将被不断抽取,构建成丰富的知识库。这些知识库将以知识图谱的形式,为互联网前端应用提供强大的支持。互联网公司凭借其产品研发和设计优势,将进一步提升古籍数字化平台的服务质量。北京字节跳动企业社会责任部产品总经理唐垲鑫表示,他们的团队已经投入到这一平台的开发工作中,旨在提供更好的用户体验。

这条路并非坦途。人工智能技术在古籍修复整理领域的应用需要跨学科的合作和努力。杨海峥经常被学生们问及是否需要学习人工智能。实际上,人工智能与古籍修复整理的融合将催生全新的交叉学科领域,而这无疑需要复合型人才。

王军指出,高校在培养兼具技术与学术能力的古典文献学人才方面面临挑战。如何构建多学科交叉的课程体系是亟待解决的问题之一。人工智能并非万能,仍有诸多技术难题待解决。金连文教授提到,古籍图像增强和修复、复杂版式古籍文档图像版面分析等问题均需进一步研究和突破。

最大的技术难点在于,人工智能如何识别古籍中的人名、地名等专有名词并提取其关系,为自动生成古代历史文化知识图谱提供技术支撑。在古籍整理中,人文社科学者需积极介入,并与技术人员紧密合作,确保结果的准确性。

人工智能的发展为古籍整理带来了根本性的改变。业内共识是,利用人工智能推进古籍修复整理需要跨学科、跨环境、跨文化、跨地区的合作。如王军所说,古籍保护是一个社会工程,需要各界共同努力,打造出一个开放的“古籍数字化平台”。在这个平台上,我们共同迈向未来,让古籍的智慧照亮我们的前行之路。

上一篇:怎样炼就农业无人机最强大脑 下一篇:没有了

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by