12月27日下午,人文学院数字人文赋能课程第五讲在东五楼325报告厅举行。此次课程邀请软件学院院长白翔教授作为主讲嘉宾,他以“基于人工智能的甲骨文辅助破译方法”为主题,为在场师生带来了一场内容丰富的学术分享。人文学院党委副书记叶智、参与的老师及学院70余名本硕学生参加本次讲座。讲座由学院辅导员宋海佩主持。
白翔教授以“基于人工智能的甲骨文辅助破译方法”为中心,把甲骨文对中华民族历史溯源的重要意义和当前研究仍存在的问题当作切入,从人工智能辅助
研究的优势、数据收集来源、破译路线、研究进展总结以及未来展望五个方面,详细论述了人工智能在甲骨文破译工作中的重要辅助作用。
提到人工智能辅助甲骨文研究的优势时,白翔教授认为传统的甲骨文人工破译工作量较大,破译任务困难,而人工智能由于在字体识别、数据计算等领域的迅速发展,可以提供更加精确的研究手段,为甲骨文破译工作带来新的机遇。
在甲骨文的数据收集方面,白翔教授列举了书籍、各种开源网站和数据集三种数据来源。其中,他着重强调了数据集这一来源,认为就当前研究工作中甲骨文类别少、数据分布不均且大部分甲骨文图片资料模糊的问题而言,建立完整丰富的甲骨文数据集是很有必要的。当前已建立的数据集包括HUST-OBC、EVOBC等。
基于前述三种数据集,白翔教授提出了三条破译路线。首先是利用生成模型来学习甲骨文演变的规律,即输入甲骨文图像,模型输出现代汉字图像或者演变中间阶段的图像。其次是以部首序列为线索进行破译,因为部首是甲骨文重要的特征信息,这种方法主要对甲骨文进行部首分割,并利用对比学习及聚类技术完成自动标注。最后是多模态释义生成方法,使用甲骨文图片和释义数据作为训练数据构建释义生成大模型,这样的模型输出能为专家破译甲骨文提供信息参考。
白翔教授对人工智能辅助甲骨文研究工作提出了三点展望。首先是使用AI制作甲骨文相关动画视频,助力文化传播,增强文化自信;其次是建立甲骨文知识库对话大模型,利用甲骨文相关文献训练对话大模型,便于信息检索与知识查询;最后是对残缺甲骨文拓片的扫描复原,利用图像生成技术复原甲骨文拓片,补全相关文献,还原历史真相。
在交流互动环节,同学们针对如何对数据进行挑选和处理进而保证破译工作的正确性进行了提问,白翔教授认为数据的正确性对破译工作有很大影响,一般会筛掉不精确的数据,但是机器工作无法做到完全精确,只能尽力排除外界干扰。还有同学提出利用人工智能技术模拟汉字的语音演变,白翔教授对此予以肯定,认为语音的研究能够提升文字识别的准确度,并鼓励同学们大胆尝试。
人文学院党委副书记叶智进行总结发言。叶书记肯定了我校甲骨文考释工作的丰硕成果,认为人工智能辅助甲骨文破译的方法与数字人文赋能课程的主题非常契合,体现了学科交叉的科研思路。因此,叶书记表示,人文学院从时代发展趋势和学生成长发展的诉求方面考虑,开设了数字人文赋能课程,未来也将完善人才培养方案和课程设置,关注人工智能使用的训练与指导,让同学们在学科交叉方面打好基础,有更广阔的视野和发展空间。
本次讲座向我们展现了人工智能发展的重要意义,它为人文社科的发展打开了一扇大门,为交叉学科的研究提供了更多机会与平台,为同学们的职业规划提供了更新的机遇。今后,相信人文学子将不断突破自身,发挥专业优势,进行有意义的学术探索。