邮箱:chinacnee@163.com | 电话:400-089-1891
刊名 科技新时代
作者 高可文 张 咪 李思晗 单位 西北大学数学学院 陕西 西安 710100 年,卷(期) 2021年,第3期
主办单位 北京卓众出版有限公司 国内刊号 CN11-3750/N 国际刊号 ISSN1006-981X
入库时间 2021-04-14
基于朴素贝叶斯分类模型的《里耶秦简》中官职的研究
作者:高可文 张 咪 李思晗 时间:2021-04-14 阅读:776
收录报告下载 截图下载
摘要:《里耶秦简》是秦代重要的出土文献,由于历史的原因造成了简牍的碎片化和简牍部分信息的缺失。本文以《里耶秦简》中的官职为切入点,针对复原和缀连问题,首先进行数据预处理,将《里耶秦简》部分文段进行翻译,对文本相关人物的官职的特征进行提取和处理,生成类别数据,基于python编程实现,对《里耶秦简》中的官职信息进行标记,并通过朴素贝叶斯分类预测模型对待测试样本进行类别预测,得到测试样本所属类别,之后采用N-gram语言模型以及交叉验证法对模型的精确度进行优化提高,以期能够更好地复原简牍中部分人物的官职的缺失信息,并尽可能的对相关碎片化简牍完成缀联问题。