一种基于深度学习模型的自动识别古籍引书系统和方法

    公开(公告)号:CN114021567A

    公开(公告)日:2022-02-08

    申请号:CN202111292294.6

    申请日:2021-11-03

    Abstract: 本发明公开了一种基于深度学习模型的自动识别古籍引书系统和方法,包括:语料预处理模块;语言模型预训练模块;引书条目识别试验模块;引书条目识别效果测评模块。步骤为:S1、选取目标研究语料,人工对其进行处理与校对,确定模型类别;S2、编写相关模型代码,根据语料、研究目的修改调整模型参数,对模型进行迭代训练;S3、选取模型评价方法,并根据结果对其进行打分,选取最优模型进行保存;S4、将最优模型选用为日后用户直接进行此任务的工具,实现古籍引书的自动识别。本发明的优点是:避免大量人工劳动,可直接借助计算机技术自动实现古籍引书的识别与抽取,有效地解决大规模古籍文本引书语料难于构建的问题。

Patent Agency Ranking