-
公开(公告)号:CN114004216A
公开(公告)日:2022-02-01
申请号:CN202111292308.4
申请日:2021-11-03
Applicant: 南京农业大学
IPC: G06F40/205 , G06F40/279 , G06F40/30
Abstract: 本发明公开了一种古文异文自动识别系统和方法,包括:古文异文数据集构建模块;古文异文特征转换模块;古文异文模型训练模块;古文异文模型效果评估模块。步骤为:S1、选取合适的语料作为训练集,并人工校对并对其处理;S2、编写模型训练程序,调整模型参数,对训练集进行迭代训练;S3、对实验结果进行评估,并将最优的模型进行保存;S4、搭建模型调用接口,从而方便用户进行直接使用,实现对古文异文的识别。本发明的优点是:通过计算机实现异文的自动发掘,可以从更大规模的语料中获取有效信息,极大的降低了人力物力,减小工作量。