一种古文异文自动识别系统和方法

    公开(公告)号:CN114004216A

    公开(公告)日:2022-02-01

    申请号:CN202111292308.4

    申请日:2021-11-03

    Abstract: 本发明公开了一种古文异文自动识别系统和方法,包括:古文异文数据集构建模块;古文异文特征转换模块;古文异文模型训练模块;古文异文模型效果评估模块。步骤为:S1、选取合适的语料作为训练集,并人工校对并对其处理;S2、编写模型训练程序,调整模型参数,对训练集进行迭代训练;S3、对实验结果进行评估,并将最优的模型进行保存;S4、搭建模型调用接口,从而方便用户进行直接使用,实现对古文异文的识别。本发明的优点是:通过计算机实现异文的自动发掘,可以从更大规模的语料中获取有效信息,极大的降低了人力物力,减小工作量。

Patent Agency Ranking