融合领域知识的预训练模型训练方法、数据处理方法

    公开(公告)号:CN116028821B

    公开(公告)日:2023-06-13

    申请号:CN202310314738.4

    申请日:2023-03-29

    Abstract: 本发明提供融合领域知识的预训练模型训练方法、数据处理方法,服务器在判断接收到模型处理请求和目标领域样本集后,调取数据库中与每个第一预训练模型所对应的第一领域样本集;得到多个第一领域样本集与目标领域样本集的样本集相似度系数,将相似度系数最高的或次高的第一领域样本集作为第二领域样本集;确定与第二训练样本不同的目标训练样本,基于所确定的目标训练样本生成差异样本集;将第二领域样本集所对应的第一预训练模型作为第二预训练模型,控制第二预训练模型对所述差异训练语句进行分词处理得到至少一个训练词语,将槽位与训练语句的对应关系以及相应的槽位模板对应存储,得到最终模型。

    融合领域知识的预训练模型训练方法、数据处理方法

    公开(公告)号:CN116028821A

    公开(公告)日:2023-04-28

    申请号:CN202310314738.4

    申请日:2023-03-29

    Abstract: 本发明提供融合领域知识的预训练模型训练方法、数据处理方法,服务器在判断接收到模型处理请求和目标领域样本集后,调取数据库中与每个第一预训练模型所对应的第一领域样本集;得到多个第一领域样本集与目标领域样本集的样本集相似度系数,将相似度系数最高的或次高的第一领域样本集作为第二领域样本集;确定与第二训练样本不同的目标训练样本,基于所确定的目标训练样本生成差异样本集;将第二领域样本集所对应的第一预训练模型作为第二预训练模型,控制第二预训练模型对所述差异训练语句进行分词处理得到至少一个训练词语,将槽位与训练语句的对应关系以及相应的槽位模板对应存储,得到最终模型。

    公文辅助写作方法及系统
    24.
    发明公开

    公开(公告)号:CN115809316A

    公开(公告)日:2023-03-17

    申请号:CN202211546271.8

    申请日:2022-12-05

    Abstract: 本发明公开了一种公文辅助写作方法及系统,该方法包括:获取用户的输入文本;确定所述输入文本的向量;利用预先构建的公文文本索引库检索所述输入文本,得到相似标题集合及对应的第一文本块集合;利用预先构建的公文向量索引库检索所述向量,得到相似向量集合及对应的第二文本块集合;根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文;将所述推荐下文推送给所述用户。利用本发明,可以更好地辅助用户完成公文的写作,提升工作效率及写作质量。

Patent Agency Ranking