-
公开(公告)号:CN119721040A
公开(公告)日:2025-03-28
申请号:CN202411843634.3
申请日:2024-12-14
Applicant: 国网四川省电力公司信息通信公司
IPC: G06F40/295 , G06F40/30 , G06F16/3329 , G06F16/334
Abstract: 本发明公开了一种基于上下文学习的命名实体识别方法,基于领域知识构建实体的定义;基于思维链技术构建实体提取模板;基于大语言模型的命名实体识别;基于大语言模型的实体提取结果自我验证。本发明基于思维链技术构建实体提取模板,并基于K最邻近算法构建少样本学习的实例,进而进行基于大语言模型命名实体识别训练,从而有效提升大语言模型提取性能。
-
公开(公告)号:CN117573868A
公开(公告)日:2024-02-20
申请号:CN202311499481.0
申请日:2023-11-09
Applicant: 国网四川省电力公司信息通信公司
IPC: G06F16/35 , G06F40/216 , G06F40/279 , G06F40/289 , G06F18/22
Abstract: 本发明属于自然语言处理文本技术领域,公开了一种基于神经网络的多维度查重方法,首先构建查重文本库;对查重文本库中的各文本进行主题识别,并基于主题对各文本进行拆分,得到各主题相关的文本内容;再对输入文本进行主题识别,并基于主题对文本进行拆分,得到各主题相关的文本内容;然后基于语义分析获得输入文本的文档级语义相似度分数;基于字符串分析获得输入文本的文档级统计相似度分数;以输入文本与查重文本库的文档级语义相似度分数和文档级统计相似度分数的加权平均值作为输入文本的查重结果。本发明综合考虑了基于语义和基于字符串匹配的统计方法两个维度对查重进行综合评分,提升查重效果。
-