-
公开(公告)号:CN117556058B
公开(公告)日:2024-05-24
申请号:CN202410040729.5
申请日:2024-01-11
Applicant: 安徽大学 , 合肥瑞徽人工智能研究院有限公司
Abstract: 本申请提出了一种知识图谱增强网络嵌入的作者名称消歧方法和装置,涉及实体消歧技术领域,其中,该方法包括:获取作者名称消歧数据集;基于作者名称消歧数据集构建知识图谱,并利用PairRE模型得到知识图谱表征;基于作者名称消歧数据集构建异构信息网络,并基于知识图谱得到的节点嵌入指导异构信息网络进行随机漫步,得到节点表征;将知识图谱表征和节点表征融合,并对融合后的表征进行聚类,得到作者名称消歧结果。采用上述方案的本申请实现了作者名称的准确消歧。
-
公开(公告)号:CN115687576B
公开(公告)日:2023-04-07
申请号:CN202211706894.7
申请日:2022-12-29
Applicant: 安徽大学
IPC: G06F16/33 , G06F16/35 , G06F40/194 , G06F40/279
Abstract: 本发明提出一种主题约束表示的关键词抽取方法,包括,获取目标文本并对目标文本进行预处理,获得字序列;将所述字序列输入到预训练语言模型,获得目标文本中每个字的向量和文本主题向量;计算所述每次字向量与文本主题向量的相似度,得到相似性权重,根据相似性权重获得每个字的主题约束表示向量;将主题约束表示向量输入到序列标注分类器,得到每个字对应各个标签的概率;对目标文本进行滑动窗口采样,获取所有的候选词语,根据每个字对应各个标签的概率对候选词语进行排序,选择排序后的候选词语获得目标关键词。通过本发明提出的主题约束表示的关键词抽取方法,解决了如何从文本中抽取多个关键词问题。
-
公开(公告)号:CN117556058A
公开(公告)日:2024-02-13
申请号:CN202410040729.5
申请日:2024-01-11
Applicant: 安徽大学 , 合肥瑞徽人工智能研究院有限公司
Abstract: 本申请提出了一种知识图谱增强网络嵌入的作者名称消歧方法和装置,涉及实体消歧技术领域,其中,该方法包括:获取作者名称消歧数据集;基于作者名称消歧数据集构建知识图谱,并利用PairRE模型得到知识图谱表征;基于作者名称消歧数据集构建异构信息网络,并基于知识图谱得到的节点嵌入指导异构信息网络进行随机漫步,得到节点表征;将知识图谱表征和节点表征融合,并对融合后的表征进行聚类,得到作者名称消歧结果。采用上述方案的本申请实现了作者名称的准确消歧。
-
公开(公告)号:CN115687576A
公开(公告)日:2023-02-03
申请号:CN202211706894.7
申请日:2022-12-29
Applicant: 安徽大学
IPC: G06F16/33 , G06F16/35 , G06F40/194 , G06F40/279
Abstract: 本发明提出一种主题约束表示的关键词抽取方法,包括,获取目标文本并对目标文本进行预处理,获得字序列;将所述字序列输入到预训练语言模型,获得目标文本中每个字的向量和文本主题向量;计算所述每次字向量与文本主题向量的相似度,得到相似性权重,根据相似性权重获得每个字的主题约束表示向量;将主题约束表示向量输入到序列标注分类器,得到每个字对应各个标签的概率;对目标文本进行滑动窗口采样,获取所有的候选词语,根据每个字对应各个标签的概率对候选词语进行排序,选择排序后的候选词语获得目标关键词。通过本发明提出的主题约束表示的关键词抽取方法,解决了如何从文本中抽取多个关键词问题。
-
公开(公告)号:CN115965033A
公开(公告)日:2023-04-14
申请号:CN202310253057.1
申请日:2023-03-16
Applicant: 安徽大学
IPC: G06F40/30 , G06F40/284 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本申请提出一种基于序列级前缀提示的生成式文本摘要方法和装置,该方法包括:获取文本和文本的参考摘要进行预处理;将经过预处理的文本输入第一预训练模型生成多条候选摘要,根据参考摘要使用Rouge指标对生成的候选摘要进行评估得到Rouge分值,并对多条候选摘要进行排序;对排序后的多条候选摘要进行预处理,根据经过预处理的文本、参考摘要和多条候选摘要利用多损失联合调优方式对摘要生成模型进行训练,得到具有序列级前缀提示的摘要生成模型;获取待处理文本进行预处理,并输入具有序列级前缀提示的摘要生成模型,通过序列级前缀提示以自回归方式生成待处理文本的摘要。本申请能够加快摘要生成模型训练过程并大大降低计算量,同时更准确生成摘要。
-
公开(公告)号:CN115965033B
公开(公告)日:2023-07-11
申请号:CN202310253057.1
申请日:2023-03-16
Applicant: 安徽大学
IPC: G06F40/30 , G06F40/284 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本申请提出一种基于序列级前缀提示的生成式文本摘要方法和装置,该方法包括:获取文本和文本的参考摘要进行预处理;将经过预处理的文本输入第一预训练模型生成多条候选摘要,根据参考摘要使用Rouge指标对生成的候选摘要进行评估得到Rouge分值,并对多条候选摘要进行排序;对排序后的多条候选摘要进行预处理,根据经过预处理的文本、参考摘要和多条候选摘要利用多损失联合调优方式对摘要生成模型进行训练,得到具有序列级前缀提示的摘要生成模型;获取待处理文本进行预处理,并输入具有序列级前缀提示的摘要生成模型,通过序列级前缀提示以自回归方式生成待处理文本的摘要。本申请能够加快摘要生成模型训练过程并大大降低计算量,同时更准确生成摘要。
-
-
-
-
-