-
公开(公告)号:CN118760772B
公开(公告)日:2025-04-01
申请号:CN202410736212.X
申请日:2024-06-07
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于多视图蒸馏增强的实体链接方法。本方法包括:1)多视图实体表征:将每个实体原本篇章级的文本描述分成多个句子级的视图,对每一视图独立地经过语言模型进行编码,得到每一句子视图对应的向量表征;从中选择一个和提及最相关的视图的向量表征作为实体的向量表征,以避免与提及无关的信息被引入到实体表征中;2)多视图蒸馏增强:在引入了细粒度的视图表征后,通过交叉对齐和自对齐机制,分别在原始的实体层次以及细粒度的视图层次两个维度上对齐学生模型和教师模型间的相关性分数分布,从而促进教师模型到学生模型的细粒度知识蒸馏。本发明促进了实体链接系统的整体性能的提升。
-
公开(公告)号:CN118760772A
公开(公告)日:2024-10-11
申请号:CN202410736212.X
申请日:2024-06-07
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于多视图蒸馏增强的实体链接方法。本方法包括:1)多视图实体表征:将每个实体原本篇章级的文本描述分成多个句子级的视图,对每一视图独立地经过语言模型进行编码,得到每一句子视图对应的向量表征;从中选择一个和提及最相关的视图的向量表征作为实体的向量表征,以避免与提及无关的信息被引入到实体表征中;2)多视图蒸馏增强:在引入了细粒度的视图表征后,通过交叉对齐和自对齐机制,分别在原始的实体层次以及细粒度的视图层次两个维度上对齐学生模型和教师模型间的相关性分数分布,从而促进教师模型到学生模型的细粒度知识蒸馏。本发明促进了实体链接系统的整体性能的提升。
-