-
公开(公告)号:CN119005190A
公开(公告)日:2024-11-22
申请号:CN202411037062.X
申请日:2024-07-31
Applicant: 中国电子科技集团有限公司电子科学研究院 , 北京邮电大学 , 中电科电科院科技集团有限公司
IPC: G06F40/295 , G06F40/30 , G06F40/284 , G06F40/186 , G06F40/16
Abstract: 本发明提出了一种低资源场景下多模态命名实体识别与定位方法,方法包括:通过计算相似度筛选语义相近的图文对,在低资源场景下,使用LLaMA作为核心结构,通过构造多模态实例,更加充分地利用模型预训练知识。在训练阶段,通过计算相似度筛选语义相近的图文对,构建实例辅助训练,并在训练过程中同时计算命名实体识别损失函数和实体定位损失函数帮助训练;在非训练阶段,通过语义相似度计算构建实例辅助推理,提升多模态命名实体识别与定位在低资源情景下的效果。
-
公开(公告)号:CN118861281A
公开(公告)日:2024-10-29
申请号:CN202410808838.7
申请日:2024-06-21
Applicant: 北京邮电大学
IPC: G06F16/35 , G06F18/24 , G06F40/284 , G06F40/295 , G06F40/289 , G06N3/045 , G06N3/084 , G06N5/04
Abstract: 本发明提供了一种基于表达感知最近邻的信息抽取方法,通过引入后交互最近邻算法,将检索词和文本词均映射入向量空间计算,将信息抽取转换为向量检索问题,提高信息抽取的可扩展性、可适应性以及可解释性。在训练阶段,构建了统一的索引结构,结合表达方式相似度计算和几何分布策略进行采样,并使用了类别不平衡损失函数,保证训练过程各个训练实例具有相对一致的优化方向,提高了可扩展性和可适应性;在非训练阶段,通过结合推理阶段检索到的标注样例和LIME算法,本发明可以对抽取的信息实例进行合理解释,提高了可解释性。
-