-
公开(公告)号:CN116304745B
公开(公告)日:2024-04-12
申请号:CN202310324759.4
申请日:2023-03-27
Applicant: 济南大学
IPC: G06F18/22 , G06F40/30 , G06F18/25 , G06F40/258 , G06F40/295 , G06F16/33
Abstract: 本发明公开了基于深层次语义信息的文本话题匹配方法及系统,属于文本匹配技术领域。本发明通过命名实体识别模型对文本进行实体提取,而后通过特征工程将实体进行筛选,得到文本的关键实体;通过BART模型进行文本摘要,得到文本的主要信息;最后将文本摘要和关键实体进行特征融合,获取深层次语义信息特征向量,将深层次语义信息和目标新闻文本输入预设的文本话题匹配模型,获取文本话题匹配结果。提升了文本话题匹配准确性,解决了现有技术中存在“与文本主旨无关的外部知识极易误导对当前话题的判断,易丢失文本关键信息,导致长文本匹配效果差”的问题。
-
公开(公告)号:CN116304745A
公开(公告)日:2023-06-23
申请号:CN202310324759.4
申请日:2023-03-27
Applicant: 济南大学
IPC: G06F18/22 , G06F40/30 , G06F18/25 , G06F40/258 , G06F40/295 , G06F16/33
Abstract: 本发明公开了基于深层次语义信息的文本话题匹配方法及系统,属于文本匹配技术领域。本发明通过命名实体识别模型对文本进行实体提取,而后通过特征工程将实体进行筛选,得到文本的关键实体;通过BART模型进行文本摘要,得到文本的主要信息;最后将文本摘要和关键实体进行特征融合,获取深层次语义信息特征向量,将深层次语义信息和目标新闻文本输入预设的文本话题匹配模型,获取文本话题匹配结果。提升了文本话题匹配准确性,解决了现有技术中存在“与文本主旨无关的外部知识极易误导对当前话题的判断,易丢失文本关键信息,导致长文本匹配效果差”的问题。
-