一种最近邻增强对比学习预训练的文本匹配方法

    公开(公告)号:CN116842134A

    公开(公告)日:2023-10-03

    申请号:CN202310804893.4

    申请日:2023-07-03

    Abstract: 本发明公开了一种最近邻增强对比学习预训练的文本匹配方法,包括:对比学习预训练源文本集、目标文本集,分别得到新的源文本向量和目标文本向量;利用最近邻算法检索源文本向量、目标文本向量的相似实例,分别得到源相似实例集和目标相似实例集;计算源相似实例集的相似权重集和目标相似实例集的相似权重集;基于源相似实例集的相似权重集合并源文本向量和源相似实例集,得到源文本加权向量;基于目标相似实例集的相似权重集合并目标文本向量和目标相似实例集,得到目标文本加权向量;利用文本匹配模型训练源文本加权向量和目标文本加权向量,得到匹配结果。挖掘了源文本和目标文本的相似实例信息,更好地构建文本向量层,提高了匹配准确率。

Patent Agency Ranking