一种基于句法增强的多维向量化文本相似度计算方法

    公开(公告)号:CN119918526A

    公开(公告)日:2025-05-02

    申请号:CN202510416311.4

    申请日:2025-04-03

    Abstract: 本发明实施例中提供了一种基于句法增强的多维向量化文本相似度计算方法,属于数据处理技术领域,具体包括:步骤1,对输入文本进行分词和句法分析,得到分词结果及其对应的成分标签;步骤2,分别采用WoBERT模型和Transformer的自注意力机制对分词结果进行向量化表示并进行融合,得到融合向量;步骤3,通过深度集成变换器对融合向量进行降维处理,生成具有强表达能力的目标词向量;步骤4,针对相同成分标签的目标词向量,通过义素相似度公式计算相似度值;步骤5,基于全部相似度值,通过加权平均调整最终相似度评分。通过本发明的方案,引入基于句法与词向量结合的文本相似度匹配方法,提高了相似度计算的精度和效率。

Patent Agency Ranking