-
公开(公告)号:CN110750977B
公开(公告)日:2023-06-02
申请号:CN201911009970.7
申请日:2019-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F16/33 , G06F18/22 , G06N3/04
Abstract: 本说明书实施例公开了一种文本相似度计算方法及系统。所述方法包括:获取第一文本和第二文本;所述第一文本和所述第二文本存在第一编辑距离,所述第一编辑距离小于预设第一编辑距离阈值;根据所述第一文本和所述第二文本之间的差异,提取第一差异文本和第二差异文本;至少根据所述第一文本和所述第二文本提取对应的第一特征向量;至少根据所述第一差异文本和所述第二差异文本提取对应的第二特征向量;基于所述第一特征向量和所述第二特征向量,获得第三特征向量;并基于所述第三特征向量,确定所述第一文本和所述第二文本之间的相似度。
-
公开(公告)号:CN110750977A
公开(公告)日:2020-02-04
申请号:CN201911009970.7
申请日:2019-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F16/33 , G06K9/62 , G06N3/04
Abstract: 本说明书实施例公开了一种文本相似度计算方法及系统。所述方法包括:获取第一文本和第二文本;所述第一文本和所述第二文本存在第一编辑距离,所述第一编辑距离小于预设第一编辑距离阈值;根据所述第一文本和所述第二文本之间的差异,提取第一差异文本和第二差异文本;至少根据所述第一文本和所述第二文本提取对应的第一特征向量;至少根据所述第一差异文本和所述第二差异文本提取对应的第二特征向量;基于所述第一特征向量和所述第二特征向量,获得第三特征向量;并基于所述第三特征向量,确定所述第一文本和所述第二文本之间的相似度。
-