-
公开(公告)号:CN109460475A
公开(公告)日:2019-03-12
申请号:CN201811523833.0
申请日:2018-12-13
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/35
Abstract: 本发明公开了一种相似线索的归并方法,包括如下步骤:S1、对于新线索,如果数据库中没有已有线索,则新线索自成一个分组;否则提取新线索和所有已有线索中的人名、地名、物品名、组织名以及关键词,并对每条线索提取得到的人名、地名、物品名、组织名以及关键词进行向量化;S2、将向量化后的新线索和已有线索逐一进行相似度计算并进行大小比较,当新线索与某一已有线索的相似度最大并且大于或等于预设的阈值时,则新线索归并至该已有线索的分组中;当新线索与各条已有线索的相似度都小于预设的阈值时,则该新线索自成一个分组;S3、将步骤S2处理后的新线索和分组结果存储至数据库中。本发明方法能够保证归并的实时性和归并效果。