-
公开(公告)号:CN104866625B
公开(公告)日:2018-08-17
申请号:CN201510329196.3
申请日:2015-06-15
Applicant: 苏州大学张家港工业技术研究院 , 苏州大学
IPC: G06F17/30
Abstract: 本申请提供了一种用于实体匹配的方法及系统,该方法包括:根据两个待处理实体的属性值分布分别确定各自的属性区分度;根据所述两个待处理实体的非主属性的值计算得到所述两个待处理实体的属性相似度;将所述属性区分度和所述属性相似度加权求和得到所述两个待处理实体的实体相似度;将所述实体相似度与相似度阈值进行对比,判断所述两个待处理实体的相似性。该方法能够通过利用非主属性的值以及属性分布求得实体相似度,进而进行实体匹配,较好的识别出相同的实体,节约了时间提高了效率。
-
公开(公告)号:CN105045863B
公开(公告)日:2018-09-28
申请号:CN201510407893.6
申请日:2015-07-13
Applicant: 苏州大学张家港工业技术研究院 , 苏州大学
IPC: G06F17/30
Abstract: 本申请提供了一种用于实体匹配的方法及系统,该方法包括:将待匹配实例对从预先训练的决策树的根节点对应的属性开始进行访问,获取所述待匹配实例对的各属性的属性相似度和置信度;利用所述属性相似度和所述置信度,结合调整系数计算并输出所述待匹配实例对的实体相似度;将所述实体相似度与预设实体相似度阈值进行对比,判断所述待匹配实例对的相似性;其中,所述决策树是利用由已知的匹配实体组成的实例对中共同的非主属性集合和/或主属性集合训练获得。该方法通过利用已知的实例对中两个实体共同的非主属性集合和/或主属性集合训练获得决策树,在进行实体匹配的过程中考虑了非主属性的作用,提高了实体匹配的准确率和召回率。
-
公开(公告)号:CN104866625A
公开(公告)日:2015-08-26
申请号:CN201510329196.3
申请日:2015-06-15
Applicant: 苏州大学张家港工业技术研究院
IPC: G06F17/30
CPC classification number: G06F17/30705
Abstract: 本申请提供了一种用于实体匹配的方法及系统,该方法包括:根据两个待处理实体的属性值分布分别确定各自的属性区分度;根据所述两个待处理实体的非主属性的值计算得到所述两个待处理实体的属性相似度;将所述属性区分度和所述属性相似度加权求和得到所述两个待处理实体的实体相似度;将所述实体相似度与相似度阈值进行对比,判断所述两个待处理实体的相似性。该方法能够通过利用非主属性的值以及属性分布求得实体相似度,进而进行实体匹配,较好的识别出相同的实体,节约了时间提高了效率。
-
公开(公告)号:CN105045863A
公开(公告)日:2015-11-11
申请号:CN201510407893.6
申请日:2015-07-13
Applicant: 苏州大学张家港工业技术研究院
IPC: G06F17/30
CPC classification number: G06F17/30675 , G06F17/30734
Abstract: 本申请提供了一种用于实体匹配的方法及系统,该方法包括:将待匹配实例对从预先训练的决策树的根节点对应的属性开始进行访问,获取所述待匹配实例对的各属性的属性相似度和置信度;利用所述属性相似度和所述置信度,结合调整系数计算并输出所述待匹配实例对的实体相似度;将所述实体相似度与预设实体相似度阈值进行对比,判断所述待匹配实例对的相似性;其中,所述决策树是利用由已知的匹配实体组成的实例对中共同的非主属性集合和/或主属性集合训练获得。该方法通过利用已知的实例对中两个实体共同的非主属性集合和/或主属性集合训练获得决策树,在进行实体匹配的过程中考虑了非主属性的作用,提高了实体匹配的准确率和召回率。
-
-
-