一种基于唯一性约束的DeepWeb实体识别方法

    公开(公告)号:CN103257983A

    公开(公告)日:2013-08-21

    申请号:CN201210330860.2

    申请日:2012-09-10

    Applicant: 苏州大学

    Abstract: 本发明在于公开了一种基于唯一性约束的Deep Web实体识别方法,方法包括两个主要步骤:首先从硬性约束角度出发,将问题归结为一个k部图聚类问题,提出了聚类算法;然后将其扩展到软性约束条件下,将实体识别问题归结为优化问题,并提出了匹配算法。本发明将记录连接和数据融合集成起来并以一种全局的方式应用它们,提出了在硬性约束下的k部图聚类问题,并将它扩展到软性约束的情况中;同时基于属性值的相似性和同一记录里属性之间的关联性做出全局性的决策,能够识别不正确的值并且将它们从一开始就和正确的值区分开来,从而获得更好的识别效果;且本发明方法对属性值进行聚类从而表现出更加细粒度的聚类效果。

    一种基于唯一性约束的DeepWeb实体识别方法

    公开(公告)号:CN103257983B

    公开(公告)日:2016-06-15

    申请号:CN201210330860.2

    申请日:2012-09-10

    Applicant: 苏州大学

    Abstract: 本发明在于公开了一种基于唯一性约束的Deep Web实体识别方法,方法包括两个主要步骤:首先从硬性约束角度出发,将问题归结为一个k部图聚类问题,提出了聚类算法;然后将其扩展到软性约束条件下,将实体识别问题归结为优化问题,并提出了匹配算法。本发明将记录连接和数据融合集成起来并以一种全局的方式应用它们,提出了在硬性约束下的k部图聚类问题,并将它扩展到软性约束的情况中;同时基于属性值的相似性和同一记录里属性之间的关联性做出全局性的决策,能够识别不正确的值并且将它们从一开始就和正确的值区分开来,从而获得更好的识别效果;且本发明方法对属性值进行聚类从而表现出更加细粒度的聚类效果。

Patent Agency Ranking