一种不同数据源的兴趣点的模糊匹配方法

    公开(公告)号:CN105045880A

    公开(公告)日:2015-11-11

    申请号:CN201510430517.9

    申请日:2015-07-22

    Applicant: 福州大学

    CPC classification number: G06F17/30864 G06F17/30985

    Abstract: 本发明涉及一种不同数据源的兴趣点的模糊匹配方法,包括以下步骤:1、分别从两个不同的网站中采集兴趣点数据构成数据集A、B;2、提取名称完全匹配的兴趣点配对形成数据样本,通过数据样本计算平均位置偏差并确定匹配范围;3、分别从数据集A、B中取待匹配点和待匹配集;4、对待匹配点和待匹配集中所有兴趣点的名称进行逐级地址分词,然后通过地址词典过滤名称中的地址信息;5、采用KMP算法对待匹配点和待匹配集中每个兴趣点进行匹配,通过匹配率判断兴趣点是否相同;6、同理,对数据集A中的其他兴趣点,在数据集B中找出与其匹配的兴趣点。该方法有利于精确匹配不同数据源的兴趣点数据,过滤重复的数据。

    一种不同数据源的兴趣点的模糊匹配方法

    公开(公告)号:CN105045880B

    公开(公告)日:2018-09-18

    申请号:CN201510430517.9

    申请日:2015-07-22

    Applicant: 福州大学

    Abstract: 本发明涉及一种不同数据源的兴趣点的模糊匹配方法,包括以下步骤:1、分别从两个不同的网站中采集兴趣点数据构成数据集A、B;2、提取名称完全匹配的兴趣点配对形成数据样本,通过数据样本计算平均位置偏差并确定匹配范围;3、分别从数据集A、B中取待匹配点和待匹配集;4、对待匹配点和待匹配集中所有兴趣点的名称进行逐级地址分词,然后通过地址词典过滤名称中的地址信息;5、采用KMP算法对待匹配点和待匹配集中每个兴趣点进行匹配,通过匹配率判断兴趣点是否相同;6、同理,对数据集A中的其他兴趣点,在数据集B中找出与其匹配的兴趣点。该方法有利于精确匹配不同数据源的兴趣点数据,过滤重复的数据。

Patent Agency Ranking