基于Jieba分词及地址词库的地理编码方法和系统

    公开(公告)号:CN109933797A

    公开(公告)日:2019-06-25

    申请号:CN201910220419.0

    申请日:2019-03-21

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于Jieba分词及地址词库的地理编码方法和系统。本发明的方法包括:步骤1:采集地址数据,建立地址数据库;步骤2:对用户输入的地址字符串进行分词;步骤3:进行两轮地址匹配与地址标准化;步骤4:将标准地址映射为地理坐标。本发明的系统包括:地址数据库,用于保存采集到的八级标准地址数据和其地理坐标;分词模块,用于将用户输入的地址字符串进行拆分;精确匹配模块,用于对拆分后的地址数组进行逐级精确匹配,并补全父级地址;模糊匹配模块,用于对未精确匹配的地址字符串进行模糊匹配,并完成地址的标准化;映射模块,用于将标准化的地址映射为地理坐标,并返回给用户。本发明算法简单易懂,易于编程实现。

Patent Agency Ranking