一种基于多因子的行政区划的可信度计算的方法

    公开(公告)号:CN104657486B

    公开(公告)日:2018-01-19

    申请号:CN201510093347.X

    申请日:2015-03-02

    Abstract: 本发明提供一种基于多因子的行政区划的可信度计算的方法,对一个待查询地址字符串,计算位置查询因子;根据该待查询地址字符串所有可能的行政区划结果集,计算区划位置级差因子、区划相关因子和区划级差相关因子;根据区划级差相关因子,获得某行政区划字符串与所有其它行政区划字符串之间的区划级差相关因子的和,乘以该行政区划字符串的位置查询因子,即为该行政区划字符串的可信度,取最大可信度对应的行政区划字符串所在的行政区划结果。利用对待查询地址字符串的分词结果及所有可能的行政区划结果集,根据地址数据表达的语义特点,通过适当的匹配算法提高地址检索的速度和准确性,从而提高网络地图在线服务质量,从而为用户更好的定位。

    基于多约束推理的互联网地理位置信息规范化方法

    公开(公告)号:CN104572992A

    公开(公告)日:2015-04-29

    申请号:CN201510004485.6

    申请日:2015-01-06

    CPC classification number: G06F17/30241

    Abstract: 本发明提供一种基于多约束推理的互联网地理位置信息规范化方法,首先利用爬虫从互联网上挖掘需要的原始文本地理信息,然后利用自定义的地理规范化模型,对从互联网中获取的零散的、不易理解的地理信息进行规范化,将他们进行分词,按照规范化的格式进行存储,最后结合贝叶斯公式进行计算判断信息的可信度,进行信息库的更新,使已经建立的规范化的地理文本信息库不断的完善和充实,信息的准确性和可靠性不断的提升。本发明提出了基于多约束的贝叶斯算法,提高了地理信息的准确性。

    一种基于贝叶斯分词算法的中文地址语义标注方法

    公开(公告)号:CN106528526B

    公开(公告)日:2019-05-28

    申请号:CN201610880863.1

    申请日:2016-10-09

    Abstract: 本发明公开了一种基于贝叶斯分词算法的中文地址语义标注方法,包括步骤S1:预设置针对中文地址数据进行语义标注的标注关系表;步骤S2:获取预切分、标注好的训练语料;步骤S3:对训练语料进行统计学习得到词频词典、标注关系词典、标注模式表;步骤S4:输入待标注地址字符串进行全切分;步骤S5:根据词频词典及贝叶斯分词算法获取概率最大的分词方案;步骤S6:根据标注关系词典对分词方案进行标注得到标注结果。标注关系表设定了一个规范化的标注模板;通过统计学习训练语料获得了包含词频词典、标注关系词典以及标注模式表的数据库;根据前述训练数据库匹配得到标注好的具有语义信息的中文地址,快速准确地完成了针对中文地址数据的语义解析。

    基于滑动窗口最大匹配算法的地址匹配方法

    公开(公告)号:CN104615782B

    公开(公告)日:2017-10-10

    申请号:CN201510092653.1

    申请日:2015-03-02

    Abstract: 本发明提供一种基于滑动窗口最大匹配算法的地址匹配方法,包括以下步骤:建立行政区划表;对行政区划表建立匹配查询关系;设置滑动窗口,进行匹配查询。本发明方法将地理赋值的两个环节“地址分词”与“地址匹配”整合到了一起,即在分词的同时进行数据库匹配,实现了在分词完成的同时也查找到了所匹配的记录;通过这种方法可以有效的减少数据库的查询访问次数,从而加快匹配速度。

    一种基于规则的中文地址解析方法

    公开(公告)号:CN106528605A

    公开(公告)日:2017-03-22

    申请号:CN201610853820.4

    申请日:2016-09-27

    CPC classification number: G06F16/9537 G06F17/2765

    Abstract: 一种基于规则的中文地址解析方法,其包括以下步骤:1)输入中文地址信息字符串;2)对于一条中文地址串address,从地址第一个字开始,到地址最后一个字结束,每一个字与特征字集合Q进行一一对应匹配,若匹配成功,则记录地址信息中该特征字P与其位置i,地址遍历结束后,将每个地址信息中存在的特征字P与其对应的位置i放入链表ArrayList中保存;3)若链表ArrayList的大小为size,从ArrayList中的第一个值j=1开始,到j=size结束,提取出链表中所有特征字,然后从j=1到size-1循环,若特征字j到j+1的转移概率大于特定阀值d时,则转移,此时提取出j所对应的特征字Pi和位置值i,在address中位置i处切分,如此循环,直到判断完最后一个特征字是否切分。

    一种基于集合运算的中文地址行政区划解析方法

    公开(公告)号:CN105677700B

    公开(公告)日:2018-12-14

    申请号:CN201510980148.0

    申请日:2015-12-23

    Abstract: 本发明公开了一种基于集合运算的中文地址行政区划解析方法,该方法包括以下步骤:首先利用行政区划字典和移动窗口最大匹配算法,从中文地址中提取所有可能的行政区划数据集,然后利用中文地址行政区划元素之间具有层次关系的特点,建立行政区划条件集合运算规则,最后对行政区划集合进行条件集合运算,得到信息量最完整最准确的中文地址的行政区划。本发明方法解决了在互联网中中文地址数据混乱无序的情况下快速解析出中文地址行政区划的问题,并能得到信息量最完整最准确的中文地址的行政区划解析结果。

    一种基于多因子的行政区划的可信度计算的方法

    公开(公告)号:CN104657486A

    公开(公告)日:2015-05-27

    申请号:CN201510093347.X

    申请日:2015-03-02

    Abstract: 本发明提供一种基于多因子的行政区划的可信度计算的方法,对一个待查询地址字符串,计算位置查询因子;根据该待查询地址字符串所有可能的行政区划结果集,计算区划位置级差因子、区划相关因子和区划级差相关因子;根据区划级差相关因子,获得某行政区划字符串与所有其它行政区划字符串之间的区划级差相关因子的和,乘以该行政区划字符串的位置查询因子,即为该行政区划字符串的可信度,取最大可信度对应的行政区划字符串所在的行政区划结果。利用对待查询地址字符串的分词结果及所有可能的行政区划结果集,根据地址数据表达的语义特点,通过适当的匹配算法提高地址检索的速度和准确性,从而提高网络地图在线服务质量,从而为用户更好的定位。

Patent Agency Ranking