-
公开(公告)号:CN106570130A
公开(公告)日:2017-04-19
申请号:CN201610955408.3
申请日:2016-10-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种基于RDF知识库的文本地域判断方法及其系统,方法包括:构建关于地域信息的RDF知识库,并建立索引;预设地域区划的层级;预设地域相关名词的位置权重;获取文本中的地域相关名词;获取文本中所有地域相关名词各自对应的地域区划集合;分别计算地域区划集合中各地域区划对应一地域相关名词的第一分值;获取所有地域区划集合中各地域区划所对应的地域相关名词集合;将各地域区划的第一分值进行累加,得到地域区划的第二分值;根据第二分值,计算各地域区划为文本属地的概率。本发明在RDF知识库的基础上来实现文本的地域打标,提高方法的召回率,同时保证较高的准确率。
-
公开(公告)号:CN105608072B
公开(公告)日:2019-02-19
申请号:CN201510979376.6
申请日:2015-12-23
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/27
Abstract: 本发明公开了一种文本涉及地分析方法及其系统,方法包括提取文本的地域相关名词;将地域相关名词进行地域匹配,得到包含文本涉及地的地域区划列表;计算地域相关名词在文本中的词频概率,确定地域区划列表中对应的文本涉及地的第一概率;根据地域相关名词及其对应的文本涉及地的语义相关度,获取文本涉及地的语义概率;根据文本所在版块的统计信息或发布人的统计信息中文本涉及地的历史概率,获取文本涉及地的第二概率;根据第一概率、语义概率和第二概率,获取文本涉及地的综合概率;若综合概率大于等于第一预设阈值,则判定文本涉及地为文本的属地;将文本涉及地添加至文本的地域属性标签。本发明可提高文本地域分析判断的准确性。
-
公开(公告)号:CN105608072A
公开(公告)日:2016-05-25
申请号:CN201510979376.6
申请日:2015-12-23
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/27
CPC classification number: G06F17/2785 , G06F17/2715
Abstract: 本发明公开了一种文本涉及地分析方法及其系统,方法包括提取文本的地域相关名词;将地域相关名词进行地域匹配,得到包含文本涉及地的地域区划列表;计算地域相关名词在文本中的词频概率,确定地域区划列表中对应的文本涉及地的第一概率;根据地域相关名词及其对应的文本涉及地的语义相关度,获取文本涉及地的语义概率;根据文本所在版块的统计信息或发布人的统计信息中文本涉及地的历史概率,获取文本涉及地的第二概率;根据第一概率、语义概率和第二概率,获取文本涉及地的综合概率;若综合概率大于等于第一预设阈值,则判定文本涉及地为文本的属地;将文本涉及地添加至文本的地域属性标签。本发明可提高文本地域分析判断的准确性。
-
公开(公告)号:CN106570130B
公开(公告)日:2019-10-01
申请号:CN201610955408.3
申请日:2016-10-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/332
Abstract: 本发明公开了一种基于RDF知识库的文本地域判断方法及其系统,方法包括:构建关于地域信息的RDF知识库,并建立索引;预设地域区划的层级;预设地域相关名词的位置权重;获取文本中的地域相关名词;获取文本中所有地域相关名词各自对应的地域区划集合;分别计算地域区划集合中各地域区划对应一地域相关名词的第一分值;获取所有地域区划集合中各地域区划所对应的地域相关名词集合;将各地域区划的第一分值进行累加,得到地域区划的第二分值;根据第二分值,计算各地域区划为文本属地的概率。本发明在RDF知识库的基础上来实现文本的地域打标,提高方法的召回率,同时保证较高的准确率。
-
-
-