-
公开(公告)号:CN102426603B
公开(公告)日:2014-06-18
申请号:CN201110356631.3
申请日:2011-11-11
Applicant: 任子行网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种文字信息地域识别方法及装置,其中识别方法包括步骤:A、获取待进行地域分析的文字信息,构建词向量序列;B、进行地域分层分析,得出地域分层路径;C、进行地域扩展分析,进一步得出相关的地域特征词;D、根据地域分层路径和由地域扩展分析得出的地域特征词,得到最优地域分层路径;E、构建第一主题词向量空间和第二主题词向量空间;F、对第一主题词向量空间和第二主题词向量空间进行相似度计算,根据最优地域分层路径和相似度计算结果判断文字信息所属地域。本发明实现了对信息内容所属地域进行了准确判断,这样不但判断更加准确,地域层次分明详细,还能排除与信息主题无关的地域特征词信息。
-
公开(公告)号:CN102426603A
公开(公告)日:2012-04-25
申请号:CN201110356631.3
申请日:2011-11-11
Applicant: 任子行网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种文字信息地域识别方法及装置,其中识别方法包括步骤:A、获取待进行地域分析的文字信息,构建词向量序列;B、进行地域分层分析,得出地域分层路径;C、进行地域扩展分析,进一步得出相关的地域特征词;D、根据地域分层路径和由地域扩展分析得出的地域特征词,得到最优地域分层路径;E、构建第一主题词向量空间和第二主题词向量空间;F、对第一主题词向量空间和第二主题词向量空间进行相似度计算,根据最优地域分层路径和相似度计算结果判断文字信息所属地域。本发明实现了对信息内容所属地域进行了准确判断,这样不但判断更加准确,地域层次分明详细,还能排除与信息主题无关的地域特征词信息。
-