-
公开(公告)号:CN104317882B
公开(公告)日:2017-05-10
申请号:CN201410564432.5
申请日:2014-10-21
Applicant: 北京理工大学
IPC: G06F17/30
Abstract: 本发明公开了一种决策级中文分词融合方法,属于自然语言处理和智能信息处理领域。本方法首先利用三种分词工具对中文文本中的句子进行分词,并对分词结果进行预处理,利用整型数组保存每个分词工具的分词结果。然后采用决策级分词融合模型进行分词,决策级分词融合模型为分层的融合结构,包括特征级和决策级,最后采用一种基于Web的方法识别句子中的未登录词。本方法通过采用决策级融合方式进行分词结果融合,有效提高了分词结果的准确性。本发明在信息检索、文本分类、主题检测、网络内容监控等领域具有广阔的应用前景。
-
公开(公告)号:CN104317882A
公开(公告)日:2015-01-28
申请号:CN201410564432.5
申请日:2014-10-21
Applicant: 北京理工大学
IPC: G06F17/30
CPC classification number: G06F17/30613 , G06F17/30864
Abstract: 本发明公开了一种决策级中文分词融合方法,属于自然语言处理和智能信息处理领域。本方法首先利用三种分词工具对中文文本中的句子进行分词,并对分词结果进行预处理,利用整型数组保存每个分词工具的分词结果。然后采用决策级分词融合模型进行分词,决策级分词融合模型为分层的融合结构,包括特征级和决策级,最后采用一种基于Web的方法识别句子中的未登录词。本方法通过采用决策级融合方式进行分词结果融合,有效提高了分词结果的准确性。本发明在信息检索、文本分类、主题检测、网络内容监控等领域具有广阔的应用前景。
-