-
公开(公告)号:CN107391574B
公开(公告)日:2020-10-16
申请号:CN201710464556.X
申请日:2017-06-19
Applicant: 福建工程学院
IPC: G06F16/33 , G06F16/332 , G06F16/36 , G06F40/216 , G06F40/295 , G06F40/30
Abstract: 本发明提供一种基于本体和群智能算法的中文歧义切分方法,包括:获取用户输入的一个问句进行预处理,得到至少一个候选切分方式,形成候选切分方式集合W;利用本体中标注的同义词信息创建同义词簇;并计算词形的词位置e;以三个连续词形为单位,创建双向三元模型、含词位置信息的语义双向三元模型以及含词位置信息的偏好语义双向三元模型,计算每一种候选切分方式在不同模型下出现的概率;利用不同的模型以及考虑句子断点向量的淘汰集,创建单目标优化模型,并通过群智能算法求解最优的句子断点向量,作为最优分词结果。本发明结合本体计算词频,并利用智能群算法求最优句子断点向量,有效降低错误分词结果,大大提高分词准确性。
-
公开(公告)号:CN107391574A
公开(公告)日:2017-11-24
申请号:CN201710464556.X
申请日:2017-06-19
Applicant: 福建工程学院
Abstract: 本发明提供一种基于本体和群智能算法的中文歧义切分方法,包括:获取用户输入的一个问句进行预处理,得到至少一个候选切分方式,形成候选切分方式集合W;利用本体中标注的同义词信息创建同义词簇;并计算词形的词位置e;以三个连续词形为单位,创建双向三元模型、含词位置信息的语义双向三元模型以及含词位置信息的偏好语义双向三元模型,计算每一种候选切分方式在不同模型下出现的概率;利用不同的模型以及考虑句子断点向量的淘汰集,创建单目标优化模型,并通过群智能算法求解最优的句子断点向量,作为最优分词结果。本发明结合本体计算词频,并利用智能群算法求最优句子断点向量,有效降低错误分词结果,大大提高分词准确性。
-