-
公开(公告)号:CN107844608B
公开(公告)日:2021-11-30
申请号:CN201711273188.7
申请日:2017-12-06
Applicant: 湖南大学
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06F40/242 , G06F40/211 , G06K9/62
Abstract: 本发明公开了一种基于词向量的句子相似度比较方法。本发明基于大型语料库训练得到词向量模型,并且通过斯坦福句法分析器将句子表示成句法成分树结构,然后在词向量模型中搜索句子成分树叶子节点所对应的词向量,这此基础上,我们提出了一种基于词向量的句子相似度比较方法,这种方法首先构建句子成分向量树,然后通过我们提出的soft partial tree kernel函数计算最终的句子相似度得分。实验结果表示,这种方法相对于目前性能表现很强的众多神经网络方法,在超过一半数据集上都取得了最好的效果,并且在平均性能上取得了最先进的效果。这说明了这种方法是一种很有效的句子相似度度量方式。
-
公开(公告)号:CN107844608A
公开(公告)日:2018-03-27
申请号:CN201711273188.7
申请日:2017-12-06
Applicant: 湖南大学
CPC classification number: G06F17/30705 , G06F17/271 , G06F17/2735 , G06F17/2775 , G06F17/2785 , G06K9/6215
Abstract: 本发明公开了一种基于词向量的句子相似度比较方法。本发明基于大型语料库训练得到词向量模型,并且通过斯坦福句法分析器将句子表示成句法成分树结构,然后在词向量模型中搜索句子成分树叶子节点所对应的词向量,这此基础上,我们提出了一种基于词向量的句子相似度比较方法,这种方法首先构建句子成分向量树,然后通过我们提出的soft partial tree kernel函数计算最终的句子相似度得分。实验结果表示,这种方法相对于目前性能表现很强的众多神经网络方法,在超过一半数据集上都取得了最好的效果,并且在平均性能上取得了最先进的效果。这说明了这种方法是一种很有效的句子相似度度量方式。
-