-
公开(公告)号:CN104063502B
公开(公告)日:2017-03-22
申请号:CN201410322692.1
申请日:2014-07-08
Applicant: 中南大学
IPC: G06F17/30
Abstract: 本发明提出了一种基于语义模型的WSDL半结构化文档的相似性分析及分类方法,利用WordNet词典建立WSDL半结构化文档语义模型,并通过最大熵模型消除词语歧义,建立WSDL半结构化文档语料库特征向量模型,生成WSDL半结构化文档的文档特征矩阵,从而对两个不同文档进行内容的分类与评估,最终得到服务功能的相似性比较。本发明所述方法提高了文档相似性判断准确度,提升了文档分类速度以及准确度,并对向量空间有降维效果。
-
公开(公告)号:CN104063502A
公开(公告)日:2014-09-24
申请号:CN201410322692.1
申请日:2014-07-08
Applicant: 中南大学
IPC: G06F17/30
CPC classification number: G06F17/30908 , G06F17/30705
Abstract: 本发明提出了一种基于语义模型的WSDL半结构化文档的相似性分析及分类方法,利用WordNet词典建立WSDL半结构化文档语义模型,并通过最大熵模型消除词语歧义,建立WSDL半结构化文档语料库特征向量模型,生成WSDL半结构化文档的文档特征矩阵,从而对两个不同文档进行内容的分类与评估,最终得到服务功能的相似性比较。本发明所述方法提高了文档相似性判断准确度,提升了文档分类速度以及准确度,并对向量空间有降维效果。
-