一种基于语义模型的WSDL半结构化文档相似性分析及分类方法

    公开(公告)号:CN104063502B

    公开(公告)日:2017-03-22

    申请号:CN201410322692.1

    申请日:2014-07-08

    Applicant: 中南大学

    Abstract: 本发明提出了一种基于语义模型的WSDL半结构化文档的相似性分析及分类方法,利用WordNet词典建立WSDL半结构化文档语义模型,并通过最大熵模型消除词语歧义,建立WSDL半结构化文档语料库特征向量模型,生成WSDL半结构化文档的文档特征矩阵,从而对两个不同文档进行内容的分类与评估,最终得到服务功能的相似性比较。本发明所述方法提高了文档相似性判断准确度,提升了文档分类速度以及准确度,并对向量空间有降维效果。

    一种基于语义模型的WSDL半结构化文档相似性分析及分类方法

    公开(公告)号:CN104063502A

    公开(公告)日:2014-09-24

    申请号:CN201410322692.1

    申请日:2014-07-08

    Applicant: 中南大学

    CPC classification number: G06F17/30908 G06F17/30705

    Abstract: 本发明提出了一种基于语义模型的WSDL半结构化文档的相似性分析及分类方法,利用WordNet词典建立WSDL半结构化文档语义模型,并通过最大熵模型消除词语歧义,建立WSDL半结构化文档语料库特征向量模型,生成WSDL半结构化文档的文档特征矩阵,从而对两个不同文档进行内容的分类与评估,最终得到服务功能的相似性比较。本发明所述方法提高了文档相似性判断准确度,提升了文档分类速度以及准确度,并对向量空间有降维效果。

Patent Agency Ranking