-
公开(公告)号:CN103678643B
公开(公告)日:2017-02-08
申请号:CN201310713258.1
申请日:2013-12-20
Applicant: 公安部第三研究所
IPC: G06F17/30
Abstract: 本发明公开了针对关联关系的语义区分能力度量方法,该方法建立在语义区分模型的基础上,语义区分模型是文档空间密度与抽取某关键词的文档空间密度的差,并用函数来模拟语义区分模型,根据统计和图论的特征提出五种不同的策略,利用一定规模的数据验证了,建立在语义区分模型基础上语义区分能力计算方法具有高相关特性,从而证明了该方法的准确性。更重要的是,该专利将该方法应用于文档聚类分析中,表明语义区分能力在处理数据挖掘任务时更具有发展前景。同时本方案用函数来模拟语义区分模型,降低了语义区分能力计算的复杂度。
-
公开(公告)号:CN103678643A
公开(公告)日:2014-03-26
申请号:CN201310713258.1
申请日:2013-12-20
Applicant: 公安部第三研究所
IPC: G06F17/30
CPC classification number: G06F17/3069 , G06F17/30705
Abstract: 本发明公开了针对关联关系的语义区分能力度量方法,该方法建立在语义区分模型的基础上,语义区分模型是文档空间密度与抽取某关键词的文档空间密度的差,并用函数来模拟语义区分模型,根据统计和图论的特征提出五种不同的策略,利用一定规模的数据验证了,建立在语义区分模型基础上语义区分能力计算方法具有高相关特性,从而证明了该方法的准确性。更重要的是,该专利将该方法应用于文档聚类分析中,表明语义区分能力在处理数据挖掘任务时更具有发展前景。同时本方案用函数来模拟语义区分模型,降低了语义区分能力计算的复杂度。
-
公开(公告)号:CN103678642A
公开(公告)日:2014-03-26
申请号:CN201310713182.2
申请日:2013-12-20
Applicant: 公安部第三研究所
CPC classification number: G06F17/30864 , G06F17/2785 , G06F17/30731
Abstract: 本发明公开了基于搜索引擎的概念语义相似度度量方法,其将页面计数、语义片段和已显示搜索结果的数量集成形成的一种新方法。从而有效的移除了搜索引擎数据中存在的噪声和冗余度,有效解决现有技术所存在的问题。
-
-