基于Borda算法的搜索结果排序方法

    公开(公告)号:CN105808739A

    公开(公告)日:2016-07-27

    申请号:CN201610136924.3

    申请日:2016-03-10

    CPC classification number: G06F16/90348

    Abstract: 基于Borda算法的搜索结果排序方法,属于搜索引擎结果排序领域。现有的Borda排序算法对于结果相关分值的计算时,所用的位置关系并不能完全代表相关度的变化,导致搜索结果排序不准确。一种基于Borda算法的搜索结果排序方法,先是对返回结果的位置得分统一规范化处理,并且结合进了检索词串与搜索结果的相似度,对相似度的计算方法也进行了改进。本发明利用标题和摘要进行相似度的计算时,结合了查询词与结果的匹配权重,使得相似度的计算更加准确;且提高搜索效率。

    基于元搜索引擎搜索结果的去重方法

    公开(公告)号:CN105808738A

    公开(公告)日:2016-07-27

    申请号:CN201610136918.8

    申请日:2016-03-10

    CPC classification number: G06F16/955 G06F16/24556 G06F16/9535

    Abstract: 基于元搜索引擎搜索结果的去重方法,本发明涉及元搜索引擎搜索结果的去重方法。本发明是要解决现有技术不能对格式不同的URL的相同网页和重定向的网页进行去重、根据标点符号周边的信息、标点符号的位置以及词频的模糊匹配不能全面地代表句子与文章问题,而提出的基于元搜索引擎搜索结果的去重方法。该方法是通过一、根据URL地址判断是否是重复网页;二、分别计算两个网页的标题相似度和两个网页摘要的相似度;三、根据标题相似度和摘要的相似度计算网页的相似度:步骤四、如果相似度值Sim(A,B)大于阈值,则就认为两个网页是重复的等步骤实现的。本发明应用于元搜索引擎搜索结果的去重领域。

Patent Agency Ranking