一种互联网信息搜索聚合呈现方法

    公开(公告)号:CN103955529B

    公开(公告)日:2018-05-01

    申请号:CN201410198228.6

    申请日:2014-05-12

    CPC classification number: G06F16/00

    Abstract: 本发明公开了一种互联网信息搜索聚合呈现方法。本方法为:1)在互联网上爬取页面,并根据页面正文内容建立对应该网页的索引;2)根据输入的查询词检索聚合内容库,若存在该查询词对应的应答内容,则将其作为搜索结果返回;若不存在,则进行步骤3);3)根据该查询词利用所建索引进行网页检索,获得一候选结果集;4)将该候选结果集中的网页正文进行内容相似性对比,得到一系列的相似页面组{S1,S2,…Sk};5)对每一相似页面组Si,提取该组内所有网页的同质内容和差异化内容,并将其融合生成一新的页面Pi;6)将每一组Si及Pi作为应答内容返回,并保存到所述聚合内容库中。本发明可直接为用户提供有价值的信息服务。

    一种互联网信息搜索聚合呈现方法

    公开(公告)号:CN103955529A

    公开(公告)日:2014-07-30

    申请号:CN201410198228.6

    申请日:2014-05-12

    CPC classification number: G06F16/00 G06F16/951

    Abstract: 本发明公开了一种互联网信息搜索聚合呈现方法。本方法为:1)在互联网上爬取页面,并根据页面正文内容建立对应该网页的索引;2)根据输入的查询词检索聚合内容库,若存在该查询词对应的应答内容,则将其作为搜索结果返回;若不存在,则进行步骤3);3)根据该查询词利用所建索引进行网页检索,获得一候选结果集;4)将该候选结果集中的网页正文进行内容相似性对比,得到一系列的相似页面组{S1,S2,…Sk};5)对每一相似页面组Si,提取该组内所有网页的同质内容和差异化内容,并将其融合生成一新的页面Pi;6)将每一组Si及Pi作为应答内容返回,并保存到所述聚合内容库中。本发明可直接为用户提供有价值的信息服务。

Patent Agency Ranking