索引合并方法和索引合并装置

    公开(公告)号:CN101882142B

    公开(公告)日:2012-12-26

    申请号:CN200910140421.3

    申请日:2009-05-08

    Abstract: 公开了索引合并方法及装置。索引合并方法包括:确定索引库中是否存在不少于n个的、尺寸符合基于预定基准的预定合并条件的子索引,n为整数且大于等于2,预定基准与预定子索引的尺寸相关;如果确定存在则将确定的子索引作为子索引集;计算如果合并子索引集中的子索引将获得的新子索引的尺寸;在剩余的子索引中查找不少于m个的、尺寸符合基于与新子索引尺寸相关的基准的预定条件的子索引,m为整数且大于等于1;如果找到了则将找到的子索引加入子索引集中并对新的子索引集执行计算步骤和查找步骤;如果未找到则对子索引集中的子索引进行合并。利用根据本发明的方法和/或装置,能够在动态文本集环境下获得较稳定的优化的系统性能。

    混搭服务器和提供混搭服务的方法

    公开(公告)号:CN102789471A

    公开(公告)日:2012-11-21

    申请号:CN201110132770.8

    申请日:2011-05-17

    Abstract: 一种混搭服务器和提供混搭服务的方法。该混搭服务器包括:转发模块,其被配置为进行用户浏览器与应用服务器之间的转发处理;抽取模块,其被配置为当转发模块接收到来自应用服务器的网页时,使用一个或更多个预定模板从网页中抽取数据;以及插入模块,其被配置为根据抽取模块抽取出的数据以及与抽取该数据所使用的模板相对应的微格式来生成微格式数据,并将该微格式数据插入到要由转发模块发送给用户浏览器的网页。

    集成web应用的方法、混搭服务器及系统

    公开(公告)号:CN102780730A

    公开(公告)日:2012-11-14

    申请号:CN201110128123.X

    申请日:2011-05-13

    Abstract: 本发明实施例公开了集成web应用的方法、混搭服务器及系统,所述方法包括:从客户端的浏览器获取当前场景信息,所述当前场景信息至少包括所述浏览器的用户正在访问的统一资源定位符及网页内容;依据所述当前场景信息依次判断混搭数据库保存的所有条件和动作对与当前场景信息是否匹配;根据判断结果生成动作列表,所述动作列表包括与所述当前场景信息匹配的条件和动作对中的动作;将所述动作列表中的动作在所述浏览器上进行展示;响应于所述用户通过所述浏览器选择一个或多个动作,在所述浏览器上集成所选择的动作对应的web应用。通过本发明实施例,能够根据用户当前访问的场景信息进行web应用的集成。

    判断网页类型的方法和装置

    公开(公告)号:CN101872347B

    公开(公告)日:2012-09-26

    申请号:CN200910133695.X

    申请日:2009-04-22

    Inventor: 何楠 王主龙 于浩

    Abstract: 公开了一种判断网页的网页类型的方法和装置。所述方法包括:基于待判断网页的URL,在预先存储的规则列表中进行规则匹配,其中规则列表包括多条用于确定网页类型的规则记录;如果规则匹配成功,则依据成功匹配的规则得到待判断网页的网页类型;如果规则匹配失败,则从待判断网页的URL和/或HTML源代码中提取预定特征,并基于由从提取的预定特征中选择的特征构成的特征向量,使用分类器对待判断网页进行网页类型分类,以得到待判断网页的网页类型。在根据本发明的方案中,能够融合规则识别方案与基于统计学习的识别方案的优点,并且能够实现对包括博客、论坛、新闻等在内的各种网页类型进行判断。

    构造索引库的方法和设备以及查询方法

    公开(公告)号:CN102135969A

    公开(公告)日:2011-07-27

    申请号:CN201010103610.6

    申请日:2010-01-22

    Abstract: 本发明提供了构造索引库的方法和设备以及查询方法。一种构造索引库的方法,包括:将一个或多个文档中的词汇分类为第一类别或第二类别;以及根据第一类别的词汇来构建单级索引,并根据第二类别的词汇来构建多级索引。本发明能够在支持大规模检索数据的同时提高整体检索响应速度。

    确定网页的搜索引擎优化规则的方法和设备

    公开(公告)号:CN101887438A

    公开(公告)日:2010-11-17

    申请号:CN200910138425.8

    申请日:2009-05-11

    Abstract: 确定网页的搜索引擎优化规则的方法和设备。方法包括向搜索引擎发送搜索请求;从所述搜索引擎接收搜索结果;从所述搜索结果中选择对应网页具有预定网页等级值的多个条目;针对均包含至少一个规则的多个规则组合中的每个规则组合,按照所述多个条目在所述搜索结果中的顺序,计算所述多个条目的每个条目针对所述每个规则组合的所有规则的得分和,以获得所述每个规则组合的得分和序列;和从所述多个规则组合中,选择这样的规则组合作为所述网页的搜索引擎优化规则:在所述规则组合的得分和序列中,包含连续出现的逆序最长的序列。

    网络搜索方法和设备
    28.
    发明公开

    公开(公告)号:CN101739401A

    公开(公告)日:2010-06-16

    申请号:CN200810173073.5

    申请日:2008-11-26

    Inventor: 杨萌 于浩 王主龙

    Abstract: 本发明公开了一种网络搜索方法和网络搜索设备,网络搜索方法包括以下步骤:获得用于预定网站资源的统一资源定位符URL的变化规则,所述变化规则定义了所述预定网站资源的URL逻辑结构中的固定参数和可变参数、以及可变参数的变化规律;使用所述用于预定网站资源URL的变化规则获取URL;以及通过请求所述获取的URL进行搜索。

    确定网站搜索关键词的方法和装置

    公开(公告)号:CN102682023B

    公开(公告)日:2015-06-17

    申请号:CN201110062065.5

    申请日:2011-03-11

    Inventor: 苏亮 张军 王主龙

    Abstract: 本发明公开了确定网站搜索关键词的方法和装置。所述方法包括:获得候选关键词列表;获得竞争网站列表;确定搜索关键词,包括:基于候选关键词列表和竞争网站列表对候选关键词列表中的关键词进行排序,并将排序后的候选关键词列表中的全部或部分作为搜索关键词。通过所述方法和装置,可以确定出能够为网站带来点击量的搜索关键词,并可以在搜索关键词的搜索结果中减少竞争网站的出现。基于候选关键词列表和竞争网站列表对候选关键词列表中的关键词进行排序包括:为候选关键词列表中的关键词计算权重;根据竞争网站列表对候选关键词中的关键词调整权重;基于权重进行排序。当在关键词的搜索结果中出现竞争网站时,将该关键词的权重调整变小。

    网页下载的方法和装置
    30.
    发明授权

    公开(公告)号:CN102163203B

    公开(公告)日:2013-12-04

    申请号:CN201010120118.X

    申请日:2010-02-24

    Abstract: 本发明提供了网页下载的方法和装置。所述方法包括:选取步骤,从多个网页中选取至少一个列表页面;模板生成步骤,根据所述至少一个列表页面中的一个或多个来生成列表页面模板;下载更新步骤,利用所述列表页面模板和所述至少一个列表页面来下载和/或更新所述至少一个列表页面中所包含的主题的主题页面。根据本发明的网页下载的方法和装置,可以针对具有多个结构相似的网页的网站进行高效、自动的网页下载。

Patent Agency Ranking