文档处理方法和系统
    21.
    发明公开

    公开(公告)号:CN101901235A

    公开(公告)日:2010-12-01

    申请号:CN200910203108.X

    申请日:2009-05-27

    CPC classification number: G06F17/30716 G06F17/30011

    Abstract: 本发明涉及文档处理技术,更具体地,涉及在企业搜索领域扩展作为搜索数据源的文档集的方法和系统。本发明提供一种对种子文档集中的种子文档进行扩展的方法,其中所述种子文档集包括至少一篇种子文档,所述方法包括:识别所述种子文档的一个或多个实体词,所述实体词是表示所述种子文档所关注的实体的词;依据所识别的每个实体词,识别该实体词所在的种子文档的一个或多个与所依据的该实体词相关的主题词;将所识别的每个主题词以及识别所述每个主题词时所依据的实体词组成实体词-主题词对;将每个所述实体词-主题词对中的实体词和主题词同时作为关键词,通过网络获得一篇或多篇扩展文档。

    为检索对多个文档进行预处理的方法和装置

    公开(公告)号:CN100573520C

    公开(公告)日:2009-12-23

    申请号:CN200610126579.1

    申请日:2006-08-29

    CPC classification number: G06F17/30864

    Abstract: 本发明提供了一种为检索对多个文档进行预处理及呈现检索结果的方法和装置以及包括这些装置的搜索文档的系统。其中该检索结果包括至少一个候选的文档,并且该至少一个文档的每一个被指定了一个表示其内容的树结构,该树结构包括至少一个节点,上述呈现检索结果的方法包括:呈现该检索结果中上述至少一个候选文档对应的树结构的至少一部分。

    用于增强搜索结果导航的可视化方法及装置

    公开(公告)号:CN100481077C

    公开(公告)日:2009-04-22

    申请号:CN200610001267.8

    申请日:2006-01-12

    Inventor: 刘世霞 苏中

    Abstract: 一种增强搜索结果导航的可视化方法,包括:从搜索引擎获取第一搜索结果;对第一搜索结果聚类,以获得聚类信息;计算聚类信息与第一搜索结果的排序列表之间的关联性,并对聚类信息进行可视化处理;根据关联性,将可视聚类信息与第一搜索结果的排序列表联动地显示。当选择某个可视聚类信息项时,还对该可视聚类信息项进一步搜索相关的搜索结果,并对搜索结果进行再次聚类。采用本发明,通过将传统的搜索结果的排序列表与搜索结果的可视化聚类信息相结合以联动地显示,可以方便网络用户发现该可视化聚类信息与搜索结果的排序列表之间潜在的关联,此外,通过动态地搜索更多的搜索结果并再聚类,使网络用户可以容易地获取更详细、准确的搜索结果。

    信息提供方法和信息提供设备

    公开(公告)号:CN101334779A

    公开(公告)日:2008-12-31

    申请号:CN200710126876.0

    申请日:2007-06-29

    CPC classification number: G06F17/30864

    Abstract: 本发明提出了一种使搜索引擎能够搜索到执行客户端脚本生成的内容的方案。首先,web应用或插件判断请求包括客户端脚本的初始网页的客户端是否是搜索引擎。在客户端是搜索引擎的情况下,执行所述客户端脚本以生成相应内容。然后,构造包括所述内容的新网页,生成指向所述新网页的统一资源定位符,以及把所述新网页连同所述统一资源定位符一起提供给所述搜索引擎。这样,搜索引擎无需执行所述客户端脚本就能得到上述内容。

    用于实现交互式浏览的系统和方法

    公开(公告)号:CN1896989A

    公开(公告)日:2007-01-17

    申请号:CN200510084607.3

    申请日:2005-07-15

    Abstract: 本发明提供用于实现交互式浏览的系统及方法。所述系统与知识库和文档数据库相连,知识库存储多个术语及与每个术语相关的信息,文档数据库存储多个文档,所述系统包括:术语获得装置,用于获得用户感兴趣的术语;第一提取装置,用于从知识库中提取与用户感兴趣的术语相关的信息,第二提取装置,用于从文档数据库中提取包含用户感兴趣的术语的文档;用户界面的第一显示部分,用于显示第一提取装置提取的信息;用户界面的第二显示部分,用于显示第二提取装置提取的文档的列表。通过本发明,用户可在同一界面中浏览文档以及文档中术语的信息。

    倒排索引存储方法、倒排索引机制以及在线更新的方法

    公开(公告)号:CN1536509A

    公开(公告)日:2004-10-13

    申请号:CN03109847.9

    申请日:2003-04-11

    Inventor: 苏中 杨力平 潘越

    CPC classification number: G06F17/30622

    Abstract: 本发明提供了一种基于倒排文件的倒排索引存储方法,包括:创建一个倒排文件,该文件包括多个固定大小的索引块,每一索引块包括多个固定大小的索引单元,其中每一索引单元用于存储一条索引信息;以及,顺序将有关各个索引项的索引信息存储到已创建的文件中,其中,将有关同一索引项的索引信息存储在连续的索引块中,并且每一索引块中的多个索引单元只用于存储有关同一索引项的索引信息。由于每一索引块只用于存储有关同一索引项的索引信息,所以在对一个索引块中进行操作时,不会影响其他索引项,于是可以对任何索引块中的索引信息进行在线更新。

    用于跨站点数据分析的方法和系统

    公开(公告)号:CN103793420B

    公开(公告)日:2017-04-12

    申请号:CN201210427841.1

    申请日:2012-10-31

    CPC classification number: H04L67/22

    Abstract: 本发明公开了一种用于配电管理的方法和系统。例如,提供一种跨站点数据分析方法,该方法包括:基于初始用户集中的至少一个用户在第一站点和第二站点中的动作标识所述第一站点与所述第二站点的至少一个动作关联特征,该初始用户集中的用户是第一站点和第二站点的成员;以及基于至少一个动作关联特征确定在第一站点中注册的第一用户名与在第二站点中注册的第二用户名是否属于同一用户。根据本发明的实施例,可以有效地判别不同站点中的相同的用户,即使他们的用户名不同。由此,可以通过在站点之间共享信息而向用户提供定制的信息服务。

    搜索引擎推荐方法及装置
    29.
    发明授权

    公开(公告)号:CN103455507B

    公开(公告)日:2017-03-29

    申请号:CN201210177473.X

    申请日:2012-05-31

    Abstract: 本发明公开了一种用于数据搜索的搜索引擎推荐方法及装置,包括:获取用户输入的查询;针对多个不同的搜索引擎中的每一个,获取所述查询的查询推荐集合,所述查询推荐集合包括至少一个具有推荐部分的查询推荐;基于所述查询推荐集合以及所述查询的背景关联信息确定每一个所述搜索引擎与所述查询的匹配度;根据所述匹配度在所述多个搜索引擎中进行推荐。采用本申请所提供的技术方案,可以推荐更适合的搜索引擎以供用户进行数据查询。

    用于在消息交互环境中跟踪消息话题的方法和设备

    公开(公告)号:CN102651719B

    公开(公告)日:2016-08-31

    申请号:CN201110047636.8

    申请日:2011-02-28

    CPC classification number: H04L12/586 H04L12/588 H04L51/16 H04L51/32

    Abstract: 本发明提供了一种用于在包括多条消息的消息交互环境下通过结合与一消息相关联的关联消息而对该消息所涉及的话题进行跟踪的方法和设备。该方法包含:从所述消息交互环境所包括的多条消息中选取消息;从所述消息交互环境所包括的多条消息中,识别与所选取的消息相关联的关联消息;以及基于所识别的关联消息,将所选取的消息划归一个或多个话题组。本发明的话题跟踪方法和设备能够在诸如微博客的消息交互环境中准确地确定消息之间的相似度,由此进行话题跟踪。

Patent Agency Ranking