-
公开(公告)号:CN101661490B
公开(公告)日:2013-01-02
申请号:CN200810213931.4
申请日:2008-08-28
Applicant: 国际商业机器公司
IPC: G06F17/30
Abstract: 搜索引擎、其客户端及搜索网页的方法。搜索引擎包含查询装置,被配置为检索出满足查询的网页序列;页面摘要提取装置,被配置为提取所述网页序列中至少一个的网页的候选页面摘要;和页面摘要选择装置,被配置为根据与发出所述查询的用户相关的词集选择所述候选页面摘要中的候选页面摘要,作为提供给所述用户的页面摘要。由于不是简单地选择包含查询关键词的文本段来形成页面摘要,而是根据反映用户的信息需求的个性化关键词来从候选页面摘要中选择最终的页面摘要,因而能够在一定程度上满足用户的个性化信息需求。
-
公开(公告)号:CN102622372A
公开(公告)日:2012-08-01
申请号:CN201110033804.8
申请日:2011-01-31
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: H04W4/14 , G06F17/30722
Abstract: 本发明公开一种推荐短消息接收人的方法和装置,其中方法包括步骤:解析用户的历史短消息以产生与联系人相关联的数据;利用所述数据构建语义关联库;识别所述用户的新短消息文本中的关键对象;利用所述语义关联库分析所述关键对象与联系人的关联性;根据关联性的强度向所述用户推荐短消息接收人。
-
公开(公告)号:CN101499062B
公开(公告)日:2012-07-04
申请号:CN200810004920.5
申请日:2008-01-29
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06Q30/02 , Y10S707/99936
Abstract: 本发明提出一种用于收集实体别名的方法,包括:利用Web搜索引擎获得与用户输入的实体相关联的Web对象;从社会化标签网站获得所述Web对象的社会化标签,作为所述实体的候选别名;和对候选别名进行求精,从而获得所述实体的别名的集合。本发明还提出一种用于收集实体别名的设备,包括:用于利用Web搜索引擎获得与用户输入的实体相关联的Web对象的装置;用于从社会化标签网站获得所述Web对象的社会化标签作为所述实体的候选别名的装置;和用于对候选别名进行求精、从而获得所述实体的别名的集合的装置。根据本发明,可以针对任何给定的实体,通过获得大量相关Web对象及其社会化标签来自动和迅速地收集该实体的别名。
-
公开(公告)号:CN102262632A
公开(公告)日:2011-11-30
申请号:CN201010188623.8
申请日:2010-05-28
Applicant: 国际商业机器公司
CPC classification number: G06F17/278 , G06F17/2785 , G06Q10/10 , G06Q30/0241
Abstract: 本发明总体上利用对现有的对象共指技术的扩展实现自动的、更全面的、准确的、有效的文本数据的分析和处理。具体而言,本发明提供了一种文本处理方法,包括:获取待处理的文本;从所述文本中提取主体词和与所述主体词对应的实体词;对所述主体词进行分组;根据分组后的主体词确定指向同一关注对象的实体词;以及对指向同一关注对象的实体词生成处理策略。本发明还提供了实现这种方法的系统。本发明可以用于挖掘有关某一实体的大量的评论数据,本发明还可以用于推荐文章中插入嵌入式广告的插入位置。
-
公开(公告)号:CN102033881A
公开(公告)日:2011-04-27
申请号:CN200910177336.4
申请日:2009-09-30
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06Q30/0277 , G06F17/30908 , G06Q30/02
Abstract: 本发明涉及网页识别技术,尤其涉及识别网页中的广告的技术。本发明提供了一种用于识别网页中的广告的方法,包括:接收种子网页;通过分析所述种子网页的源代码得到所述种子网页的节点特征;根据预设的规则以及所述节点特征,确定所述种子网页中的种子广告;通过分析所述种子广告的链接得到所述种子广告的链接模式;以及利用所述链接模式,识别所述种子网页所在的网站中除了所述种子广告外的其它广告。
-
-
-
-