-
-
公开(公告)号:CN102033880A
公开(公告)日:2011-04-27
申请号:CN200910177315.2
申请日:2009-09-29
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30 , G06F17/3071 , G06F17/30722 , G06F17/30864
Abstract: 提供了一种基于结构化数据集合的标注方法和标注装置,该标注方法包括:基于事件的结构化数据集合,建立所述结构化数据集合中各个节点的分类模型;获取公众针对所述事件的观点;以及利用所生成的分类模型,将所述观点标注到所述结构化数据集合的相应节点。本公开的标注方法和装置能够向用户提供针对每个事件具有良好排列、突出重点的公众观点,并且能够表现出公众观点随着时间的进展。
-
公开(公告)号:CN101901230A
公开(公告)日:2010-12-01
申请号:CN200910141899.8
申请日:2009-05-31
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06Q30/0282 , G06Q30/02
Abstract: 本发明提供一种用户评论处理方法及其系统、信息检索方法及其系统。其中所述用户评论处理方法包括:接收产品或者服务的特征的客观数据以及对产品或者服务的用户评论;从产品或者服务的用户评论中识别与产品或服务的特征相关联的用户评论;识别与产品或服务的特征相关联的用户评论中的情感描述主题;建立情感描述主题与产品或者服务对应的特征的客观数据之间的关联关系,并且计算与客观数据相关联的情感描述主题出现的频度;根据所述关联关系以及与客观数据关联的情感描述主题出现的频度形成情感描述主题与客观数据的关联规则。本发明可以准确和深刻地反映用户情感与产品或者服务的客观数据之间的关联关系和关联规则。
-
-
公开(公告)号:CN101661490A
公开(公告)日:2010-03-03
申请号:CN200810213931.4
申请日:2008-08-28
Applicant: 国际商业机器公司
IPC: G06F17/30
Abstract: 搜索引擎、其客户端及搜索网页的方法。搜索引擎包含查询装置,被配置为检索出满足查询的网页序列;页面摘要提取装置,被配置为提取所述网页序列中至少一个的网页的候选页面摘要;和页面摘要选择装置,被配置为根据与发出所述查询的用户相关的词集选择所述候选页面摘要中的候选页面摘要,作为提供给所述用户的页面摘要。由于不是简单地选择包含查询关键词的文本段来形成页面摘要,而是根据反映用户的信息需求的个性化关键词来从候选页面摘要中选择最终的页面摘要,因而能够在一定程度上满足用户的个性化信息需求。
-
公开(公告)号:CN101620609A
公开(公告)日:2010-01-06
申请号:CN200810127272.2
申请日:2008-06-30
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30448 , G06F17/30566
Abstract: 提供了一种用于存储和访问多租户数据的方法,该方法包括:在一个或多个数据库中建立多个表组,其中每个表组用于存储多个租户中的一组租户的数据;以及响应于接收到来自租户的数据访问请求,访问相应的表组中的租户数据。
-
公开(公告)号:CN101398832A
公开(公告)日:2009-04-01
申请号:CN200710163091.0
申请日:2007-09-30
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30265 , G06F17/30247
Abstract: 本发明提出一种利用人脸检测的图像搜索方法,包括:接收步骤,接收由用户提交的查询;第一搜索步骤,针对所述查询中的查询词,使用图像搜索引擎在图像资源中进行搜索,以获取初始图像集合;检测步骤,在所搜索的初始图像集合的每个图像中检测人脸;第二搜索步骤,在所述初始图像集合中的每个具有人脸的图像的周围文本中搜索所述查询词,判断所述查询词在该周围文本中是否表示人名;返回步骤,向用户返回初始图像集合中具有人脸、且所述查询词在所述周围文本中表示人名的图像。此外,本发明还提出一种利用人脸检测的图像搜索系统。从而实现精简规模、高效率的人像搜索。
-
公开(公告)号:CN100432996C
公开(公告)日:2008-11-12
申请号:CN200410100059.4
申请日:2004-12-07
Applicant: 国际商业机器公司
Abstract: 本发明提供一种提取网页的核心内容的网页核心内容提取系统和方法,该系统接收HTML文档(网页)并从其中提取核心内容,所述系统包括:文本块分析器,用于以HTML标记作为定界符将输入的HTML文档中的每个有用基本结构中的文本片断分段为一个或多个独立的文本块,并将出现在每个有用基本结构中的所有文本块依次连接起来作为输出,其中所述有用基本结构为包含网页核心内容的基本结构;以及文本块检查器,用于从文本块分析器依次输出的所述文本块中去除不含网页的核心内容的文本块并输出余下的文本块作为网页核心内容。通过针对每个文本块确定是否含有广告和导航信息,从而能够精确地确定网页中包括的核心内容。本发明还提高了处理效率。
-
公开(公告)号:CN101136020A
公开(公告)日:2008-03-05
申请号:CN200610128032.5
申请日:2006-08-31
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30592 , G06Q10/06
Abstract: 本发明提供了用于自动从数据资源中提取实体参考数据的系统和方法,其能够以低成本不断从现有数据源(例如,数据仓库、web等)挖掘新的参考数据元组。本发明的系统包括:实体数据解析装置,与数据资源耦接,用于对数据资源中的实体数据进行解析,以获得每个实体数据的内部语义结构,并从所述内部语义结构产生特征集;以及数据提取装置,用于根据所述实体数据解析装置产生的特征集提取参考实体数据。根据本发明的优选实施方式,还提供存留组件,以对从数据提取装置输出的候选参考数据种子进行优化。
-
公开(公告)号:CN101136018A
公开(公告)日:2008-03-05
申请号:CN200610126579.1
申请日:2006-08-29
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明提供了一种为检索对多个文档进行预处理及呈现检索结果的方法和装置以及包括这些装置的搜索文档的系统。其中该检索结果包括至少一个候选的文档,并且该至少一个文档的每一个被指定了一个表示其内容的树结构,该树结构包括至少一个节点,上述呈现检索结果的方法包括:呈现该检索结果中上述至少一个候选文档对应的树结构的至少一部分。
-
-
-
-
-
-
-
-
-