-
公开(公告)号:CN110637293A
公开(公告)日:2019-12-31
申请号:CN201880031919.3
申请日:2018-05-30
Applicant: 国际商业机器公司
IPC: G06F16/2458 , G06F16/248
Abstract: 公开了一种用于检查搜索查询的计算机实现的方法,所述搜索查询用于在事件序列分析系统中从记录的集合检索信息。该方法包括接收搜索查询,该搜索查询包括多个谓词以及一个或多个约束,每个约束与复数谓词相关联,其中每个谓词被指定为肯定或否定,并且多个谓词与一个或多个约束一起形成逻辑图。该方法还包括从所述图中生成子图,该子图包括在搜索查询的多个谓词中被指定为肯定的一个或多个谓词。该方法还包括确定子图是否具有复数组件,以及响应于确定子图具有复数组件,使搜索查询无效。
-
公开(公告)号:CN1987848A
公开(公告)日:2007-06-27
申请号:CN200610148402.1
申请日:2006-11-14
Applicant: 国际商业机器公司
CPC classification number: G06F17/276
Abstract: 公开了字符串处理方法以及设备,以提供对文档进行掩码的有效的方法。为了解决上述问题,作为第一个方面,说明了一种方法,包括下列步骤:将文档中的一个字符串解析为多个部分字符串;对于每一个部分字符串,计算包含部分字符串的出现频率的分数;向用户呈现部分字符串和分数;确定用户选择了哪些部分字符串;将所选择的部分字符串存储为安全的部分字符串列表;以及用预先确定的替换字符串替换部分字符串,但安全的部分字符串列表中存在的部分字符串除外。
-
公开(公告)号:CN104011718A
公开(公告)日:2014-08-27
申请号:CN201280062968.6
申请日:2012-11-16
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: H04L51/32 , G06F17/30702 , G06F17/30861 , G06Q50/01 , H04L51/34
Abstract: 为了更精确地并在较早的阶段检测社交媒体中的突发信息(以不同于正常的规模散布的信息)。提出一种方法,其中在社交媒体中,从由多个用户传送的多个消息选择特定消息组。这里,在消息中包括其中由一个用户传送的消息由另一用户引用和重新传送的消息。本方法具有下列步骤:对于其中由一个用户传送的消息由另一用户引用和重新传送的消息,执行进一步重新传送的可能性的初级评估;识别已经传送了其中初级评估结果高于预定第一阈值的消息的一个用户;基于其中由一个用户传送的消息已被引用和重新传送的消息组,识别与已重新传送的消息组相似的消息组;执行将进一步重新传送相似消息组的可能性的次级评估;以及选择其中次级评估结果高于预定第二阈值的消息组。
-
公开(公告)号:CN102144229A
公开(公告)日:2011-08-03
申请号:CN200980134535.5
申请日:2009-07-30
Applicant: 国际商业机器公司
CPC classification number: G06F17/28 , G06F17/277 , G06F17/30719
Abstract: 本发明提供一种用于从具有文本段的文档中提取术语的系统,其按有助于理解文档概要或理解内容的观点来对该提取出的术语进行分类,并将该分类的术语提示给使用者。计算机系统使用第一文本处理信息,从具有文本段的文档数据中提取名词性词语,使用第二文本处理信息,从该文档数据或包含以与该文档数据相同的语言记载的文本数据的语料库中提取关于该名词性词语的术语候选,为了决定该名词性词语和该术语候选是属于多个种类中的哪一种类的名词性词语,而利用第三文本处理信息选择对多个种类中的哪个种类给予权重,对该名词性词语和该术语候选分别就上述所选择的种类给予权重,根据上述给予的权重,决定该名词性词语和该术语候选所属的该种类;与所决定的种类关联而输出该名词性词语和该术语候选。
-
公开(公告)号:CN110637293B
公开(公告)日:2023-04-04
申请号:CN201880031919.3
申请日:2018-05-30
Applicant: 国际商业机器公司
IPC: G06F16/2458 , G06F16/248
Abstract: 公开了一种用于检查搜索查询的计算机实现的方法,所述搜索查询用于在事件序列分析系统中从记录的集合检索信息。该方法包括接收搜索查询,该搜索查询包括多个谓词以及一个或多个约束,每个约束与复数谓词相关联,其中每个谓词被指定为肯定或否定,并且多个谓词与一个或多个约束一起形成逻辑图。该方法还包括从所述图中生成子图,该子图包括在搜索查询的多个谓词中被指定为肯定的一个或多个谓词。该方法还包括确定子图是否具有复数组件,以及响应于确定子图具有复数组件,使搜索查询无效。
-
公开(公告)号:CN103999082B
公开(公告)日:2017-09-12
申请号:CN201280062988.3
申请日:2012-11-22
Applicant: 国际商业机器公司
CPC classification number: G06F17/30705 , G06F17/30 , G06F17/30554 , G06F17/30598 , G06F17/30867 , G06F17/30943 , G06F17/30991 , G06Q50/01 , H04L51/32 , H04L67/306
Abstract: 本发明的目的是更精确地检测社交媒体中的社区。本发明是一种在其中多个用户的每一个传送消息的社交网络中使用计算机将多个用户聚类的方法。所述方法具有下列步骤:基于消息之间关系,从多个用户提取多个部分社区;基于属于一个部分社区的用户与属于多个部分社区中的其他部分社区的用户之间关系,计算指示两个部分社区之间相似度程度的第一相似度程度;在第一相似度程度高于预定义的第一阈值的条件下基于由属于两个部分社区的用户传送的消息中的用语,计算指示两个部分社区之间相似度程度的第二相似度程度;以及在第二相似度程度高于预定义的第二阈值的条件下整合两个部分社区以生成整合社区。
-
公开(公告)号:CN104011718B
公开(公告)日:2018-01-23
申请号:CN201280062968.6
申请日:2012-11-16
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: H04L51/32 , G06F17/30702 , G06F17/30861 , G06Q50/01 , H04L51/34
Abstract: [问题]为了更精确地并在较早的阶段检测社交媒体中的突发信息(以不同于正常的规模散布的信息)。[解决方案]提出一种方法,其中在社交媒体中,从由多个用户传送的多个消息选择特定消息组。这里,在消息中包括其中由一个用户传送的消息由另一用户引用和重新传送的消息。本方法具有下列步骤:对于其中由一个用户传送的消息由另一用户引用和重新传送的消息,执行进一步重新传送的可能性的初级评估;识别已经传送了其中初级评估结果高于预定第一阈值的消息的一个用户;基于其中由一个用户传送的消息已被引用和重新传送的消息组,识别与已重新传送的消息组相似的消息组;执行将进一步重新传送相似消息组的可能性的次级评估;以及选择其中次级评估结果高于预定第二阈值的消息组。
-
公开(公告)号:CN103999082A
公开(公告)日:2014-08-20
申请号:CN201280062988.3
申请日:2012-11-22
Applicant: 国际商业机器公司
CPC classification number: G06F17/30705 , G06F17/30 , G06F17/30554 , G06F17/30598 , G06F17/30867 , G06F17/30943 , G06F17/30991 , G06Q50/01 , H04L51/32 , H04L67/306
Abstract: 本发明的目的是更精确地检测社交媒体中的社区。本发明是一种在其中多个用户的每一个传送消息的社交网络中使用计算机将多个用户聚类的方法。所述方法具有下列步骤:基于消息之间关系,从多个用户提取多个部分社区;基于属于一个部分社区的用户与属于多个部分社区中的其他部分社区的用户之间关系,计算指示两个部分社区之间相似度程度的第一相似度程度;在第一相似度程度高于预定义的第一阈值的条件下基于由属于两个部分社区的用户传送的消息中的用语,计算指示两个部分社区之间相似度程度的第二相似度程度;以及在第二相似度程度高于预定义的第二阈值的条件下整合两个部分社区以生成整合社区。
-
公开(公告)号:CN102144229B
公开(公告)日:2013-09-04
申请号:CN200980134535.5
申请日:2009-07-30
Applicant: 国际商业机器公司
CPC classification number: G06F17/28 , G06F17/277 , G06F17/30719
Abstract: 本发明提供一种用于从具有文本段的文档中提取术语的系统,其按有助于理解文档概要或理解内容的观点来对该提取出的术语进行分类,并将该分类的术语提示给使用者。计算机系统使用第一文本处理信息,从具有文本段的文档数据中提取名词性词语,使用第二文本处理信息,从该文档数据或包含以与该文档数据相同的语言记载的文本数据的语料库中提取关于该名词性词语的术语候选,为了决定该名词性词语和该术语候选是属于多个种类中的哪一种类的名词性词语,而利用第三文本处理信息选择对多个种类中的哪个种类给予权重,对该名词性词语和该术语候选分别就上述所选择的种类给予权重,根据上述给予的权重,决定该名词性词语和该术语候选所属的该种类;与所决定的种类关联而输出该名词性词语和该术语候选。
-
-
-
-
-
-
-
-