数据分析系统中搜索查询的验证

    公开(公告)号:CN110637293A

    公开(公告)日:2019-12-31

    申请号:CN201880031919.3

    申请日:2018-05-30

    Abstract: 公开了一种用于检查搜索查询的计算机实现的方法,所述搜索查询用于在事件序列分析系统中从记录的集合检索信息。该方法包括接收搜索查询,该搜索查询包括多个谓词以及一个或多个约束,每个约束与复数谓词相关联,其中每个谓词被指定为肯定或否定,并且多个谓词与一个或多个约束一起形成逻辑图。该方法还包括从所述图中生成子图,该子图包括在搜索查询的多个谓词中被指定为肯定的一个或多个谓词。该方法还包括确定子图是否具有复数组件,以及响应于确定子图具有复数组件,使搜索查询无效。

    字符串处理方法以及设备

    公开(公告)号:CN1987848A

    公开(公告)日:2007-06-27

    申请号:CN200610148402.1

    申请日:2006-11-14

    CPC classification number: G06F17/276

    Abstract: 公开了字符串处理方法以及设备,以提供对文档进行掩码的有效的方法。为了解决上述问题,作为第一个方面,说明了一种方法,包括下列步骤:将文档中的一个字符串解析为多个部分字符串;对于每一个部分字符串,计算包含部分字符串的出现频率的分数;向用户呈现部分字符串和分数;确定用户选择了哪些部分字符串;将所选择的部分字符串存储为安全的部分字符串列表;以及用预先确定的替换字符串替换部分字符串,但安全的部分字符串列表中存在的部分字符串除外。

    用于检测社交媒体中的趋势的方法、计算机程序和计算机

    公开(公告)号:CN104011718A

    公开(公告)日:2014-08-27

    申请号:CN201280062968.6

    申请日:2012-11-16

    Abstract: 为了更精确地并在较早的阶段检测社交媒体中的突发信息(以不同于正常的规模散布的信息)。提出一种方法,其中在社交媒体中,从由多个用户传送的多个消息选择特定消息组。这里,在消息中包括其中由一个用户传送的消息由另一用户引用和重新传送的消息。本方法具有下列步骤:对于其中由一个用户传送的消息由另一用户引用和重新传送的消息,执行进一步重新传送的可能性的初级评估;识别已经传送了其中初级评估结果高于预定第一阈值的消息的一个用户;基于其中由一个用户传送的消息已被引用和重新传送的消息组,识别与已重新传送的消息组相似的消息组;执行将进一步重新传送相似消息组的可能性的次级评估;以及选择其中次级评估结果高于预定第二阈值的消息组。

    用于从具有文本段的文档中提取术语的系统

    公开(公告)号:CN102144229A

    公开(公告)日:2011-08-03

    申请号:CN200980134535.5

    申请日:2009-07-30

    CPC classification number: G06F17/28 G06F17/277 G06F17/30719

    Abstract: 本发明提供一种用于从具有文本段的文档中提取术语的系统,其按有助于理解文档概要或理解内容的观点来对该提取出的术语进行分类,并将该分类的术语提示给使用者。计算机系统使用第一文本处理信息,从具有文本段的文档数据中提取名词性词语,使用第二文本处理信息,从该文档数据或包含以与该文档数据相同的语言记载的文本数据的语料库中提取关于该名词性词语的术语候选,为了决定该名词性词语和该术语候选是属于多个种类中的哪一种类的名词性词语,而利用第三文本处理信息选择对多个种类中的哪个种类给予权重,对该名词性词语和该术语候选分别就上述所选择的种类给予权重,根据上述给予的权重,决定该名词性词语和该术语候选所属的该种类;与所决定的种类关联而输出该名词性词语和该术语候选。

    数据分析系统中搜索查询的验证

    公开(公告)号:CN110637293B

    公开(公告)日:2023-04-04

    申请号:CN201880031919.3

    申请日:2018-05-30

    Abstract: 公开了一种用于检查搜索查询的计算机实现的方法,所述搜索查询用于在事件序列分析系统中从记录的集合检索信息。该方法包括接收搜索查询,该搜索查询包括多个谓词以及一个或多个约束,每个约束与复数谓词相关联,其中每个谓词被指定为肯定或否定,并且多个谓词与一个或多个约束一起形成逻辑图。该方法还包括从所述图中生成子图,该子图包括在搜索查询的多个谓词中被指定为肯定的一个或多个谓词。该方法还包括确定子图是否具有复数组件,以及响应于确定子图具有复数组件,使搜索查询无效。

    用于选择识别的消息组的方法、计算机可读介质和计算机

    公开(公告)号:CN104011718B

    公开(公告)日:2018-01-23

    申请号:CN201280062968.6

    申请日:2012-11-16

    Abstract: [问题]为了更精确地并在较早的阶段检测社交媒体中的突发信息(以不同于正常的规模散布的信息)。[解决方案]提出一种方法,其中在社交媒体中,从由多个用户传送的多个消息选择特定消息组。这里,在消息中包括其中由一个用户传送的消息由另一用户引用和重新传送的消息。本方法具有下列步骤:对于其中由一个用户传送的消息由另一用户引用和重新传送的消息,执行进一步重新传送的可能性的初级评估;识别已经传送了其中初级评估结果高于预定第一阈值的消息的一个用户;基于其中由一个用户传送的消息已被引用和重新传送的消息组,识别与已重新传送的消息组相似的消息组;执行将进一步重新传送相似消息组的可能性的次级评估;以及选择其中次级评估结果高于预定第二阈值的消息组。

    用于从具有文本段的文档中提取术语的系统

    公开(公告)号:CN102144229B

    公开(公告)日:2013-09-04

    申请号:CN200980134535.5

    申请日:2009-07-30

    CPC classification number: G06F17/28 G06F17/277 G06F17/30719

    Abstract: 本发明提供一种用于从具有文本段的文档中提取术语的系统,其按有助于理解文档概要或理解内容的观点来对该提取出的术语进行分类,并将该分类的术语提示给使用者。计算机系统使用第一文本处理信息,从具有文本段的文档数据中提取名词性词语,使用第二文本处理信息,从该文档数据或包含以与该文档数据相同的语言记载的文本数据的语料库中提取关于该名词性词语的术语候选,为了决定该名词性词语和该术语候选是属于多个种类中的哪一种类的名词性词语,而利用第三文本处理信息选择对多个种类中的哪个种类给予权重,对该名词性词语和该术语候选分别就上述所选择的种类给予权重,根据上述给予的权重,决定该名词性词语和该术语候选所属的该种类;与所决定的种类关联而输出该名词性词语和该术语候选。

Patent Agency Ranking