信息处理方法和信息处理设备

    公开(公告)号:CN103678418B

    公开(公告)日:2017-06-06

    申请号:CN201210362152.7

    申请日:2012-09-25

    Inventor: 缪庆亮 孟遥 于浩

    Abstract: 公开了信息处理方法和信息处理设备,该方法包括:候选语义关键词提取步骤,用于对输入文本进行分词以从文本提取候选语义关键词;权重计算步骤,用于计算提取的候选语义关键词的权重;语义关键词选择步骤,用于基于算出的权重,根据预定规则从提取的候选语义关键词中选择语义关键词;链接关系确定步骤,用于确定选择的语义关键词与预定语义知识库中的概念间的链接关系;及文本语义图构建步骤,用于基于确定的链接关系、语义知识库中的概念间的语义关系及根据预定推理规则确定的语义关键词与语义知识库中其他概念间的关系,构建表示文本中的语义关键词与语义知识库中的概念间的关系的文本语义图。根据本发明,能够高效地进行信息集成、检索和共享。

    标准化标注工具的方法和设备

    公开(公告)号:CN104035916B

    公开(公告)日:2017-05-24

    申请号:CN201310072432.9

    申请日:2013-03-07

    Inventor: 缪庆亮 孟遥 于浩

    Abstract: 本发明公开了标准化标注工具的方法和设备。根据本发明的标准化标注工具的方法包括:选择与待标准化的非标准工具对应的标准工具;对于所述非标准工具的每一个输出标注类,计算其与所述标准工具的每一个输出标注类的相似度,所述输出标注类表明被标注对象所属的类别;和/或对于所述非标准工具的每一个输出标注属性,计算其与所述标准工具的每一个输出标注属性的相似度,所述输出标注属性表明所述被标注对象所具有的属性;以及根据所述输出标注类的相似度和/或所述输出标注属性的相似度,确定所述非标准工具的标记和所述标准工具的标记之间的对应关系。

    信息处理装置及方法
    13.
    发明公开

    公开(公告)号:CN106557528A

    公开(公告)日:2017-04-05

    申请号:CN201510641498.4

    申请日:2015-09-30

    Abstract: 本发明提供了一种信息处理装置及方法。其中,信息处理装置包括:第一获取单元,被配置成获取待识别实体的第一属性特征向量,其中,所述第一属性特征向量至少反映语义数据库的属性中的至少一部分在描述语义数据库中包括的特定类型的实体时的重要性程度;以及类型识别单元,被配置成基于所述第一属性特征向量判定所述待识别实体是否属于所述特定类型。根据本发明实施例的方法和装置,可以自动、准确地判定待识别实体是否属于特定类型/子类型,从而在信息处理过程中大大降低计算量并提高查询结果的准确率。

    实体关系分类装置和实体关系分类方法

    公开(公告)号:CN103678316B

    公开(公告)日:2017-03-01

    申请号:CN201210320607.9

    申请日:2012-08-31

    Inventor: 缪庆亮 孟遥 于浩

    Abstract: 本发明公开了一种实体关系分类装置和实体关系分类方法,所述实体关系分类装置包括特征抽取单元,被配置为抽取输入样本中的实体的特征和实体上下文的特征;分类器,被配置为基于所述特征进行分类,得到以下概率中的至少一部分:所述实体及其特征、所述实体上下文及其特征、各种实体关系的概率,或者前述各项的各种组合的条件概率,其中,所述分类器是基于实体和实体上下文的预定模式构建的;以及实体关系概率计算单元,被配置为基于所得到的各个概率计算在所述实体和所述实体上下文的前提下各种实体关系的概率。

    利用语义图生成对象之间的关联强度的方法和设备

    公开(公告)号:CN106354728A

    公开(公告)日:2017-01-25

    申请号:CN201510419244.8

    申请日:2015-07-16

    CPC classification number: G06F16/36 G06F16/34

    Abstract: 本发明公开了一种利用语义图生成对象之间的关联强度的方法和设备。该方法包括:按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。

    在文本中确定语义关键词的方法和装置

    公开(公告)号:CN105138523A

    公开(公告)日:2015-12-09

    申请号:CN201410239148.0

    申请日:2014-05-30

    Inventor: 缪庆亮 孟遥

    Abstract: 本发明涉及一种在文本中确定语义关键词的方法和装置。该方法包括:在网络资源中进行挖掘,获得词或词组与词或词组作为语义关键词的概率的二元组集合;在文本中抽取样本集合,基于所获得的二元组集合在样本集合中获取正样本集合;将样本集合去除正样本集合后的集合中的每一个样本与正样本集合中的正样本进行比较,根据比较的相似度结果来获得负样本集合;从样本集合去除正样本集合后的集合中再去除负样本集合来获得未标注样本集合;基于正样本集合、负样本集合和未标注样本集合,利用分类算法来迭代训练语义关键词识别模型,基于语义关键词识别模型来获得语义关键词集合和/或非语义关键词集合。

    一种实体链接方法及装置
    17.
    发明公开

    公开(公告)号:CN104462126A

    公开(公告)日:2015-03-25

    申请号:CN201310432213.7

    申请日:2013-09-22

    Inventor: 缪庆亮 孟遥

    CPC classification number: G06F17/30705

    Abstract: 本发明提供一种实体链接方法及装置,该方法包括:获取实体提及的潜在链接实体;扩展所述实体提及所在的原始文本得到所述实体提及对应的第一文本,计算所述第一文本与所述潜在链接实体对应的第二文本的文本相似度;根据所述文本相似度计算所述潜在链接实体与所述实体提及的匹配度;以及将所述实体提及链接到具有满足预设条件的匹配度的潜在链接实体。本发明中,对实体提及所在的原始文本进行扩展,利用扩展后的文本筛选潜在链接实体,从而能够提高链接实体的准确性。

    信息处理方法和信息处理设备

    公开(公告)号:CN103678418A

    公开(公告)日:2014-03-26

    申请号:CN201210362152.7

    申请日:2012-09-25

    Inventor: 缪庆亮 孟遥 于浩

    CPC classification number: G06F17/2765 G06F17/2785

    Abstract: 公开了信息处理方法和信息处理设备,该方法包括:候选语义关键词提取步骤,用于对输入文本进行分词以从文本提取候选语义关键词;权重计算步骤,用于计算提取的候选语义关键词的权重;语义关键词选择步骤,用于基于算出的权重,根据预定规则从提取的候选语义关键词中选择语义关键词;链接关系确定步骤,用于确定选择的语义关键词与预定语义知识库中的概念间的链接关系;及文本语义图构建步骤,用于基于确定的链接关系、语义知识库中的概念间的语义关系及根据预定推理规则确定的语义关键词与语义知识库中其他概念间的关系,构建表示文本中的语义关键词与语义知识库中的概念间的关系的文本语义图。根据本发明,能够高效地进行信息集成、检索和共享。

    对实体进行语义化的信息处理装置和信息处理方法

    公开(公告)号:CN108170689A

    公开(公告)日:2018-06-15

    申请号:CN201611114803.5

    申请日:2016-12-07

    Abstract: 本申请公开了一种用于对实体进行语义化的信息处理装置和信息处理方法,该信息处理装置包括:关联度计算单元,被配置为计算实体与语义之间的关联度;排序单元,被配置为根据关联度计算单元计算的关联度以及基于实体的上下文的排序权重,对语义进行排序;以及更新单元,被配置为根据用户基于排序对与实体对应的语义的选择,对排序单元在排序中使用的排序权重进行更新。

Patent Agency Ranking