对象分类方法和对象分类设备

    公开(公告)号:CN107766869A

    公开(公告)日:2018-03-06

    申请号:CN201610703646.5

    申请日:2016-08-22

    Abstract: 本发明公开了一种对象分类方法和对象分类设备。该对象分类方法包括:将表征对象的项目序列转换为对象对应的层次结构;比较对象对应的层次结构与已知类型的层次结构的相似度;以及将相似度最大的层次结构的已知类型确定为对象的类型;其中,所述已知类型的层次结构和/或所述对象对应的层次结构中的节点被泛化,并且层次结构中越深层次中的节点被泛化的数量越多。

    对级联样式表的规则集进行优化的方法和装置

    公开(公告)号:CN106293785A

    公开(公告)日:2017-01-04

    申请号:CN201510262400.4

    申请日:2015-05-21

    Abstract: 本发明涉及对级联样式表的规则集进行优化的方法和装置。该方法包括:对级联样式表的规则集中的规则的语法进行归一化以消除数据在格式上的不一致;用规则和其对应的特征构成多值关系二维表,多值关系二维表的每一行为级联样式表的规则集中的规则,列为该规则所对应的特征;将多值关系二维表转换为形式背景表,形式背景表为单值关系二维表;以及基于形式背景表生成规则之间的从属关系。根据本发明的方法和装置,能够以可视化的形式展示规则及规则间的从属关系,从而提高CSS代码的灵活性和可重用性,并且提高CSS代码的开发质量。

    网页处理装置和网页处理方法

    公开(公告)号:CN106156143A

    公开(公告)日:2016-11-23

    申请号:CN201510172386.9

    申请日:2015-04-13

    Abstract: 本发明实施例提供一种网页处理装置和网页处理方法,用于在实体网页中嵌入资源描述框架属性(RDFa),该装置包括:第一识别单元,其用于识别网页的实体类型,所述实体类型对应有至少一个RDFa;第一划分单元,其基于所述网页的视觉结构以及所述实体类型,将所述网页划分为至少一个语义片段;第一确定单元,根据预先确定的语义片段与RDFa的对应关系,确定所述网页中每个语义片段所对应的所述实体类型中的RDFa,其中,所述对应关系是基于网页检索所获得的训练网页而确定的;以及嵌入单元,其用于在所述网页的每个语义片段中嵌入对应的RDFa。根据本发明实施例,无需对训练网页进行预先的人工标注,从而节省时间和人力,并且具有良好的扩展性。

    多数据源的信息处理装置、服务器及方法

    公开(公告)号:CN105335378A

    公开(公告)日:2016-02-17

    申请号:CN201410291263.2

    申请日:2014-06-25

    Abstract: 本发明实施例提供一种多数据源的信息处理装置、服务器及方法,该装置包括:第一判定单元,用于对至少两个数据源中的信息进行同一实体的判定;链接单元,用于将至少两个数据源中的实体链接到预先设定的外部资源中;第一扩展单元,用于根据外部资源中的信息对实体的属性进行扩展;第二判定单元,用于判断属性扩展后的信息是否满足预先设定的条件,当不满足预先设定的条件时,将属性扩展后的信息用于进行所述同一实体的判定,当满足预先设定的条件时,将属性扩展后的信息输出。通过对同一实体进行判定以及链接外部资源进行扩展属性,并且以迭代的方式进行上述判定和链接,能够有效的进行多数据源的信息整合,提高信息的准确性和全面性。

    从文本中挖掘语义关键词的方法和设备

    公开(公告)号:CN104239300A

    公开(公告)日:2014-12-24

    申请号:CN201310223884.2

    申请日:2013-06-06

    Inventor: 缪庆亮 孟遥 于浩

    CPC classification number: G06F16/3334

    Abstract: 本发明公开了从文本中挖掘语义关键词的方法和设备。根据本发明的方法包括:在文本中搜索已知词,以得到多个候选关键词;根据所述已知词的参考概率和/或上下文,计算所述多个候选关键词的候选概率,所述参考概率表明所述已知词作为锚文本的可能性,所述候选概率表明所述候选关键词作为语义关键词的可能性;以及根据所述多个候选关键词的候选概率,确定所述多个候选关键词是否为所述文本的语义关键词。

    用于评价文本的情感度的方法和设备

    公开(公告)号:CN103885933A

    公开(公告)日:2014-06-25

    申请号:CN201210564243.9

    申请日:2012-12-21

    Inventor: 缪庆亮 孟遥 于浩

    Abstract: 本发明公开了一种用于评价文本的情感度的方法和设备。所述用于评价文本的情感度的方法包括:从待评价的文本中抽取目标词和观点词;在包括有目标词簇与观点词之间的情感关系的情感语义图中,搜索与所抽取的目标词对应的或者在语义上最相近的目标词簇,搜索与所述目标词簇相关联的所述观点词;根据所述情感语义图中的所述目标词簇与所述观点词之间的情感强度和情感极性,计算所述待评价的文本的情感度。

    实体关系分类装置和实体关系分类方法

    公开(公告)号:CN103678316A

    公开(公告)日:2014-03-26

    申请号:CN201210320607.9

    申请日:2012-08-31

    Inventor: 缪庆亮 孟遥 于浩

    CPC classification number: G06F16/951 G06F17/278

    Abstract: 本发明公开了一种实体关系分类装置和实体关系分类方法,所述实体关系分类装置包括特征抽取单元,被配置为抽取输入样本中的实体的特征和实体上下文的特征;分类器,被配置为基于所述特征进行分类,得到以下概率中的至少一部分:所述实体及其特征、所述实体上下文及其特征、各种实体关系的概率,或者前述各项的各种组合的条件概率,其中,所述分类器是基于实体和实体上下文的预定模式构建的;以及实体关系概率计算单元,被配置为基于所得到的各个概率计算在所述实体和所述实体上下文的前提下各种实体关系的概率。

    地名消岐方法和地名消岐装置

    公开(公告)号:CN108572960A

    公开(公告)日:2018-09-25

    申请号:CN201710134401.X

    申请日:2017-03-08

    Inventor: 房璐 缪庆亮 孟遥

    Abstract: 本发明公开了一种地名消岐方法和地名消岐装置。根据一个具体实施示例的地名消岐方法包括:从文本中提取待消岐地名和所述待消岐地名的上下文;从关联开放数据中检索与所述待消岐地名相关的候选地名实体;以及根据所述上下文与候选地名实体的相似度、所述待消岐地名指向候选地名实体的相对重要性、以及所述上下文与候选地名实体的属性值中所包含的关联实体之间的匹配程度中的至少一个从所述候选地名实体中选择待消岐地名实际所指的地名实体。

    表格重构装置和方法
    39.
    发明授权

    公开(公告)号:CN105573971B

    公开(公告)日:2018-09-25

    申请号:CN201410532186.5

    申请日:2014-10-10

    Inventor: 缪庆亮 孟遥

    Abstract: 本发明涉及一种表格重构装置和方法。该装置包括:列属性确定单元,被配置成确定表格中每一列的属性;描述对象确定单元,被配置成通过将所确定的每一列的属性与语义知识库链接来确定表格中的描述对象;描述对象相关属性确定单元,被配置成在语义知识库中确定每个描述对象的属性集合,计算表格中每一列的属性与属性集合中的每个属性的第一相似度来确定表格中与描述对象相关的属性;以及表格重构单元,被配置成使用描述对象和与描述对象相关的属性对表格进行重构。根据本发明的表格重构装置和方法,能够将结构复杂、字段重叠、包括多个描述对象和属性的表格重构成结构简单、描述对象单一的单一描述对象表格。

    缩简词的消歧方法和消歧设备

    公开(公告)号:CN108170662A

    公开(公告)日:2018-06-15

    申请号:CN201611115210.0

    申请日:2016-12-07

    Abstract: 本发明公开了一种缩简词的消歧方法和消歧设备。该消歧方法包括:针对待处理文本中的缩简词,查找共现语义知识库中与该缩简词对应的全称实体;在查找到多个全称实体的情况下,针对每一个全称实体,检索待处理文本中出现的、共现语义知识库中与该全称实体存在关联关系的参考实体;基于参考实体与该全称实体之间的共现支持概率TF‑IDF,计算该全称实体的共现概率;基于共现概率,选择多个全称实体之一作为与该缩简词对应的全称实体;其中,所述TF‑IDF等于参考实体与该全称实体的共现次数TF和参考实体与该全称实体的逆向文件频率IDF之积。

Patent Agency Ranking