信息处理装置和方法以及信息定位装置

    公开(公告)号:CN106802890A

    公开(公告)日:2017-06-06

    申请号:CN201510830867.4

    申请日:2015-11-25

    Inventor: 张波 孟遥 孙俊

    Abstract: 本公开提供了信息处理装置和方法以及信息定位装置。信息处理装置包括:搜索单元,用于搜索与关注对象有关的结构化的网页信息;语义特征获取单元,用于获取能够对搜索到的网页信息进行表征的语义特征,所述语义特征表示所搜索到的网页信息中的、与所述关注对象相关联的内容;以及样式特征获取单元,用于获取能够对搜索到的网页信息进行表征的样式特征,所述样式特征表示所搜索到的网页信息的结构,其中,所述样式特征获取单元被配置为计算搜索到的网页信息的DOM树中的、与给定节点有关的标签名、标识和类名的出现频率,并得到以所述出现频率为权重的样式向量,以作为所述样式特征。

    信息处理方法和信息处理设备

    公开(公告)号:CN103678418B

    公开(公告)日:2017-06-06

    申请号:CN201210362152.7

    申请日:2012-09-25

    Inventor: 缪庆亮 孟遥 于浩

    Abstract: 公开了信息处理方法和信息处理设备,该方法包括:候选语义关键词提取步骤,用于对输入文本进行分词以从文本提取候选语义关键词;权重计算步骤,用于计算提取的候选语义关键词的权重;语义关键词选择步骤,用于基于算出的权重,根据预定规则从提取的候选语义关键词中选择语义关键词;链接关系确定步骤,用于确定选择的语义关键词与预定语义知识库中的概念间的链接关系;及文本语义图构建步骤,用于基于确定的链接关系、语义知识库中的概念间的语义关系及根据预定推理规则确定的语义关键词与语义知识库中其他概念间的关系,构建表示文本中的语义关键词与语义知识库中的概念间的关系的文本语义图。根据本发明,能够高效地进行信息集成、检索和共享。

    标准化标注工具的方法和设备

    公开(公告)号:CN104035916B

    公开(公告)日:2017-05-24

    申请号:CN201310072432.9

    申请日:2013-03-07

    Inventor: 缪庆亮 孟遥 于浩

    Abstract: 本发明公开了标准化标注工具的方法和设备。根据本发明的标准化标注工具的方法包括:选择与待标准化的非标准工具对应的标准工具;对于所述非标准工具的每一个输出标注类,计算其与所述标准工具的每一个输出标注类的相似度,所述输出标注类表明被标注对象所属的类别;和/或对于所述非标准工具的每一个输出标注属性,计算其与所述标准工具的每一个输出标注属性的相似度,所述输出标注属性表明所述被标注对象所具有的属性;以及根据所述输出标注类的相似度和/或所述输出标注属性的相似度,确定所述非标准工具的标记和所述标准工具的标记之间的对应关系。

    信息处理装置及方法
    104.
    发明公开

    公开(公告)号:CN106557528A

    公开(公告)日:2017-04-05

    申请号:CN201510641498.4

    申请日:2015-09-30

    Abstract: 本发明提供了一种信息处理装置及方法。其中,信息处理装置包括:第一获取单元,被配置成获取待识别实体的第一属性特征向量,其中,所述第一属性特征向量至少反映语义数据库的属性中的至少一部分在描述语义数据库中包括的特定类型的实体时的重要性程度;以及类型识别单元,被配置成基于所述第一属性特征向量判定所述待识别实体是否属于所述特定类型。根据本发明实施例的方法和装置,可以自动、准确地判定待识别实体是否属于特定类型/子类型,从而在信息处理过程中大大降低计算量并提高查询结果的准确率。

    实体关系分类装置和实体关系分类方法

    公开(公告)号:CN103678316B

    公开(公告)日:2017-03-01

    申请号:CN201210320607.9

    申请日:2012-08-31

    Inventor: 缪庆亮 孟遥 于浩

    Abstract: 本发明公开了一种实体关系分类装置和实体关系分类方法,所述实体关系分类装置包括特征抽取单元,被配置为抽取输入样本中的实体的特征和实体上下文的特征;分类器,被配置为基于所述特征进行分类,得到以下概率中的至少一部分:所述实体及其特征、所述实体上下文及其特征、各种实体关系的概率,或者前述各项的各种组合的条件概率,其中,所述分类器是基于实体和实体上下文的预定模式构建的;以及实体关系概率计算单元,被配置为基于所得到的各个概率计算在所述实体和所述实体上下文的前提下各种实体关系的概率。

    一种数据推送系统及方法
    106.
    发明授权

    公开(公告)号:CN103294730B

    公开(公告)日:2017-03-01

    申请号:CN201210055854.0

    申请日:2012-03-05

    Inventor: 苏亮 孟遥 于浩

    Abstract: 本申请提供了一种数据推送系统及方法。其中,确定主用户下各个子用户的权重,并且,提取各个子用户的特征;将各个子用户的特征用各个子用户的权重加权,作为主用户的相应特征;根据主用户的特征在待推送数据中确定匹配的推送数据;在主用户的页面上推送所述匹配的推送数据。该数据推送系统及方法,能够实现在微博等SNS系统中进行广告等数据的准确推送。

    利用语义图生成对象之间的关联强度的方法和设备

    公开(公告)号:CN106354728A

    公开(公告)日:2017-01-25

    申请号:CN201510419244.8

    申请日:2015-07-16

    CPC classification number: G06F16/36 G06F16/34

    Abstract: 本发明公开了一种利用语义图生成对象之间的关联强度的方法和设备。该方法包括:按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。

    多词单元提取方法和设备及人工神经网络训练方法和设备

    公开(公告)号:CN103678318B

    公开(公告)日:2016-12-21

    申请号:CN201210320806.X

    申请日:2012-08-31

    Abstract: 本申请公开了一种多词单元提取方法和设备及人工神经网络训练方法和设备。提取多词单元的方法包括:针对将语句进行分词得到的多个分词块中的每个分词块,获取每个分词块中的分词的语言学特征作为特征量;将特征量作为参数输入到人工神经网络中;采用人工神经网络计算每个分词块中的分词是多词单元的一部分的第一可能性和该分词不是多词单元的一部分的第二可能性,并且根据第一和第二可能性判断该分词是否为多词单元的一部分;提取相邻的两个或更多个被判断为多词单元的一部分的分词以形成多词单元;以及获取与当前分词块相邻的先前分词块的判断的结果作为反馈信息,并且将反馈信息也作为当前分词块中的分词的特征量。

    描述短文本的作者的方法和设备

    公开(公告)号:CN106156091A

    公开(公告)日:2016-11-23

    申请号:CN201510151745.2

    申请日:2015-04-01

    Abstract: 本发明公开了一种描述短文本的作者的方法和设备。该描述短文本的作者的方法包括:根据作者的多个短文本,确定作者感兴趣的类别;以及提取作者感兴趣的类别的代表性短文本,作为对作者的描述。根据本发明的方法和设备能够容易地、准确地让读者了解作者的兴趣爱好。

    一种自适应且分布无关的时间序列异常点检测方法

    公开(公告)号:CN105678409A

    公开(公告)日:2016-06-15

    申请号:CN201511029681.5

    申请日:2015-12-31

    CPC classification number: G06Q10/04

    Abstract: 一种自适应且分布无关的时间序列异常点检测方法,涉及信息技术领域,尤其涉及一种自适应且分布无关的时间序列异常点检测方法。本发明为了解决现有时间序列数据中存在未知分布、界限控制难、参数需求多、训练数据少以及‘异常’本身的模糊性的问题。本发明按以下步骤进行:一、异常点的定义;二、时间序列特征化;三、相似度和异常度确定;四、基于统计假设检验的检测;五、增强式模糊化过程。本发明解决了现有技术中时间序列数据存在的一系列技术问题,并取得良好技术效果。本发明可应用于信息技术领域。

Patent Agency Ranking