对实体词的语义关系进行分类的方法、装置和电子设备

    公开(公告)号:CN108021544B

    公开(公告)日:2021-07-06

    申请号:CN201610929103.5

    申请日:2016-10-31

    Inventor: 张姝 杨铭 孙俊

    Abstract: 本申请实施例提供一种对文本序列中实体词的语义关系进行分类的方法、装置和电子设备,该装置包括:第一获得单元,其用于将文本序列中的每个词用词向量表示,以构建第一矩阵;第二获得单元,其利用深度学习模型对所述第一矩阵进行处理,以获得第二矩阵;第三获得单元,其利用2个以上的注意力模型,对所述第二矩阵进行处理,以确定所述文本序列中词的受关注程度,并基于所述受关注程度获得所述文本序列的第三矩阵;分类单元,其至少根据所述文本序列的所述第三矩阵,以及预先存储的分类模型,来确定所述文本序列中的实体词之间的语义关系。根据本实施例,能够提高分类效率。

    信息处理装置和信息处理方法

    公开(公告)号:CN113032553A

    公开(公告)日:2021-06-25

    申请号:CN201911250452.4

    申请日:2019-12-09

    Inventor: 高玥 张姝 孙俊

    Abstract: 本公开涉及信息处理方法和信息处理装置。根据本公开的信息处理装置包括:提取单元,被配置成将多路数据转换为张量数据并且提取所述张量数据的核心张量;聚类单元,被配置成对所述核心张量执行聚类处理;贡献度计算单元,被配置成针对所述核心张量的每个簇,计算所述张量数据的各分量数据的贡献度;以及降采样单元,被配置成基于所述贡献度对所述张量数据执行降采样处理。根据本公开的信息处理装置和信息处理方法在保留张量数据的高阶特征的同时减小张量数据的存储空间和处理成本,提高用于张量数据的分类模型的分类准确性。

    对实体词的语义关系进行分类的方法、装置和电子设备

    公开(公告)号:CN107562752B

    公开(公告)日:2021-05-28

    申请号:CN201610509575.5

    申请日:2016-06-30

    Inventor: 张姝 杨铭 孙俊

    Abstract: 本申请实施例提供一种对文本序列中实体词的语义关系进行分类的方法、装置和电子设备,该装置包括:第一获得单元,其用于将文本序列中的每个词用词向量表示,以构建第一矩阵;第二获得单元,其利用深度学习模型对所述第一矩阵进行处理,以获得第二矩阵;第三获得单元,其利用注意力模型,对所述第二矩阵进行处理,以确定所述文本序列中词的受关注程度,并基于所述受关注程度获得所述文本序列的第三矩阵;分类单元,其至少根据所述文本序列的所述第三矩阵,以及预先存储的分类模型,来确定所述文本序列中的实体词之间的语义关系。根据本实施例,能够提高分类效率。

    对实体词的语义关系进行分类的方法和装置

    公开(公告)号:CN107305543B

    公开(公告)日:2021-05-11

    申请号:CN201610258308.5

    申请日:2016-04-22

    Inventor: 杨铭 张姝 孙俊

    Abstract: 本发明涉及对实体词的语义关系进行分类的方法和装置。该方法包括:基于句子中的每个词以及其相对于两个实体词的位置权重来生成待分类向量;用预定的方向分类特征参数和预定的类型分类特征参数分别与待分类向量相乘,用非线性激活函数对各自的乘积分别进行非线性变换,从而生成方向分类特征和类型分类特征;以及根据方向分类特征和类型分类特征,利用预先存储的分类模型来确定两个实体词之间的语义关系方向和语义关系类型。

    对实体词的语义关系进行分类的方法和装置

    公开(公告)号:CN106407211B

    公开(公告)日:2019-08-06

    申请号:CN201510459760.3

    申请日:2015-07-30

    Inventor: 张姝 杨铭 孙俊

    Abstract: 本发明涉及对实体词的语义关系进行分类的方法和装置。该方法包括:通过将句子中的每个词用词向量表示来构建第一矩阵,将第一矩阵中的实体词的向量进行连接以得到第一实体词向量;对第一矩阵利用深度学习模型进行处理得到第二矩阵,将第二矩阵中的实体词的向量进行连接以得到第二实体词向量;对第二矩阵进行池化处理来得到句子级特征;将第一实体词向量与第二实体词向量进行连接得到词汇级特征;以及将句子级特征和词汇级特征进行连接得到的向量作为待分类向量输入预先存储的分类模型来确定实体词之间的语义关系。根据本发明,提供了一种更有效的对实体词的语义关系进行分类的方法和装置。

    计算句子中的词的概率的方法、装置和神经网络

    公开(公告)号:CN108694163A

    公开(公告)日:2018-10-23

    申请号:CN201710220821.X

    申请日:2017-04-06

    Abstract: 本发明公开了一种计算句子中的词的概率的方法、装置和神经网络。计算句子中的词的概率的方法,包括:依序计算句子中的各个词的长距离依赖特征,特定词的长距离依赖特征表征该特定词与句子中的其他长距离的词之间的依赖关系;依序计算各个词的语义结构特征,特定词的语义结构特征表征包含该特定词及其之前的词的局部句子的语义结构;将每个词的长距离依赖特征和语义结构特征组合,以得到句子中的各个词的词特征;以及基于各个词特征,来计算句子中的各个词的概率。通过本发明的方法,能够将语义结构特征引入到神经网络训练框架中。

    信息处理装置和信息处理方法

    公开(公告)号:CN106294398A

    公开(公告)日:2017-01-04

    申请号:CN201510261182.2

    申请日:2015-05-21

    Inventor: 张姝 孟遥

    CPC classification number: G06F16/951

    Abstract: 本发明实施例提供一种信息处理装置和信息处理方法,该信息处理装置包括:第一生成单元,其用于生成与调查问卷相关的关键词的集合;第一获取单元,其根据所述关键词的集合查询到信息源中所公开的相关信息,并获取公开所述相关信息的用户的个人信息页面;第一处理单元,其用于对所述相关信息和所述个人信息页面进行处理,以提取该相关信息中与所述关键词相关的文本信息、所述相关信息的属性信息以及所述用户的个人信息;第一确定单元,其根据所述文本信息获取用户对于所述调查问卷中的问题的答案,并确定所述答案、所述相关信息的属性信息、以及所述用户的个人信息之间的对应关系。根据本发明实施例,能够实现高效的问卷调查工作。

    确定微博与给定实体的相关性的方法和装置

    公开(公告)号:CN103164428B

    公开(公告)日:2016-01-20

    申请号:CN201110414476.6

    申请日:2011-12-13

    Abstract: 本发明涉及确定微博与给定实体的相关性的方法和装置。确定多个微博中的每个微博与给定实体的相关性的方法包括:提取多个微博中的每个微博的特征;根据所提取的特征确定微博之间的相似度;以及利用所确定的微博之间的相似度,基于半监督分类器来确定多个微博中的每个微博与给定实体的相关性。

    用于名称消岐聚类的装置和方法

    公开(公告)号:CN102654881B

    公开(公告)日:2014-10-22

    申请号:CN201110056065.4

    申请日:2011-03-03

    Abstract: 提供了用于名称消岐聚类的装置和方法。对名称训练集进行数据处理的装置包括:用于确定至少两个名称训练集中每个名称训练集的代表相似度的装置,代表相似度为名称训练集中的文本间相似度的代表值;用于针对至少两个名称训练集中的每个名称训练集,采用不同的相似度阈值进行聚类以选择使聚类效果较佳的相似度阈值作为优选相似度阈值的装置;以及用于根据至少两个名称训练集中的每个名称训练集的代表相似度和优选相似度阈值拟合表示代表相似度与优选相似度阈值之间对应关系的函数的装置。

    信息抽取方法和装置
    60.
    发明授权

    公开(公告)号:CN102073653B

    公开(公告)日:2013-06-19

    申请号:CN200910226105.8

    申请日:2009-11-20

    Abstract: 本发明公开了一种信息抽取方法和装置。其中该信息抽取方法包括:a)获取第一评价信息的初始种子;b)确定与第一评价信息的种子关联的第二评价信息;c)根据与第一评价信息的种子关联出现的第二评价信息的权重来确定新的第二评价信息的种子;d)确定与第二评价信息的种子关联的第一评价信息;e)根据与第二评价信息的种子关联出现的第一评价信息的权重来确定新的第一评价信息的种子;f)判断是否满足迭代结束条件,如果否,则又执行步骤b)至e),否则输出所获得的第一评价信息和第二评价信息。此外,本发明还公开了一种相应的信息抽取装置。

Patent Agency Ranking