-
公开(公告)号:CN104820694B
公开(公告)日:2019-03-15
申请号:CN201510208978.1
申请日:2015-04-28
Applicant: 中国科学院自动化研究所
IPC: G06F16/242 , G06F16/25
Abstract: 本发明提供一种基于多知识库和整数线性规划ILP的自动问答方法和系统,所述方法包括:创建用于索引多个知识库的实体和/或关系的资源字典;在所述资源字典中查询并由自然语句的多个文本片段映射到的多个实体和/或多个关系构成多个候选资源;对各候选资源执行转换,获得对应的多个模板;将所述各文本片段、映射、候选资源、转换、和模板组合成消歧图;根据ILP对所述消歧图进行联合推理、选取至少一个待查询模板来生成规范查询语句。本发明所述方法能够对自然语句在多知识库中进行较精确的查询。
-
公开(公告)号:CN104572892B
公开(公告)日:2017-10-03
申请号:CN201410817856.8
申请日:2014-12-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于循环卷积网络的文本分类方法,包括以下步骤:步骤1,利用双向循环网络对所有词进行上下文向量的表示;步骤2,将上下文向量及当前词的词向量组合成当前词的表示;步骤3,利用最大池化技术提取最重要的上下文信息得到文本表示;步骤4,利用文本表示进行文本分类。该方法能够较多地保留文本中的词序信息,捕捉长距离的文本依赖关系,精确刻画词的语义,并通过最大池化技术找到对文本分类影响最大的词和短语。有效地提高了文本分类的准确率。经过试验证明,本方法在多个文本分类数据集上平均提升1%。
-
公开(公告)号:CN104049755A
公开(公告)日:2014-09-17
申请号:CN201410271542.2
申请日:2014-06-18
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F3/01
CPC classification number: G06N3/08 , G06F17/27 , G06N3/04 , G06N3/0454
Abstract: 本发明实施例公开了一种信息处理方法及装置;所述方法包括:利用评价对象种子、评价词种子以及评价关系种子对深度神经网络进行训练;在第一输入层对候选评价对象、候选评价词以及候选评价关系对应的向量进行连接得到第一输入向量,在第一隐藏层对所述第一输入向量进行压缩得到第一中间向量,在第一输出层将所述第一中间向量进行解码得到第一输出向量;确定解码错误值小于解码错误值阈值的第一输出向量,并将所确定的第一输出向量对应的候选评价对象、候选评价词以及候选评价关系确定为第一观点信息。采用本发明实施例的技术方案,能够提升从评价文本中提取观点信息的精度。
-
公开(公告)号:CN104881399B
公开(公告)日:2017-10-27
申请号:CN201510250005.4
申请日:2015-05-15
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于概率软逻辑PSL的事件识别方法和系统,所述方法包括:分别计算候选与事件的条件概率、以及两个不同候选、两个不同事件、事件与主题、候选与主题出现在同一语句和/或文档中的条件概率;在PSL模型中为不同条件概率分别设定对应的变量,设计并根据PSL模型的变量公式进行迭代,以最大化候选与事件的条件概率对应的变量,得到候选在最大化条件下对应的特定的事件,并构成事件识别模型。本发明所述方法能够提高事件识别的准确性。
-
公开(公告)号:CN104049755B
公开(公告)日:2017-01-18
申请号:CN201410271542.2
申请日:2014-06-18
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F3/01
CPC classification number: G06N3/08 , G06F17/27 , G06N3/04 , G06N3/0454
Abstract: 本发明实施例公开了一种信息处理方法及装置;所述方法包括:利用评价对象种子、评价词种子以及评价关系种子对深度神经网络进行训练;在第一输入层对候选评价对象、候选评价词以及候选评价关系对应的向量进行连接得到第一输入向量,在第一隐藏层对所述第一输入向量进行压缩得到第一中间向量,在第一输出层将所述第一中间向量进行解码得到第一输出向量;确定解码错误值小于解码错误值阈值的第一输出向量,并将所确定的第一输出向量对应的候选评价对象、候选评价词以及候选评价关系确定为第一观点信息。采用本发明实施例的技术方案,能够提升从评价文本中提取观点信息的精度。
-
公开(公告)号:CN104881399A
公开(公告)日:2015-09-02
申请号:CN201510250005.4
申请日:2015-05-15
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于概率软逻辑PSL的事件识别方法和系统,所述方法包括:计算至少候选与事件、以及至少在同一文档和/或同一语句中出现候选与主题、事件与主题、两个不同候选或两个不同事件中的至少任意一个的条件概率;在PSL模型中为不同条件概率分别设定对应的变量,设计并根据PSL模型的变量公式进行迭代,以最大化候选与事件的条件概率对应的变量,得到候选在最大化条件下对应的特定的事件,并构成事件识别模型。本发明所述方法能够提高事件识别的准确性。
-
公开(公告)号:CN104820694A
公开(公告)日:2015-08-05
申请号:CN201510208978.1
申请日:2015-04-28
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
CPC classification number: G06F17/30401 , G06F17/30557
Abstract: 本发明提供一种基于多知识库和整数线性规划ILP的自动问答方法和系统,所述方法包括:创建用于索引多个知识库的实体和/或关系的资源字典;在所述资源字典中查询并由自然语句的多个文本片段映射到的多个实体和/或多个关系构成多个候选资源;对各候选资源执行转换,获得对应的多个模板;将所述各文本片段、映射、候选资源、转换、和模板组合成消歧图;根据ILP对所述消歧图进行联合推理、选取至少一个待查询模板来生成规范查询语句。本发明所述方法能够对自然语句在多知识库中进行较精确的查询。
-
公开(公告)号:CN104572892A
公开(公告)日:2015-04-29
申请号:CN201410817856.8
申请日:2014-12-24
Applicant: 中国科学院自动化研究所
CPC classification number: G06F17/30707
Abstract: 本发明公开了一种基于循环卷积网络的文本分类方法,包括以下步骤:步骤1,利用双向循环网络对所有词进行上下文向量的表示;步骤2,将上下文向量及当前词的词向量组合成当前词的表示;步骤3,利用最大池化技术提取最重要的上下文信息得到文本表示;步骤4,利用文本表示进行文本分类。该方法能够较多地保留文本中的词序信息,捕捉长距离的文本依赖关系,精确刻画词的语义,并通过最大池化技术找到对文本分类影响最大的词和短语。有效地提高了文本分类的准确率。经过试验证明,本方法在多个文本分类数据集上平均提升1%。
-
-
-
-
-
-
-