-
公开(公告)号:CN109783618B
公开(公告)日:2021-01-19
申请号:CN201811510566.3
申请日:2018-12-11
Applicant: 北京大学
IPC: G06F16/332 , G06F16/36 , G06N3/04
Abstract: 本发明涉及一种基于注意力机制神经网络的药物实体关系抽取方法及系统。该方法包括:(1)解析药化文献的文本内容,以句子为基本单位分句,并对句子中的每个词进行向量化表示;(2)将向量化表示的结果输入循环神经网络,通过循环神经网络按照前后双向语序提取句子中各词的关联特征并识别各药化实体;(3)通过注意力机制神经网络获得句子中的词间重要性权重,并将其与步骤(2)的输出合并;(4)将步骤(3)得到的结果输入卷积神经网络,通过卷积神经网络对各药化实体词两两预测类别关系。本发明增加注意力机制关注实体类别信息权重的分类方法能够降低长句中错误的依存分析结果带来的影响,提高药化实体关系抽取准确率。
-
公开(公告)号:CN109815478A
公开(公告)日:2019-05-28
申请号:CN201811511754.8
申请日:2018-12-11
Applicant: 北京大学
Abstract: 本发明涉及一种基于卷积神经网络的药化实体词识别方法及系统。该方法包括:(1)将待识别药化实体的文献中的每一个词转换成词向量形式;(2)对每个词进行解析,通过字符级卷积神经网络提取每个词的字符级特征;(3)通过词级扩张卷积神经网络识别文献中的药化实体,包括不同扩张卷积提取全局特征的过程;(4)通过解码层计算词级扩张卷积神经网络的输出的仿射变换,进而计算实体词属于某一分类的概率。本发明充分利用卷积神经网络适用于并行计算的特点实现对药化实体的分类识别,自动从文本内容中学习特征表示,省略了人工设计、降维特征的步骤,能够减少人为设计错误的发生,能够高效、准确、自动地完成对药化实体的分类识别。
-
公开(公告)号:CN109783618A
公开(公告)日:2019-05-21
申请号:CN201811510566.3
申请日:2018-12-11
Applicant: 北京大学
IPC: G06F16/332 , G06F16/36 , G06N3/04
Abstract: 本发明涉及一种基于注意力机制神经网络的药物实体关系抽取方法及系统。该方法包括:(1)解析药化文献的文本内容,以句子为基本单位分句,并对句子中的每个词进行向量化表示;(2)将向量化表示的结果输入循环神经网络,通过循环神经网络按照前后双向语序提取句子中各词的关联特征并识别各药化实体;(3)通过注意力机制神经网络获得句子中的词间重要性权重,并将其与步骤(2)的输出合并;(4)将步骤(3)得到的结果输入卷积神经网络,通过卷积神经网络对各药化实体词两两预测类别关系。本发明增加注意力机制关注实体类别信息权重的分类方法能够降低长句中错误的依存分析结果带来的影响,提高药化实体关系抽取准确率。
-
-