-
公开(公告)号:CN111831783B
公开(公告)日:2023-12-08
申请号:CN202010644404.X
申请日:2020-07-07
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/30 , G06N5/025 , G06N5/04 , G06N3/042 , G06N3/0464 , G06N3/0442 , G06N3/045
Abstract: 本造成的计算成本问题,以及目标实体与非目标本发明提供了一种篇章级关系抽取方法,涉 实体之间的逻辑推理问题。及自然语言处理技术领域,主要解决了针对篇章级文档,计算资源耗费问题和目标实体与非目标实体之间的逻辑推理的技术问题。该发明包括:输入待处理文档,所述文档为篇章级文档;基于双向注意力约束对所述文档进行处理,得到实体与句子的抽象语义表示,所述抽象语义表示具有全局信息和逻辑推理信息;基于所述抽象语义表示判断所述文档中的目标实体对的关系类型。开发者可以使用本发明所述的方法高效准确地进(56)对比文件郭凤羽 等.基于语境交互感知和模式筛选的隐式篇章关系识别.计算机学报.2020,(第05期),901-915.李京谕 等.基于联合注意力机制的篇章级机器翻译.中文信息学报.2019,(第12期),45-53.刘鉴 等.基于双向LSTM和自注意力机制的中文关系抽取研究.山西大学学报(自然科学版).2020,(第01期),8-13.马语丹 等.结合实体共现信息与句子语义特征的关系抽取方法.中国科学:信息科学.2018,(第11期),1533-1545.
-
公开(公告)号:CN111783418A
公开(公告)日:2020-10-16
申请号:CN202010517766.2
申请日:2020-06-09
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/205 , G06F40/247 , G06F40/30
Abstract: 本发明涉及一种中文词义表示学习方法及装置,包括获取训练语料,生成全局上下文矩阵;对HowNet知识库进行解析,生成词义-词相似度矩阵;根据所述全局上下文矩阵和词义-词相似度矩阵,计算生成全局词义上下文向量;对所述全局词义上下文向量进行词义软消歧;采用基于注意力拓展的跳字模型对词义软消歧后的词义向量进行训练,输出词义向量。本发明通过提出的上下文软消歧机制,能够捕捉词的真正词义,提高深度学习模型在下游任务的效果。
-
公开(公告)号:CN111783418B
公开(公告)日:2024-04-05
申请号:CN202010517766.2
申请日:2020-06-09
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/205 , G06F40/247 , G06F40/30
Abstract: 本发明涉及一种中文词义表示学习方法及装置,包括获取训练语料,生成全局上下文矩阵;对HowNet知识库进行解析,生成词义‑词相似度矩阵;根据所述全局上下文矩阵和词义‑词相似度矩阵,计算生成全局词义上下文向量;对所述全局词义上下文向量进行词义软消歧;采用基于注意力拓展的跳字模型对词义软消歧后的词义向量进行训练,输出词义向量。本发明通过提出的上下文软消歧机制,能够捕捉词的真正词义,提高深度学习模型在下游任务的效果。
-
公开(公告)号:CN111831783A
公开(公告)日:2020-10-27
申请号:CN202010644404.X
申请日:2020-07-07
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明提供了一种篇章级关系抽取方法,涉及自然语言处理技术领域,主要解决了针对篇章级文档,计算资源耗费问题和目标实体与非目标实体之间的逻辑推理的技术问题。该发明包括:输入待处理文档,所述文档为篇章级文档;基于双向注意力约束对所述文档进行处理,得到实体与句子的抽象语义表示,所述抽象语义表示具有全局信息和逻辑推理信息;基于所述抽象语义表示判断所述文档中的目标实体对的关系类型。开发者可以使用本发明所述的方法高效准确地进行篇章级的关系抽取,同时解决篇章级关系抽取的两个主要问题,即遍历所有实体对生成备选样本造成的计算成本问题,以及目标实体与非目标实体之间的逻辑推理问题。
-
公开(公告)号:CN111797241A
公开(公告)日:2020-10-20
申请号:CN202010552821.1
申请日:2020-06-17
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明涉及一种基于强化学习的事件论元抽取方法及装置,包括构建事件检测模型,构建论元检测模型,构建实体选择模型,将实体选择模型选择的待检测实体输入到论元检测模型进行检测,采集预测结果的损失,根据预测结果的损失更新论元检测模型的参数;根据待检测实体更新实体选择模型;通过更新后的论元检测模型和更新后的实体选择模型对句子中的实体进行检测,并将检测结果引入更新后的论元检测模型和更新后的实体选择模型进行更新,循环直至遍历所有实体。本发明能够在检测当前论元的时候,引入已知论元的信息,通过引入已知论元信息和强化学习技术,能够有效利用论元间交互关系,提高论元检测效果。
-
公开(公告)号:CN111797241B
公开(公告)日:2023-08-22
申请号:CN202010552821.1
申请日:2020-06-17
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明涉及一种基于强化学习的事件论元抽取方法及装置,包括构建事件检测模型,构建论元检测模型,构建实体选择模型,将实体选择模型选择的待检测实体输入到论元检测模型进行检测,采集预测结果的损失,根据预测结果的损失更新论元检测模型的参数;根据待检测实体更新实体选择模型;通过更新后的论元检测模型和更新后的实体选择模型对句子中的实体进行检测,并将检测结果引入更新后的论元检测模型和更新后的实体选择模型进行更新,循环直至遍历所有实体。本发明能够在检测当前论元的时候,引入已知论元的信息,通过引入已知论元信息和强化学习技术,能够有效利用论元间交互关系,提高论元检测效果。
-
-
-
-
-