-
公开(公告)号:CN113946681A
公开(公告)日:2022-01-18
申请号:CN202111558098.9
申请日:2021-12-20
Applicant: 军工保密资格审查认证中心 , 北京中船信息科技有限公司
IPC: G06F16/35 , G06F40/284 , G06N3/08
Abstract: 本申请涉及一种文本数据的事件抽取方法、装置、电子设备及计算机可读介质。该方法包括:将文本数据中的至少一个句子依次输入BERT模型进行预训练;根据预训练结果生成所述至少一个句子对应的至少一个句子向量集合,句子向量集合中包括多个单词和其对应的词向量、位置向量、句子序号;将所述至少一个句子向量集合输入事件抽取模型中以生成至少一个事件集合;其中,所述事件抽取模型基于实体注意力机制和动态池化层生成。本申请涉及的文本数据的事件抽取方法、装置、电子设备及计算机可读介质,能够减少无关信息对事件抽取任务产生的干扰,一次性的由文本数据的句子中抽取多个有价值的信息,提升信息抽取的准确度。
-
公开(公告)号:CN115081452B
公开(公告)日:2022-11-01
申请号:CN202211002675.0
申请日:2022-08-22
Applicant: 军工保密资格审查认证中心 , 北京中船信息科技有限公司
IPC: G06F40/295 , G06N20/00 , G06F16/35 , G06F40/216
Abstract: 本申请属于自然语言处理领域,具体提供了一种实体关系的抽取方法。该方法包括:利用BERT模型对待抽取的文本数据进行编码,获得所述文本数据的向量化表示;其中,所述文本数据包括至少一个句子;基于所述文本数据的向量化表示,利用实体关系抽取模型获取所述文本数据中单词对存在特定关系的概率;其中,所述实体关系抽取模型基于多头注意力机制和知识蒸馏构建。基于本申请提供的技术方案,可以提高实体关系抽取的精确性。
-
公开(公告)号:CN113946681B
公开(公告)日:2022-03-29
申请号:CN202111558098.9
申请日:2021-12-20
Applicant: 军工保密资格审查认证中心 , 北京中船信息科技有限公司
IPC: G06F16/35 , G06F40/284 , G06N3/08
Abstract: 本申请涉及一种文本数据的事件抽取方法、装置、电子设备及计算机可读介质。该方法包括:将文本数据中的至少一个句子依次输入BERT模型进行预训练;根据预训练结果生成所述至少一个句子对应的至少一个句子向量集合,句子向量集合中包括多个单词和其对应的词向量、位置向量、句子序号;将所述至少一个句子向量集合输入事件抽取模型中以生成至少一个事件集合;其中,所述事件抽取模型基于实体注意力机制和动态池化层生成。本申请涉及的文本数据的事件抽取方法、装置、电子设备及计算机可读介质,能够减少无关信息对事件抽取任务产生的干扰,一次性的由文本数据的句子中抽取多个有价值的信息,提升信息抽取的准确度。
-
公开(公告)号:CN115081452A
公开(公告)日:2022-09-20
申请号:CN202211002675.0
申请日:2022-08-22
Applicant: 军工保密资格审查认证中心 , 北京中船信息科技有限公司
IPC: G06F40/295 , G06N20/00 , G06F16/35 , G06F40/216
Abstract: 本申请属于自然语言处理领域,具体提供了一种实体关系的抽取方法。该方法包括:利用BERT模型对待抽取的文本数据进行编码,获得所述文本数据的向量化表示;其中,所述文本数据包括至少一个句子;基于所述文本数据的向量化表示,利用实体关系抽取模型获取所述文本数据中单词对存在特定关系的概率;其中,所述实体关系抽取模型基于多头注意力机制和知识蒸馏构建。基于本申请提供的技术方案,可以提高实体关系抽取的精确性。
-
-
-