-
公开(公告)号:CN114881038B
公开(公告)日:2022-11-11
申请号:CN202210816017.9
申请日:2022-07-12
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/284 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于跨度和注意力机制的中文实体与关系抽取方法及装置。本发明对中文语句分词后构造跨度集,将跨度集映射为向量空间的词向量集,使用基于跨度的预训练语言模型生成特征表示,使用注意力机制得到融合特征,构造特征向量使用分类器输出跨度的实体类型;在跨度的两侧加入边界信息和跨度类型信息作为先验信息,使用注意力机制得到跨度对的关系表示,通过分类器来输出将跨度对的关系类型。本发明实现了中文语句的实体与关系联合抽取,实体抽取和关系抽取分开建模独立训练,模型灵活度高,逻辑结构清晰,层次分明,节约了人力成本,提升了工作效率,准确率高,实用性强。
-
公开(公告)号:CN114881038A
公开(公告)日:2022-08-09
申请号:CN202210816017.9
申请日:2022-07-12
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/284 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于跨度和注意力机制的中文实体与关系抽取方法及装置。本发明对中文语句分词后构造跨度集,将跨度集映射为向量空间的词向量集,使用基于跨度的预训练语言模型生成特征表示,使用注意力机制得到融合特征,构造特征向量使用分类器输出跨度的实体类型;在跨度的两侧加入边界信息和跨度类型信息作为先验信息,使用注意力机制得到跨度对的关系表示,通过分类器来输出将跨度对的关系类型。本发明实现了中文语句的实体与关系联合抽取,实体抽取和关系抽取分开建模独立训练,模型灵活度高,逻辑结构清晰,层次分明,节约了人力成本,提升了工作效率,准确率高,实用性强。
-
公开(公告)号:CN113722495B
公开(公告)日:2025-03-14
申请号:CN202111240263.6
申请日:2021-10-25
Applicant: 之江实验室
IPC: G06N5/025 , G06N3/0455 , G06N3/0442 , G06N3/047 , G06N3/0985 , G06F16/353 , G06F16/903 , G06F18/2415
Abstract: 本发明公开了一种融合正则表达式的金融文本关系抽取与分类方法。该方法对金融文本编码后识别出文本中包含的关系实体对并进行标记;将金融文本依次和各项正则表达式进行匹配,将匹配结果转换为正则表达式标签,最后将该标签与标记结果融合,通过深度神经网络对实体对之间包含的关系进行抽取与分类。本发明实现了融合了正则表达式信息的金融文本端到端关系抽取与分类,逻辑结构清晰,层次分明,无需人工标注,节约了人力成本,提升了工作效率,准确率高,实用性强。
-
公开(公告)号:CN113722495A
公开(公告)日:2021-11-30
申请号:CN202111240263.6
申请日:2021-10-25
Applicant: 之江实验室
IPC: G06F16/35 , G06F16/903 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合正则表达式的金融文本关系抽取与分类方法。该方法对金融文本编码后识别出文本中包含的关系实体对并进行标记;将金融文本依次和各项正则表达式进行匹配,将匹配结果转换为正则表达式标签,最后将该标签与标记结果融合,通过深度神经网络对实体对之间包含的关系进行抽取与分类。本发明实现了融合了正则表达式信息的金融文本端到端关系抽取与分类,逻辑结构清晰,层次分明,无需人工标注,节约了人力成本,提升了工作效率,准确率高,实用性强。
-
-
-