-
公开(公告)号:CN118013038A
公开(公告)日:2024-05-10
申请号:CN202410203376.6
申请日:2024-02-23
Applicant: 重庆邮电大学
Abstract: 本发明属于自然语言处理领域,涉及一种基于原型聚类的文本增量关系抽取方法,包括:提取样本的上下文语义特征表示;将上下文语义特征表示输入到开放关系分类模型中进行训练;将待抽取文本关系的文本输入到训练后的开放关系分类模型中,判断输入文本的数据类型;若文本属于原始文本类别,则将文本加入该类型,否则作为其他类别文本;获取新类别文本数据,将新类别文本数据输入到训练后的开放关系分类模型,得到新类别的聚类中心,并对其他类别文本重新分类;对原始样本进行增强,对新类样本和增强后的原始类样本进行联合分类,得到文本关系;本发明采用联合有类别标签数据的监督学习和无类别标签数据的自监督学习模型,减少了对标签数据的依赖。
-
公开(公告)号:CN115934944A
公开(公告)日:2023-04-07
申请号:CN202211594439.2
申请日:2022-12-13
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/295 , G06F40/30 , G06F18/214 , G06F18/2415 , G06N3/045 , G06N3/048 , G06N3/084
Abstract: 本发明涉及一种基于Graph‑MLP与相邻对比损失的实体关系抽取方法,包括:获取具有标签信息的训练文本数据;根据词表对训练文本进行分词处理;将训练文本中的单词嵌入向量表示得到训练文本的词序列向量;将训练文本的词序列向量输入Bi‑LSTM中提取得到训练文本的上下文语义特征表示;创建Graph‑MLP关系分类模型;并将训练文本的上下文语义特征表示作为训练样本对Graph‑MLP关系分类模型进行训练;获取目标文本的词序列向量,将目标文本的词序列向量输入训练好的Graph‑MLP关系分类模型输出目标文本中两个实体之间的关系。
-