-
公开(公告)号:CN114969343B
公开(公告)日:2024-04-19
申请号:CN202210639693.3
申请日:2022-06-07
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/216 , G06F40/30
Abstract: 本发明涉及一种结合相对位置信息的弱监督文本分类方法,属于自然语言处理领域,包括以下步骤:S1:输入初始化种子词,以及与初始化种子词同类的为标记文档;S2:生成伪标签;S3:基于生成的伪标签训练Transformer文本分类器;S4:通过文本分类器为未标记的文本分配标签;S5:通过比较排序方法,更新每一个类别的种子词,返回步骤S2进行迭代训练。本发明提升了模型的学习能力,提高了分类的准确率。
-
公开(公告)号:CN115034221A
公开(公告)日:2022-09-09
申请号:CN202210593426.7
申请日:2022-05-27
Applicant: 重庆邮电大学
IPC: G06F40/295 , G06F40/211 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于BiLSTM结合全局指针的重叠关系抽取系统,属于计算机技术领域。该系统包括依次连接的共享的Bert编码器、关系类型提取器、头实体提取器和尾实体提取器;所述Bert编码器通过所有层中联合调节左右上下文来预训练来自未标记文本的深层双向表示;设置的输出层,对预训练的BERT模型进行调整;采用预训练模型bert编码文本信息,具有丰富的文本信息;在实体提取模块,本发明提出了利用关系类型和多头注意力结合来引导实体提取,可以充分利用关系类型外部知识,避免隔离关系和实体之间的联系,并且通过多头注意力来给重要信息分配更高的注意力得分。
-