-
公开(公告)号:CN115130462A
公开(公告)日:2022-09-30
申请号:CN202210719139.6
申请日:2022-06-23
Applicant: 成都信息工程大学
IPC: G06F40/216 , G06N3/08 , G06N3/04
Abstract: 本发明涉及自然语言序列标注技术领域,公开了一种基于深度神经网络的信息抽取方法,BERT‑BiLSTM‑CRF模型能够解决信息抽取任务中存在的一词多义与同物异名问题,以及信息抽取任务中存在的待抽取信息长短不统一和待抽取信息有错别字、描述简短等问题,通过批量过采样的方式增加批量中少数类样本信息的数量,使得模型在训练的过程中可以有效学习到少数类样本信息的特征,从而在一定程度上解决数据类别分布不均衡的问题,使得少数类样本信息的抽取效果有显著提升。
-
公开(公告)号:CN115130462B
公开(公告)日:2023-09-01
申请号:CN202210719139.6
申请日:2022-06-23
Applicant: 成都信息工程大学
IPC: G06F40/216 , G06N3/0442 , G06N3/045 , G06N3/047 , G06N3/084 , G06N3/088 , G06N3/09
Abstract: 本发明涉及自然语言序列标注技术领域,公开了一种基于深度神经网络的信息抽取方法,BERT‑BiLSTM‑CRF模型能够解决信息抽取任务中存在的一词多义与同物异名问题,以及信息抽取任务中存在的待抽取信息长短不统一和待抽取信息有错别字、描述简短等问题,通过批量过采样的方式增加批量中少数类样本信息的数量,使得模型在训练的过程中可以有效学习到少数类样本信息的特征,从而在一定程度上解决数据类别分布不均衡的问题,使得少数类样本信息的抽取效果有显著提升。
-