一种基于编码修正BERT CNN的数据分类方法及其系统

    公开(公告)号:CN116484252A

    公开(公告)日:2023-07-25

    申请号:CN202310289599.4

    申请日:2023-03-23

    Abstract: 本发明提出了一种基于编码修正BERT‑CNN的数据分类方法,该方法包括如下步骤:响应于获取训练数据,所述训练数据包括用于BERT预训练的非结构化文本数据和用于训练修正器和分类器的结构化数据;对获取的所述训练数据进行预处理,并划分为训练集、验证集以及测试集;使用获取的所述训练数据中的非结构化文本数据训练BERT模型;使用BERT模型输出的词编码以对抗的方式训练修正器;将所述修正器得到的编码加上BERT模型输出的编码得到最终的编码;再使用获得的所述最终的编码训练文本分类器。本发明通过对BERT输出编码进行补充修正得到更有利于文本分类的编码形式,有助于提升模型的泛化能力和准确性。

Patent Agency Ranking