-
公开(公告)号:CN117332269A
公开(公告)日:2024-01-02
申请号:CN202311292957.3
申请日:2023-10-08
Applicant: 中国兵器工业计算机应用技术研究所
IPC: G06F18/214 , G06F18/24 , G06N3/0455 , G06N3/08 , G06F16/23
Abstract: 本发明涉及一种基于标签体系的结构化数据增量学习方法,属于自然语言处理领域。该方法包括以下步骤:建立初始标签体系,基于所述初始标签体系对结构化数据集进行人工标注,构建第一训练样本集;构建Bert模型,基于第一训练样本集对Bert模型进行训练得到训练好的Bert模型;将业务数据输入训练好的Bert模型得到相应的特征值,基于所述特征值得到完善的标签体系;构建物联网监控模型,利用所述物联网监控模型对业务数据进行预测得到预测后的业务数据;利用所述完善的标签体系对预测后的业务数据进行标注,构建第二训练样本集;基于第二训练样本集对所述物联网监控模型进行训练得到训练好的物联网监控模型。该方法可自动生成业务所需的特征标签,利用完善的标签体系对业务数据进行标注,提高了模型的识别效果和训练效率。
-
公开(公告)号:CN117332270A
公开(公告)日:2024-01-02
申请号:CN202311292970.9
申请日:2023-10-08
Applicant: 中国兵器工业计算机应用技术研究所
IPC: G06F18/214 , G06F18/24 , G06F16/21 , G06F16/22 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及一种基于零样本重放的增量学习方法,属于机器学习方法领域。该方法包括以下步骤:获取物联网设备的实时监控数据;构建物联网监控模型,利用所述物联网监控模型对所述监控数据进行预测得到预测后的监控数据;利用完善的标签体系对预测后的监控数据进行自动化标注;基于零样本重放的方法构建训练样本集对所述物联网监控模型进行训练得到训练好的物联网监控模型;将标注后的监控数据输入训练好的物联网监控模型得到高亮显示的关键信息。该方法使用标注过的样本集进行模型训练,提高了模型抽取信息的准确率以及训练的效率;在增量学习过程中通过同时使用旧样本的样本特征和新样本,在避免产生灾难性遗忘的同时节省了数据存储的开销。
-