一种基于隐私保护的工业命名实体识别方法

    公开(公告)号:CN119670746A

    公开(公告)日:2025-03-21

    申请号:CN202411576056.1

    申请日:2024-11-06

    Abstract: 本发明涉及一种基于隐私保护的工业命名实体识别方法,属于自然语言处理技术领域,由多个本地客户端和全局模型两部分组成,包括以下步骤:步骤1:获取工业故障检测数据集,划分出训练集并分配标签;步骤2:建立初始模型;步骤3:各本地客户端从服务器下载全局模型参数;步骤4:各本地客户端设定迭代轮次后,用私有数据在初始模型中进行训练,并将模型参数上传到服务器;步骤5:服务器聚合模型参数并更新全局模型;步骤6:重复步骤3至步骤5直到设定的迭代轮次结束;步骤7:将所需进行实体识别的数据输入训练好的模型,抽取出测试集实体。本发明在提高本地模型的性能的同时又保护了各客户端的数据隐私,并加强了命名实体识别的准确性。

    一种基于原型网络的工业小样本关系抽取方法

    公开(公告)号:CN118569251A

    公开(公告)日:2024-08-30

    申请号:CN202410632407.X

    申请日:2024-05-21

    Abstract: 本发明提出了一种基于原型网络的工业小样本关系抽取方法,属于自然语言处理技术领域。包括:获取工业数据集和公共数据集;构建两个相同的基于注意力机制的关系关注原型生成模型,得到公共关系关注原型表示和工业关系关注原型表示;构建基于知识蒸馏的原型蒸馏模型,针对公共关系关注原型表示和工业关系关注原型表示进行知识蒸馏,同时将工业支持集中的句子输入基于知识蒸馏的原型蒸馏模型,基于知识蒸馏后的所述工业关系关注原型表示得到分类预测结果。本发明通过在编码阶段引入注意力机制实现关系描述重要信息选择,随后将信息选择后的原型进行原型蒸馏实现工业小样本关系抽取性能提升。

Patent Agency Ranking