隐私保护文本命名实体识别方法、装置、设备及存储介质

    公开(公告)号:CN113486665B

    公开(公告)日:2023-06-20

    申请号:CN202110757350.2

    申请日:2021-07-05

    Abstract: 本发明公开了一种隐私保护文本命名实体识别方法、装置、计算机设备及存储介质,方法包括:接收多个数据持有方发送的多个训练好的教师模型,所述教师模型通过使用源数据进行训练,包括第一预训练网络和第一序列标注层,所述源数据为标注文本数据;根据多个训练好的教师模型,利用无标签的迁移集合进行多教师知识蒸馏从而训练学生模型,所述学生模型包括第二预训练网络和第二序列标注层;利用训练好的学生模型对无标签文本数据的命名实体进行预测。本发明将知识蒸馏应用于数据分散的真实场景,在数据可用不可见的前提下,通过无标签的迁移集合,训练出强大的学生模型,从而在隐私保护的前提下,保证学生模型在命名实体识别任务上的泛化性和准确性。

    情感分析模型训练方法、情感分析方法、设备及存储介质

    公开(公告)号:CN115719063A

    公开(公告)日:2023-02-28

    申请号:CN202211506938.1

    申请日:2022-11-24

    Abstract: 本申请公开了一种情感分析模型训练方法、情感分析方法、设备及存储介质,情感分析模型训练方法包括:获取用于情感分析的第一标注文本;对第一标注文本进行词性分析,得到名词集合;以及对第一标注文本进行情感词分析,得到情感词集合;基于名词集合和情感词集合,对第一标注文本进行掩码处理,得到目标文本序列;利用第一情感分析模型对目标文本序列进行依赖关系预测和掩码词预测,得到预测掩码词和预测依赖关系;利用真实掩码词和预测掩码词、真实依赖关系和预测依赖关系对第一情感分析模型进行网络参数调整,以使第一情感分析模型达到领域不变性表示学习的目的。通过上述方式,可以同时进行依赖关系预测和掩码词预测,以实现领域不变性学习。

    一种跨转录因子的转录因子结合位点预测算法及装置

    公开(公告)号:CN110335639B

    公开(公告)日:2021-10-29

    申请号:CN201910511069.3

    申请日:2019-06-13

    Abstract: 本发明提供了一种跨转录因子的转录因子结合位点预测算法及装置,所述方法包括如下步骤:步骤1:预测所有转录因子中能够与DNA结合的氨基酸,称为DNA结合位点,预测的DNA结合位点主要用于衡量不同转录因子的标注数据在目标转录因子模型训练过程中的贡献;步骤2:从由预测的DNA结合位点组成的序列中学习转录因子的表示向量;步骤3:从DNA片段的组蛋白修饰特征中学习DNA片段的高阶依存关系;步骤4:从DNA片段的序列特征中学习DNA片段的低阶依存关系;步骤5:将学习的转录因子向量表示、DNA片段的高阶依存关系和低阶依存关系拼接成特征向量并输入多层感知器中对目标DNA片段分类,判定其是否为目标转录因子的结合位点。

    一种模型隐私保护方法及装置

    公开(公告)号:CN112329052A

    公开(公告)日:2021-02-05

    申请号:CN202011155392.0

    申请日:2020-10-26

    Abstract: 本申请公开了一种模型隐私保护方法,该方法包括以下步骤:基于当前训练场景,确定用于对模型进行隐私保护的目标保护方式;如果目标保护方式为PATE方式,则在使用训练数据集进行模型训练过程中,对中间产生的投票结果进行加噪处理,训练完成后,获得最终的待使用第一模型;如果目标保护方式为差分隐私随机梯度下降DPSGD方式,则在使用训练数据集进行模型训练过程中,对将训练数据集输入到模型后计算得到的梯度进行加噪处理,训练完成后,获得最终的待使用第二模型。应用本申请所提供的技术方案,可以较好地且有效地进行隐私保护,提高训练数据及模型的安全性。本申请还公开了一种模型隐私保护装置,具有相应技术效果。

    基于区块链和本地化差分隐私保护的信息推荐方法及系统

    公开(公告)号:CN111931233A

    公开(公告)日:2020-11-13

    申请号:CN202010806166.8

    申请日:2020-08-12

    Abstract: 本申请实施例公开了一种基于区块链和本地化差分隐私保护的信息推荐方法及系统,用于在进行信息推荐的同时保证用户数据的安全性和确保用户隐私信息不被泄露。本申请实施例方法包括:对区块链用户的用户数据进行聚类分析,以及对该区块链用户的预处理数据进行本地化差分隐私处理而得到模糊化数据,并由星际文件系统对该模糊化数据进行哈希计算而得到哈希值,在得到区块链用户的桶号以及哈希值之后,可以基于该桶号及哈希值,根据推荐算法向目标区块链用户进行信息推荐。本申请实施例中,免除了中心服务器的参与,避免中心服务器被攻击而导致用户信息泄露,同时本地化差分隐私处理也保证了用户数据的隐秘性,增强了数据的安全性,降低隐私泄露的风险。

    一种跨转录因子的转录因子结合位点预测算法及装置

    公开(公告)号:CN110335639A

    公开(公告)日:2019-10-15

    申请号:CN201910511069.3

    申请日:2019-06-13

    Abstract: 本发明提供了一种跨转录因子的转录因子结合位点预测算法及装置,所述方法包括如下步骤:步骤1:预测所有转录因子中能够与DNA结合的氨基酸,称为DNA结合位点,预测的DNA结合位点主要用于衡量不同转录因子的标注数据在目标转录因子模型训练过程中的贡献;步骤2:从由预测的DNA结合位点组成的序列中学习转录因子的表示向量;步骤3:从DNA片段的组蛋白修饰特征中学习DNA片段的高阶依存关系;步骤4:从DNA片段的序列特征中学习DNA片段的低阶依存关系;步骤5:将学习的转录因子向量表示、DNA片段的高阶依存关系和低阶依存关系拼接成特征向量并输入多层感知器中对目标DNA片段分类,判定其是否为目标转录因子的结合位点。

    一种关联实体的情感信息表示方法

    公开(公告)号:CN110222185A

    公开(公告)日:2019-09-10

    申请号:CN201910511692.9

    申请日:2019-06-13

    Abstract: 本发明专利涉及一种关联实体的情感信息分类方法。该方法包括步骤一),利用维基百科语料训练大规模的词向量作为文本中词语的通用词向量表示;步骤二),结合强化学习中的Q学习方法针对文本中不同的实体和实体属性对词向量进行微调,使词语在修饰不同实体或实体属性时有不同的向量表示;步骤三),将学习获得的词语情感信息向量表示应用到实体级别文本情感分析任务中。使用该方法能在不使用注意力机制的情况下,有效判别不同实体或实体属性的情感极性。

Patent Agency Ranking