一种图像文本双端迁移攻击方法、装置和介质

    公开(公告)号:CN116523032A

    公开(公告)日:2023-08-01

    申请号:CN202310235411.8

    申请日:2023-03-13

    Abstract: 本发明公开了一种图像文本双端迁移攻击方法、装置和介质,该方法的步骤包括分析攻击目标模型、本地替代模型训练、对抗样本生成和对抗样本迁移,其中,分析攻击目标模型,即对比语言图像预训练模型,其可以接受图像与文本两端输入,之后根据输出向量的相似度进行结果预测;本地替代模型训练为根据目标模型的骨干网络训练替代模型,用于迁移攻击;对抗样本生成为对本地替代模型的进行攻击,进而获得图像和文本的对抗样本;对抗样本迁移为对抗样本输入对比语言图像预训练模型,最终导致网络无法正常工作,网络预测分类错误。本发明从图像和文本两个输入端口进行攻击,同时在本地训练相关模型进行迁移攻击,大幅提高了攻击成功率。

    一种基于自监督训练的弱监督文本分类方法、系统和装置

    公开(公告)号:CN115080749A

    公开(公告)日:2022-09-20

    申请号:CN202210980845.6

    申请日:2022-08-16

    Abstract: 本发明公开了一种基于自监督训练的弱监督文本分类方法、系统和装置,包括如下步骤:S1:获取待标注文本数据和对应的类别标签集合;S2:获取预训练模型;S3:将预训练模型部分权重迁移至文本分类模型;S4:通过自监督伪标策略获得文本分类伪标签;本发明提供了一种基于自监督训练的弱监督文本分类方法,更贴近于文本分类实际应用场景,用户只需提供待标注数据和类别标签集合即可,极大地减少了文本数据标注成本。目前已有较多科技巨头公司开源了各种预训练自然语言模型,这些模型已提前学习到了海量信息中的通识知识,保证了分类精度。通过采用迁移学习方法和自监督训练策略,进一步提高了分类效率和精度。

    一种面向弱监督文本分类系统、方法和装置

    公开(公告)号:CN114647732A

    公开(公告)日:2022-06-21

    申请号:CN202210559452.8

    申请日:2022-05-23

    Abstract: 本发明公开了一种面向弱监督文本分类系统、方法和装置,包括以下模块:获取模块:从数据库中获取用户上传的待标注文本数据和提供的类别标签集合;文本分类模块:根据获取模块中用户上传的待标注文本数据,确定预训练自然语言模型,使用确定模型对待标注文本数据进行分类输出标注结果;文本标注模块:根据文本分类模块输出的标注结果,生成与待标注文本数据相对应的标注结果,从而完成对所述待标注文本数据的标注,本发明提供了一种面向弱监督文本分类系统,为解决文本分类问题提供一种新的解决思路,即用户只需提供待标注文本数据和类别标签集合,便可实现高准确率的标注结果,极大地减少了文本数据标注成本。

    一种基于预训练标注数据不可知的图像分类自动标注方法

    公开(公告)号:CN113191385B

    公开(公告)日:2022-06-03

    申请号:CN202110318366.3

    申请日:2021-03-25

    Abstract: 本发明公开了一种基于预训练标注数据不可知的图像分类自动标注方法,包括如下步骤:S1,获取待标注图像,收集预训练图像分类模型;S2,将预训练图像分类模型拆分成特征提取模型与标签预测模型,并初始化,固定标签预测模型参数,不参与后续迁移训练;S3,约束特征提取模型,使自动标注模型的输出具体类别确定,整体分布离散;S4,对特征提取模型输出特征进行聚类;S5,筛选出大小超过阈值的聚类簇,所对应的类别组成为待标注图像标签空间;S6,给所有待标注图像打上伪标签;S7,重新聚类并分配伪标签,对特征提取模型进行有监督训练;S8,迭代S3至S7;S9,使用迁移后的自动标注模型对待标注图像进行推理,得到标注结果。

    一种对抗文本的生成方法、装置、存储介质及电子设备

    公开(公告)号:CN116227474A

    公开(公告)日:2023-06-06

    申请号:CN202310514835.8

    申请日:2023-05-09

    Abstract: 本说明书公开了一种对抗文本的生成方法、装置、存储介质及电子设备,包括:获取用于生成对抗文本的各原始文本,根据预先训练的第一语言模型,确定各原始文本的特征向量,并对各原始文本聚类,得到指定数量的文本簇。然后,从各文本簇中确定代表文本,再确定各代表文本对应的初始对抗文本。然后,根据确定出的代表文本的原始关键词和初始对抗关键词之间的差异,从预设的各思维链提示模板中,确定目标思维链提示模板。之后,根据代表文本和代表文本的初始对抗文本,采用目标思维链提示模板,生成思维链提示文本。将思维链提示文本输入预先训练的第二语言模型,得到目标对抗文本。可以更加灵活地生成对抗文本,减少对抗文本的生成成本。

    一种基于带噪标签学习的弱监督文本分类方法和装置

    公开(公告)号:CN115080748B

    公开(公告)日:2022-11-11

    申请号:CN202210980591.8

    申请日:2022-08-16

    Abstract: 本发明公开了一种基于带噪标签学习的弱监督文本分类方法和装置,包括如下步骤:S1:获取待标注文本和类别标签集合;S2:确定预训练自然语言模型;S3:获得待标注文本伪标签;S4:初始化文本分类模型,基于伪标签计算分类损失函数;S5:通过带噪标签损失筛选方法得到高置信度数据:将所有待标注文本的分类损失函数按升序排列,筛选前top‑N数据作为高置信度数据;本发明提供了一种基于带噪标签学习的弱监督文本分类方法和装置,解决在仅获取待标注文本和类别标签集合情况下,实现高准确率分类结果,减少文本标注成本。

    面向预训练标注数据不可知的图像自动标注系统和装置

    公开(公告)号:CN113128565B

    公开(公告)日:2022-05-06

    申请号:CN202110317531.3

    申请日:2021-03-25

    Abstract: 本发明公开了面向预训练标注数据不可知的图像自动标注系统,包括:获取模块和图像标注模块,及分别与所述获取模块和图像标注模块连接的模型迁移模块;所述获取模块,用于获取一组图像标注任务和待标注图像;所述模型迁移模块,用于将一组确定的预训练图像处理模型无监督迁移至适配于待标注图像域的更新后的图像处理模型,包括依次连接的模型拆分单元、信息最大化损失约束单元、聚类单元、标签空间分类单元、标签分配单元、分配更新单元和收敛单元;所述图像标注模块,用于生成与待标注图像相匹配的标注信息,并进行可视化标注。

Patent Agency Ranking