-
公开(公告)号:CN116523032A
公开(公告)日:2023-08-01
申请号:CN202310235411.8
申请日:2023-03-13
Applicant: 之江实验室
IPC: G06N3/094 , G06N3/096 , G06V30/19 , G06N3/0464
Abstract: 本发明公开了一种图像文本双端迁移攻击方法、装置和介质,该方法的步骤包括分析攻击目标模型、本地替代模型训练、对抗样本生成和对抗样本迁移,其中,分析攻击目标模型,即对比语言图像预训练模型,其可以接受图像与文本两端输入,之后根据输出向量的相似度进行结果预测;本地替代模型训练为根据目标模型的骨干网络训练替代模型,用于迁移攻击;对抗样本生成为对本地替代模型的进行攻击,进而获得图像和文本的对抗样本;对抗样本迁移为对抗样本输入对比语言图像预训练模型,最终导致网络无法正常工作,网络预测分类错误。本发明从图像和文本两个输入端口进行攻击,同时在本地训练相关模型进行迁移攻击,大幅提高了攻击成功率。
-
公开(公告)号:CN115080749A
公开(公告)日:2022-09-20
申请号:CN202210980845.6
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/205 , G06F40/242 , G06K9/62
Abstract: 本发明公开了一种基于自监督训练的弱监督文本分类方法、系统和装置,包括如下步骤:S1:获取待标注文本数据和对应的类别标签集合;S2:获取预训练模型;S3:将预训练模型部分权重迁移至文本分类模型;S4:通过自监督伪标策略获得文本分类伪标签;本发明提供了一种基于自监督训练的弱监督文本分类方法,更贴近于文本分类实际应用场景,用户只需提供待标注数据和类别标签集合即可,极大地减少了文本数据标注成本。目前已有较多科技巨头公司开源了各种预训练自然语言模型,这些模型已提前学习到了海量信息中的通识知识,保证了分类精度。通过采用迁移学习方法和自监督训练策略,进一步提高了分类效率和精度。
-
公开(公告)号:CN114647732A
公开(公告)日:2022-06-21
申请号:CN202210559452.8
申请日:2022-05-23
Applicant: 之江实验室
IPC: G06F16/35
Abstract: 本发明公开了一种面向弱监督文本分类系统、方法和装置,包括以下模块:获取模块:从数据库中获取用户上传的待标注文本数据和提供的类别标签集合;文本分类模块:根据获取模块中用户上传的待标注文本数据,确定预训练自然语言模型,使用确定模型对待标注文本数据进行分类输出标注结果;文本标注模块:根据文本分类模块输出的标注结果,生成与待标注文本数据相对应的标注结果,从而完成对所述待标注文本数据的标注,本发明提供了一种面向弱监督文本分类系统,为解决文本分类问题提供一种新的解决思路,即用户只需提供待标注文本数据和类别标签集合,便可实现高准确率的标注结果,极大地减少了文本数据标注成本。
-
公开(公告)号:CN113191385B
公开(公告)日:2022-06-03
申请号:CN202110318366.3
申请日:2021-03-25
Applicant: 之江实验室
IPC: G06V10/774 , G06V10/762 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于预训练标注数据不可知的图像分类自动标注方法,包括如下步骤:S1,获取待标注图像,收集预训练图像分类模型;S2,将预训练图像分类模型拆分成特征提取模型与标签预测模型,并初始化,固定标签预测模型参数,不参与后续迁移训练;S3,约束特征提取模型,使自动标注模型的输出具体类别确定,整体分布离散;S4,对特征提取模型输出特征进行聚类;S5,筛选出大小超过阈值的聚类簇,所对应的类别组成为待标注图像标签空间;S6,给所有待标注图像打上伪标签;S7,重新聚类并分配伪标签,对特征提取模型进行有监督训练;S8,迭代S3至S7;S9,使用迁移后的自动标注模型对待标注图像进行推理,得到标注结果。
-
公开(公告)号:CN115860281B
公开(公告)日:2023-07-07
申请号:CN202310170296.0
申请日:2023-02-27
Applicant: 之江实验室
IPC: G06Q10/04 , G06Q50/06 , G06N3/0442 , G06N3/045 , G06F18/211 , H02J3/00
Abstract: 本发明公开了一种基于跨实体注意力的能源系统多实体负载预测方法和装置,该方法包括以下步骤:首先对数据预处理,采用特征变量选择网络预测各个实体对特征的依赖性,并通过长短期记忆网络提取时间依赖信息;然后对实体编码;其次使用通过键值查询不同实体间的注意力,以对实体间的相互作用进行编码计算跨实体注意力;再将特征编码输出为负载预测值;通过以上步骤对负载预测网络模型进行训练学习,以获取最终的负载预测网络模型;最后将新的输入特征变量输入负载预测网络模型,即可获取负载预测值。本发明能够高效地对实体的时间特征进行建模并模拟实体间的相关性,量化一个时间窗口内多个实体之间的相关性,大幅提高各个实体负载预测的准确度。
-
公开(公告)号:CN116227474A
公开(公告)日:2023-06-06
申请号:CN202310514835.8
申请日:2023-05-09
Applicant: 之江实验室
IPC: G06F40/247 , G06N20/00
Abstract: 本说明书公开了一种对抗文本的生成方法、装置、存储介质及电子设备,包括:获取用于生成对抗文本的各原始文本,根据预先训练的第一语言模型,确定各原始文本的特征向量,并对各原始文本聚类,得到指定数量的文本簇。然后,从各文本簇中确定代表文本,再确定各代表文本对应的初始对抗文本。然后,根据确定出的代表文本的原始关键词和初始对抗关键词之间的差异,从预设的各思维链提示模板中,确定目标思维链提示模板。之后,根据代表文本和代表文本的初始对抗文本,采用目标思维链提示模板,生成思维链提示文本。将思维链提示文本输入预先训练的第二语言模型,得到目标对抗文本。可以更加灵活地生成对抗文本,减少对抗文本的生成成本。
-
公开(公告)号:CN116089955A
公开(公告)日:2023-05-09
申请号:CN202211528529.1
申请日:2022-12-01
Applicant: 之江实验室
Abstract: 本发明公开了一种基于windows操作系统的系统调用去噪方法及装置,该方法基于提取到的系统调用参数,构造进程‑线程亲子关系图谱和时序图,对线程进行行为分析和过滤,保留在磁盘/内存/注册表/网络层面产生增、删、改行为的线程,并对这些进程产生的系统调用生成了系统调用描述文件。该方法能够有效减少在系统调用分析中原始数据的噪声,同时保留系统调用原有的亲缘和时序关系,使得计算机产生的系统调用能够以文本的形式进行描述和比较。
-
公开(公告)号:CN115953590A
公开(公告)日:2023-04-11
申请号:CN202211597576.1
申请日:2022-12-12
Applicant: 之江实验室
IPC: G06V10/424 , G06V10/764 , G06V10/82 , G06F40/30 , G06F40/289 , G06N3/0442 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种分段式细粒度的商品图像描述生成方法、装置和介质,该方法包括以下步骤:首先构造一个粗粒度的商品图像描述生成框架,由图像特征提取器、文本解码器、映射网络三部分组成;然后针对图像特征提取器以及文本解码器进行预训练,之后通过映射网络对齐语义空间,生成粗粒度的图像描述;其次在公开的商品描述数据集上微调已有的大型文本生成网络;再将粗粒度的图像描述输入微调后的文本生成网络,生成细粒度的商品图像描述;最后可将上述生成的商品描述再次输入网络,直至生成满意的商品图像描述。本发明的商品图像描述生成方法能够提高商品描述的丰富度和细腻度,自动化批量生成细粒度的商品图像描述。
-
公开(公告)号:CN115080748B
公开(公告)日:2022-11-11
申请号:CN202210980591.8
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/205
Abstract: 本发明公开了一种基于带噪标签学习的弱监督文本分类方法和装置,包括如下步骤:S1:获取待标注文本和类别标签集合;S2:确定预训练自然语言模型;S3:获得待标注文本伪标签;S4:初始化文本分类模型,基于伪标签计算分类损失函数;S5:通过带噪标签损失筛选方法得到高置信度数据:将所有待标注文本的分类损失函数按升序排列,筛选前top‑N数据作为高置信度数据;本发明提供了一种基于带噪标签学习的弱监督文本分类方法和装置,解决在仅获取待标注文本和类别标签集合情况下,实现高准确率分类结果,减少文本标注成本。
-
公开(公告)号:CN113128565B
公开(公告)日:2022-05-06
申请号:CN202110317531.3
申请日:2021-03-25
Applicant: 之江实验室
IPC: G06V10/774 , G06V10/762 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了面向预训练标注数据不可知的图像自动标注系统,包括:获取模块和图像标注模块,及分别与所述获取模块和图像标注模块连接的模型迁移模块;所述获取模块,用于获取一组图像标注任务和待标注图像;所述模型迁移模块,用于将一组确定的预训练图像处理模型无监督迁移至适配于待标注图像域的更新后的图像处理模型,包括依次连接的模型拆分单元、信息最大化损失约束单元、聚类单元、标签空间分类单元、标签分配单元、分配更新单元和收敛单元;所述图像标注模块,用于生成与待标注图像相匹配的标注信息,并进行可视化标注。
-
-
-
-
-
-
-
-
-