-
公开(公告)号:CN117235716A
公开(公告)日:2023-12-15
申请号:CN202311508777.4
申请日:2023-11-14
Applicant: 之江实验室
IPC: G06F21/55 , G06F16/16 , G06F16/174
Abstract: 本发明公开了一种OOXML文档模板注入攻击的未知威胁防御方法及装置;通过对文档进行还原,对可能存放恶意攻击载荷的关键文件的XML树再次进行递归,将其可能携带恶意病毒的关键标签进行解析,依据预设的可信度字典及评估算法对其中的威胁标签进行解析、评估、删除或重组,从而破坏黑客构造的恶意文档,使其失去攻击性,让用户可以极大程度避免受钓鱼攻击者的文档模板注入攻击的风险。本发明打破传统杀毒软件只能检测的僵局,提出了一种全新的防御方案,在基本不影响用户正常使用文档的情况下,同时对恶意文档的防御能力具备通用性,在理论上可以预防所有已知的模板注入类型攻击及同类型的变种攻击、nday漏洞、0day漏洞等攻击手段。
-
公开(公告)号:CN115860281B
公开(公告)日:2023-07-07
申请号:CN202310170296.0
申请日:2023-02-27
Applicant: 之江实验室
IPC: G06Q10/04 , G06Q50/06 , G06N3/0442 , G06N3/045 , G06F18/211 , H02J3/00
Abstract: 本发明公开了一种基于跨实体注意力的能源系统多实体负载预测方法和装置,该方法包括以下步骤:首先对数据预处理,采用特征变量选择网络预测各个实体对特征的依赖性,并通过长短期记忆网络提取时间依赖信息;然后对实体编码;其次使用通过键值查询不同实体间的注意力,以对实体间的相互作用进行编码计算跨实体注意力;再将特征编码输出为负载预测值;通过以上步骤对负载预测网络模型进行训练学习,以获取最终的负载预测网络模型;最后将新的输入特征变量输入负载预测网络模型,即可获取负载预测值。本发明能够高效地对实体的时间特征进行建模并模拟实体间的相关性,量化一个时间窗口内多个实体之间的相关性,大幅提高各个实体负载预测的准确度。
-
公开(公告)号:CN116227474A
公开(公告)日:2023-06-06
申请号:CN202310514835.8
申请日:2023-05-09
Applicant: 之江实验室
IPC: G06F40/247 , G06N20/00
Abstract: 本说明书公开了一种对抗文本的生成方法、装置、存储介质及电子设备,包括:获取用于生成对抗文本的各原始文本,根据预先训练的第一语言模型,确定各原始文本的特征向量,并对各原始文本聚类,得到指定数量的文本簇。然后,从各文本簇中确定代表文本,再确定各代表文本对应的初始对抗文本。然后,根据确定出的代表文本的原始关键词和初始对抗关键词之间的差异,从预设的各思维链提示模板中,确定目标思维链提示模板。之后,根据代表文本和代表文本的初始对抗文本,采用目标思维链提示模板,生成思维链提示文本。将思维链提示文本输入预先训练的第二语言模型,得到目标对抗文本。可以更加灵活地生成对抗文本,减少对抗文本的生成成本。
-
公开(公告)号:CN116089955A
公开(公告)日:2023-05-09
申请号:CN202211528529.1
申请日:2022-12-01
Applicant: 之江实验室
Abstract: 本发明公开了一种基于windows操作系统的系统调用去噪方法及装置,该方法基于提取到的系统调用参数,构造进程‑线程亲子关系图谱和时序图,对线程进行行为分析和过滤,保留在磁盘/内存/注册表/网络层面产生增、删、改行为的线程,并对这些进程产生的系统调用生成了系统调用描述文件。该方法能够有效减少在系统调用分析中原始数据的噪声,同时保留系统调用原有的亲缘和时序关系,使得计算机产生的系统调用能够以文本的形式进行描述和比较。
-
公开(公告)号:CN115953590A
公开(公告)日:2023-04-11
申请号:CN202211597576.1
申请日:2022-12-12
Applicant: 之江实验室
IPC: G06V10/424 , G06V10/764 , G06V10/82 , G06F40/30 , G06F40/289 , G06N3/0442 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种分段式细粒度的商品图像描述生成方法、装置和介质,该方法包括以下步骤:首先构造一个粗粒度的商品图像描述生成框架,由图像特征提取器、文本解码器、映射网络三部分组成;然后针对图像特征提取器以及文本解码器进行预训练,之后通过映射网络对齐语义空间,生成粗粒度的图像描述;其次在公开的商品描述数据集上微调已有的大型文本生成网络;再将粗粒度的图像描述输入微调后的文本生成网络,生成细粒度的商品图像描述;最后可将上述生成的商品描述再次输入网络,直至生成满意的商品图像描述。本发明的商品图像描述生成方法能够提高商品描述的丰富度和细腻度,自动化批量生成细粒度的商品图像描述。
-
公开(公告)号:CN115080748B
公开(公告)日:2022-11-11
申请号:CN202210980591.8
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/205
Abstract: 本发明公开了一种基于带噪标签学习的弱监督文本分类方法和装置,包括如下步骤:S1:获取待标注文本和类别标签集合;S2:确定预训练自然语言模型;S3:获得待标注文本伪标签;S4:初始化文本分类模型,基于伪标签计算分类损失函数;S5:通过带噪标签损失筛选方法得到高置信度数据:将所有待标注文本的分类损失函数按升序排列,筛选前top‑N数据作为高置信度数据;本发明提供了一种基于带噪标签学习的弱监督文本分类方法和装置,解决在仅获取待标注文本和类别标签集合情况下,实现高准确率分类结果,减少文本标注成本。
-
公开(公告)号:CN117235716B
公开(公告)日:2024-02-13
申请号:CN202311508777.4
申请日:2023-11-14
Applicant: 之江实验室
IPC: G06F21/55 , G06F16/16 , G06F16/174
Abstract: 本发明公开了一种OOXML文档模板注入攻击的未知威胁防御方法及装置;通过对文档进行还原,对可能存放恶意攻击载荷的关键文件的XML树再次进行递归,将其可能携带恶意病毒的关键标签进行解析,依据预设的可信度字典及评估算法对其中的威胁标签进行解析、评估、删除或重组,从而破坏黑客构造的恶意文档,使其失去攻击性,让用户可以极大程度避免受钓鱼攻击者的文档模板注入攻击的风险。本发明打破传统杀毒软件只能检测的僵局,提出了一种全新的防御方案,在基本不影响用户正常使用文档的情况下,同时对恶意文档的防御能力具备通用性,在理论上可以预防所有已知的模板注入类型攻击及同
-
公开(公告)号:CN115953590B
公开(公告)日:2024-01-30
申请号:CN202211597576.1
申请日:2022-12-12
Applicant: 之江实验室
IPC: G06V10/424 , G06V10/764 , G06V10/82 , G06F40/30 , G06F40/289 , G06N3/0442 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种分段式细粒度的商品图像描述生成方法、装置和介质,该方法包括以下步骤:首先构造一个粗粒度的商品图像描述生成框架,由图像特征提取器、文本解码器、映射网络三部分组成;然后针对图像特征提取器以及文本解码器进行预训练,之后通过映射网络对齐语义空间,生成粗粒度的图像描述;其次在公开的商品描述数据集上微调已有的大型文本生成网络;再将粗粒度的图像描述输入微调后的文本生成网络,生成细粒度的商品图像描述;最后可将上述生成的商品描述再次输入网络,直至生成满意的商品图像描述。本发明的商品图像描述生成方法能够提高商品描述的丰富度和细腻度,自动化批量生成细粒度的商品图像描述。
-
公开(公告)号:CN117369783A
公开(公告)日:2024-01-09
申请号:CN202311665188.7
申请日:2023-12-06
Applicant: 之江实验室
Abstract: 在本说明书提供的一种安全代码生成模型的训练方法及装置中,根据第一业务需求指令与第一安全代码,确定思维链提示文本,以及将安全提示词、第二业务需求指令以及该思维链提示文本,输入安全代码生成模型,生成第二安全代码。根据第二业务需求指令,通过该安全代码生成模型,生成业务代码,根据该业务代码与该第二安全代码的差异,确定损失,并以损失最小为优化目标训练该安全代码生成模型。通过引入思维链提示文本,使生成的第二安全代码兼顾了安全风险,及以该第二安全代码与业务代码的损失最小为优化目标训练模型,使训练完的安全代码生成模型仅根据业务需求指令,就可生成满足该业务需求且兼顾安全风险的安全代码,节约了代码开发的成本。
-
公开(公告)号:CN115080748A
公开(公告)日:2022-09-20
申请号:CN202210980591.8
申请日:2022-08-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/205
Abstract: 本发明公开了一种基于带噪标签学习的弱监督文本分类方法和装置,包括如下步骤:S1:获取待标注文本和类别标签集合;S2:确定预训练自然语言模型;S3:获得待标注文本伪标签;S4:初始化文本分类模型,基于伪标签计算分类损失函数;S5:通过带噪标签损失筛选方法得到高置信度数据:将所有待标注文本的分类损失函数按升序排列,筛选前top‑N数据作为高置信度数据;本发明提供了一种基于带噪标签学习的弱监督文本分类方法和装置,解决在仅获取待标注文本和类别标签集合情况下,实现高准确率分类结果,减少文本标注成本。
-
-
-
-
-
-
-
-
-