-
公开(公告)号:CN115953590A
公开(公告)日:2023-04-11
申请号:CN202211597576.1
申请日:2022-12-12
Applicant: 之江实验室
IPC: G06V10/424 , G06V10/764 , G06V10/82 , G06F40/30 , G06F40/289 , G06N3/0442 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种分段式细粒度的商品图像描述生成方法、装置和介质,该方法包括以下步骤:首先构造一个粗粒度的商品图像描述生成框架,由图像特征提取器、文本解码器、映射网络三部分组成;然后针对图像特征提取器以及文本解码器进行预训练,之后通过映射网络对齐语义空间,生成粗粒度的图像描述;其次在公开的商品描述数据集上微调已有的大型文本生成网络;再将粗粒度的图像描述输入微调后的文本生成网络,生成细粒度的商品图像描述;最后可将上述生成的商品描述再次输入网络,直至生成满意的商品图像描述。本发明的商品图像描述生成方法能够提高商品描述的丰富度和细腻度,自动化批量生成细粒度的商品图像描述。
-
公开(公告)号:CN119939608A
公开(公告)日:2025-05-06
申请号:CN202510423675.5
申请日:2025-04-07
Applicant: 之江实验室
IPC: G06F21/57 , G06F21/56 , G06F11/362
Abstract: 本申请公开了一种代码漏洞检测方法、装置、介质及设备,在获取到样本代码集后,可以识别出样本代码集中包含的各样本代码中的注释信息并删除,得到各脱敏代码,然后,按照预设的调整策略,对每个脱敏代码进行调整,得到与脱敏代码的代码标识相同的至少一个增强代码,后续通过将属于同一代码标识的各代码片段进行组合,可以得到一个代码标识所对应的多个复合代码,进而通过这些复合代码,构建测评集,以通过测评集,对漏洞检测模型进行调整,并通过调整后的漏洞检测模型进行代码漏洞检测,进而在后续的实际应用中,可以显著的提升漏洞检测模型的识别准确性。
-
公开(公告)号:CN119622001B
公开(公告)日:2025-04-25
申请号:CN202510156421.1
申请日:2025-02-12
Applicant: 之江实验室
IPC: G06F16/36 , G06F16/353 , G06F40/279 , G06F40/30
Abstract: 本说明书公开了一种大模型幻觉测评数据生成方法。在此方法中,可以通过实体识别和关系抽取技术,从预先构建的针对不同领域范围的知识库中提取出结构化的知识图谱,进而可以根据知识图谱中各节点之间的连接关系,结合大语言模型生成幻觉测评数据,以对待测试模型针对非直观或模糊信息时的表现进行测评。同时,以原始实体在知识库中对应的文本数据为依据,提供详尽的参考答案,形成文本对。最终得到一套全面的幻觉测评数据集,用以评估待测试模型的理解力和输出信息的准确性。
-
公开(公告)号:CN117369783B
公开(公告)日:2024-02-23
申请号:CN202311665188.7
申请日:2023-12-06
Applicant: 之江实验室
Abstract: 在本说明书提供的一种安全代码生成模型的训练方法及装置中,根据第一业务需求指令与第一安全代码,确定思维链提示文本,以及将安全提示词、第二业务需求指令以及该思维链提示文本,输入安全代码生成模型,生成第二安全代码。根据第二业务需求指令,通过该安全代码生成模型,生成业务代码,根据该业务代码与该第二安全代码的差异,确定损失,并以损失最小为优化目标训练该安全代码生成模型。通过引入思维链提示文本,使生成的第二安全代码兼顾了安全风险,及以该第二安全代码与业务代码的损失最小为优化目标训练模型,使训练完的安全代码生成模型仅根据业务需求指令,就可生成满足该业务需求且兼顾安全风险的安全代码,节约了代码开发的成本。(56)对比文件张晶;黄小锋.基于业务模型和界面模型的代码生成工具.电脑与信息技术.2016,(第02期),全文.
-
公开(公告)号:CN116204879B
公开(公告)日:2023-12-05
申请号:CN202211735828.2
申请日:2022-12-30
Applicant: 之江实验室
IPC: G06F21/56
Abstract: 本申请涉及一种恶意文件检测方法、装置、电子装置及存储介质,该恶意文件检测方法包括:基于文件生成日志,按预设第一周期获取目标的第一特征数据;按预设时间窗口期对第一特征数据进行累积处理,得到第二特征数据;对第一特征数据和第二特征数据进行多维处理,得到目标特征数据;将目标特征数据输入训练完备的预测模型,得到多条预测结果,并将多条预测结果进行合并,得到目标预测结果;根据目标预测结果,判定目标特征数据对应的文件是否为恶意文件。通过本申请,解决了现有恶意文件检测技术无法检测出混淆型的恶意脚本文件,计算机、服务器等设备仍存在被恶意文件破坏风险问题,提高了恶意脚本文件的检测准确度,提高计算机等设备的安全性。
-
公开(公告)号:CN116227474B
公开(公告)日:2023-08-25
申请号:CN202310514835.8
申请日:2023-05-09
Applicant: 之江实验室
IPC: G06F40/247 , G06N20/00
Abstract: 本说明书公开了一种对抗文本的生成方法、装置、存储介质及电子设备,包括:获取用于生成对抗文本的各原始文本,根据预先训练的第一语言模型,确定各原始文本的特征向量,并对各原始文本聚类,得到指定数量的文本簇。然后,从各文本簇中确定代表文本,再确定各代表文本对应的初始对抗文本。然后,根据确定出的代表文本的原始关键词和初始对抗关键词之间的差异,从预设的各思维链提示模板中,确定目标思维链提示模板。之后,根据代表文本和代表文本的初始对抗文本,采用目标思维链提示模板,生成思维链提示文本。将思维链提示文本输入预先训练的第二语言模型,得到目标对抗文本。可以更加灵活地生成对抗文本,减少对抗文本的生成成本。
-
公开(公告)号:CN116630480A
公开(公告)日:2023-08-22
申请号:CN202310862442.6
申请日:2023-07-14
Applicant: 之江实验室
Abstract: 本发明涉及交互式文本驱动图像编辑的方法、装置和电子设备,方法包括获取图像样本并判断图像样本是否合规;将图像样本输入到图像逆向模型得到原始图像逆向特征;获取文本样本并判断文本样本是否合规;将文本样本输入到文本编码器中得到文本特征;将原始图像逆向特征和文本特征输入到多模态融合模型得到编辑图像特征;将编辑图像特征输入到图像生成器得到编辑后图像;询问用户是否继续输入文本样本,若继续,继续获取文本样本;否则输出最终编辑后图像。与现有技术相比,本发明放开了传统编辑场景对于输入文本内容的限制,可实现针对于同一张原始图像进行多次文本输入,渐进式修改对应图像区域,提高图像编辑方法灵活性。
-
公开(公告)号:CN116542224A
公开(公告)日:2023-08-04
申请号:CN202310801935.9
申请日:2023-07-03
Applicant: 之江实验室
IPC: G06F40/157 , G06F40/242 , G06F40/126 , G06F16/33 , G06N3/0464 , G06N3/084
Abstract: 本申请涉及一种Office文档异常检测方法、装置及可读存储介质,该方法包括:基于待检测Office文档运行时产生的系统调用信息,获取操作码序列;基于预先获取的数据字典,将所述操作码序列转换为灰度图;将所述灰度图输入训练完毕的文档异常检测模型,确定所述待检测Office文档是否异常,通过对操作信息的提取和整合并输入文档异常检测模型,得到该Office文档是否存在异常安全风险的结论,避免了模型输入信息长度受限导致的信息丢失,解决了相关技术中存在的通过神经网络模型进行Office文档异常检测准确性较低的问题。
-
公开(公告)号:CN116204879A
公开(公告)日:2023-06-02
申请号:CN202211735828.2
申请日:2022-12-30
Applicant: 之江实验室
IPC: G06F21/56
Abstract: 本申请涉及一种恶意文件检测方法、装置、电子装置及存储介质,该恶意文件检测方法包括:基于文件生成日志,按预设第一周期获取目标的第一特征数据;按预设时间窗口期对第一特征数据进行累积处理,得到第二特征数据;对第一特征数据和第二特征数据进行多维处理,得到目标特征数据;将目标特征数据输入训练完备的预测模型,得到多条预测结果,并将多条预测结果进行合并,得到目标预测结果;根据目标预测结果,判定目标特征数据对应的文件是否为恶意文件。通过本申请,解决了现有恶意文件检测技术无法检测出混淆型的恶意脚本文件,计算机、服务器等设备仍存在被恶意文件破坏风险问题,提高了恶意脚本文件的检测准确度,提高计算机等设备的安全性。
-
公开(公告)号:CN115860281A
公开(公告)日:2023-03-28
申请号:CN202310170296.0
申请日:2023-02-27
Applicant: 之江实验室
IPC: G06Q10/04 , G06Q50/06 , G06N3/0442 , G06N3/045 , G06F18/211 , H02J3/00
Abstract: 本发明公开了一种基于跨实体注意力的能源系统多实体负载预测方法和装置,该方法包括以下步骤:首先对数据预处理,采用特征变量选择网络预测各个实体对特征的依赖性,并通过长短期记忆网络提取时间依赖信息;然后对实体编码;其次使用通过键值查询不同实体间的注意力,以对实体间的相互作用进行编码计算跨实体注意力;再将特征编码输出为负载预测值;通过以上步骤对负载预测网络模型进行训练学习,以获取最终的负载预测网络模型;最后将新的输入特征变量输入负载预测网络模型,即可获取负载预测值。本发明能够高效地对实体的时间特征进行建模并模拟实体间的相关性,量化一个时间窗口内多个实体之间的相关性,大幅提高各个实体负载预测的准确度。
-
-
-
-
-
-
-
-
-