用于身份识别系统的安全评估方法、装置及电子设备

    公开(公告)号:CN118734315A

    公开(公告)日:2024-10-01

    申请号:CN202410770871.5

    申请日:2024-06-14

    Abstract: 本申请涉及身份识别技术领域,公开一种用于身份识别系统的安全评估方法、装置及电子设备。其中,安全评估方法包括:获取待评估身份识别系统的目标攻击数据;其中,目标攻击数据包括语音模仿攻击数据、录音重放攻击数据、语音拼接攻击数据、对抗样本攻击数据中的一种或多种;利用目标攻击数据对待评估身份识别系统进行攻击,获得攻击结果;根据攻击结果对待评估身份识别系统的安全性能进行评估,生成安全评估报告。该方法能够对待身份识别系统进行安全风险评估,以评估待身份识别系统能否有效的防御各种攻击,提升安全风险评估的全面性。

    用于大模型的安全评估方法、安全评估装置及电子设备

    公开(公告)号:CN119691794A

    公开(公告)日:2025-03-25

    申请号:CN202411737631.1

    申请日:2024-11-29

    Abstract: 本申请涉及大模型安全评估技术领域,公开了一种用于大模型的安全评估方法、安全评估装置及电子设备。安全评估方法包括:获取多个领域的测试文本图像对;其中,测试文本图像对包括测试文本和测试图像;根据每个领域对应角色的描述信息和测试文本确定攻击文本,根据测试图像和其对应的攻击文本确定攻击图像,以确定每个领域的攻击文本图像对;对于每个领域将攻击文本图像对输入至待测大模型,获得每个领域的回复信息;采用预先构建的智能分析模型对每个领域的回复信息进行分析,确定待测大模型在多个领域的综合性安全性评估报告。本申请可以提高对大模型的安全评估结果的准确性。

    用于大模型安全防御的方法及装置、电子设备

    公开(公告)号:CN118940276A

    公开(公告)日:2024-11-12

    申请号:CN202410952369.6

    申请日:2024-07-16

    Abstract: 本申请涉及计算机技术领域,公开一种用于大模型安全防御的方法及装置、电子设备,其中,方法包括:对输入内容进行分类,获得目标输入;通过目标大模型,根据目标输入获得目标输出,并根据目标输入和目标输出获得目标输入输出对;对目标输入输出对进行安全性评估,获得不安全输入输出对;根据不安全输入输出对,对目标大模型进行调整,获得调整后的目标大模型。对目标输入输出对进行安全性评估,可以确定目标输入输出对中的不安全输入输出对,根据不安全输入输出对,对大模型进行调整,可以改善大模型对不安全输入的处理过程,减少输出不安全输出的情况,从而加强大模型对有害信息的处理能力。

    用于身份识别系统的安全评估方法、装置及电子设备

    公开(公告)号:CN118839339A

    公开(公告)日:2024-10-25

    申请号:CN202410770867.9

    申请日:2024-06-14

    Abstract: 本申请涉及身份识别技术领域,公开一种用于身份识别系统的安全评估方法、装置及电子设备。其中,安全评估方法包括:获取待评估身份识别系统的目标攻击数据;其中,目标攻击数据包括注入攻击数据、呈现攻击数据、对抗样本攻击数据中的至少一种;利用目标攻击数据对待评估身份识别系统进行攻击,获得攻击结果;根据攻击结果对待评估身份识别系统的安全性能进行评估,生成安全评估报告。本申请提供的安全评估方法能够对待评估身份识别系统进行安全评估,以评估待评估身份识别系统能否有效的防御各种攻击,提升安全风险评估的全面性。

    基于权限感知的大模型响应方法及装置、电子设备

    公开(公告)号:CN120030527A

    公开(公告)日:2025-05-23

    申请号:CN202510050884.X

    申请日:2025-01-13

    Abstract: 本申请涉及大模型技术领域,公开一种基于权限感知的大模型响应方法,包括:在接收到用户请求的情况下,获取用户选择的访问控制方式并设定用户的权限等级;其中,用户的权限等级与访问控制方式相对应;调用经过训练的访问控制模型,并获取访问控制模型的响应;其中,访问控制模型与用户的权限等级相对应;记录用户请求和访问控制模型的响应,以进行审计。该方法增强了大模型的权限感知能力,能够有效防止数据滥用和隐私泄露,并确保用户在权限范围内获得所需的服务。并且,提高了参数的利用效率,降低了计算成本。本申请还公开一种基于权限感知的大模型响应装置及电子设备。

    用于中文大模型的越狱攻击方法及装置、电子设备

    公开(公告)号:CN119441441A

    公开(公告)日:2025-02-14

    申请号:CN202411695254.X

    申请日:2024-11-25

    Abstract: 本申请涉及生成式大模型技术领域,公开一种用于中文大模型的越狱攻击方法,包括:对待输入的攻击问题进行数据增强;将增强后的攻击问题与经过选择的攻击模板进行拼接;将拼接后的数据作为测试模型的输入,对测试模型进行攻击,获得测试模型的输出;其中,测试模型为中文大模型;根据构建的安全评估模型,判定测试模型的输出是否安全,以统计攻击成功率。该方法能够适配中文的攻击场景,提升了中文诱导的能力。还通过统计攻击成功率能够量化攻击的有效性。本申请还公开一种用于中文大模型的越狱攻击装置及电子设备。

    一种基于线上平台的内容安全性能测试方法及装置

    公开(公告)号:CN115827425A

    公开(公告)日:2023-03-21

    申请号:CN202211162672.3

    申请日:2022-09-23

    Abstract: 本申请公开了一种基于线上平台的内容安全性能测试方法,用于远程测试待测试系统,所述方法可以在参测企业将测试脚本上传到线上后,获取所述测试脚本;接着,对所述测试脚本进行检测,确定所述检测结果;再接着,响应于所述检测结果为无误,将测试数据传输至参测企业的待测试系统;然后,响应于所述待测试系统返回内容安全的测试结果,将所述测试结果进行分析得到测试成绩。本申请一方面可以对所述待测试内容安全检测系统进行内容安全性能测试,得到测试成绩,便于对待测试系统的性能进行测试,且测试的评估方法统一;另一方面,安全性能测试能在线上进行测试,方便各企业的待测试系统远程进行测试。

Patent Agency Ranking