基于神经网络表示的神经网络模型后门检测方法及装置

    公开(公告)号:CN118194305A

    公开(公告)日:2024-06-14

    申请号:CN202410459109.5

    申请日:2024-04-16

    Abstract: 本发明提出一种基于神经网络表示的神经网络模型后门检测方法和装置,包括:根据神经网络模型中每个操作单元的操作类型和在计算流图中的位置,提取该神经网络模型的结构特征;根据神经网络模型中每个操作单元的参数矩阵,提取该神经网络模型的参数特征;结合该结构特征和该参数特征,得到该神经网络模型的表示特征;使用该表示特征训练后门检测器,将待后门检测的神经网络模型的表示特征输入训练完成后的后门检测器,得到其是否具有后门的后门检测结果。本发明可应用于图像识别领域,以提高图像分类模型的分类准确性和安全性,避免图像分类模型对特殊图像给出错误图像分类结果。

    人工智能模型的个体公平性度量方法和装置

    公开(公告)号:CN118193995A

    公开(公告)日:2024-06-14

    申请号:CN202410323557.2

    申请日:2024-03-20

    Abstract: 本发明提出一种人工智能模型的个体公平性度量方法,包括:根据人工智能模型的数据的输入数据范围,构建人工智能模型的输入样本集合;从输入样本集合中选择样本构成样本对,计算样本对中两样本间的样本相似性,将样本对中样本分别输入人工智能模型,得到样本对经过人工智能模型处理的结果对,计算结果对中结果间的结果相似性,判断结果相似性和样本相似性的差异绝对值是否低于阈值,若是则为样本对分配代表公平对待的公平性度量结果,否则为样本对分配代表不公平对待的公平性度量结果;重复多次公平性确定步骤,得到公平性报告,公平性报告包含多个样本对及各样本对的公平性度量结果。本发明可揭示和证明人工智能模型算法中存在的个体不公平现象。

Patent Agency Ranking