一种针对中文大语言模型毒性和偏见的评估方法

    公开(公告)号:CN119961728A

    公开(公告)日:2025-05-09

    申请号:CN202510054379.2

    申请日:2025-01-14

    Abstract: 本发明公开了一种针对中文大语言模型毒性和偏见的评估方法,包括:获取中文毒性语言数据集;采用中文毒性API进行判断毒性和偏见;确定评估模型的指标,其中,所述指标包括:毒性,偏见和回避率;利用所述中文毒性语言数据集对中文大语言模型进行毒性,偏见和回避程度的评估,从而获取评估结果。该方法提出了一个与测评数据集和模型无关通用评估框架TisEval,可应用于广泛的数据集和模型,该框架来评估大语言模型的毒性和偏见,是首个从毒性和偏见的角度对中文大语言模型进行了全面、系统的研究评估。

    面向深度神经网络剪枝技术的公平性优化及图像分类方法

    公开(公告)号:CN120045895A

    公开(公告)日:2025-05-27

    申请号:CN202510054300.6

    申请日:2025-01-14

    Abstract: 本发明公开了面向深度神经网络剪枝技术的公平性优化及图像分类方法,涉及人工智能安全技术领域,其中公平性优化方法包括:获取训练数据集;通过训练数据集训练初始神经网络模型,获取神经网络模型;对神经网络模型进行剪枝;通过训练数据集和剪枝后的神经网络模型,获取不同敏感属性子组样本的几何度量,并对不同敏感属性子组样本的几何度量进行平均处理,计算极差公平性约束项,利用极差公平性约束项和分类损失项计算总体损失,通过总体损失对剪枝后的神经网络模型进行微调训练,获取目标剪枝模型。本发明能够在特征层面平衡组间性能,以解决现有研究无法在资源有限的终端设备中直接部署和快速与现有剪枝技术集成的不足。

    一种物联网安全管理系统及方法
    3.
    发明公开

    公开(公告)号:CN119449447A

    公开(公告)日:2025-02-14

    申请号:CN202411656231.8

    申请日:2024-11-19

    Inventor: 周广民

    Abstract: 本申请提供了一种物联网安全管理系统及方法,通过网络设备的历史访问记录确定各个网络事件场景下的授权反馈信息;当用户向网络设备发出网络通信请求时,通过用户在网络交互时的信任指数和所有的授权反馈信息确定安全基线;根据各个网络事件场景与网络通信请求之间的事件关联性确定网络设备在网络通信请求中授权的行为可信度,进而通过行为可信度和各个授权反馈信息预测用户在网络通信请求中的事件响应权限;若事件响应权限大于安全基线,则基于安全基线对用户的事件响应权限进行信任约束。基于上述方案可结合物联网中不同的网络事件场景对用户的访问权限进行信任约束,从而可提高物联网中网络通信的安全性。

Patent Agency Ranking