异常话题检测方法、装置
    1.
    发明公开

    公开(公告)号:CN117235640A

    公开(公告)日:2023-12-15

    申请号:CN202311067335.0

    申请日:2023-08-23

    Abstract: 本发明提出一种异常话题检测方法、装置,方法包含:采集社交媒体平台的热搜榜单话题数据作为样本数据,对所述榜单话题数据进行特征表达,确定话题特征,构造特征判定规则模型;对所有话题特征进行聚类,划分自然话题群体、异常话题群体;识别不属于所述自然话题群体和所述异常话题群体的离群异常话题,动态调整话题归属,构造话题归属模型;将待检测话题依次输入至所述特征判定规则模型与话题归属模型,判定是否为异常话题。该方法有效提高了社交媒体平台榜单异常话题的识别精度,进而有效对抗社交媒体中的操纵和攻击。

    一种面向大模型安全评测的评测样本自动生成方法及装置

    公开(公告)号:CN119004104A

    公开(公告)日:2024-11-22

    申请号:CN202411083246.X

    申请日:2024-08-08

    Abstract: 本发明提出一种面向大模型安全评测的评测样本自动生成方法和装置,包括:测评问题集包含多个用于测试大语言模型安全性的评测样本,以具有诱导内容的任务提示为输入,以该任务提示对应的该评测样本标签,微调训练大语言模型输出评测样本,得到评测样本生成模型;根据评测样本的安全风险类别,构建检索问句,检索互联网中属于该安全风险类别的数据资料;根据该安全风险类别以及该数据资料,合成提示文本;从该测评问题集中抽取属于该安全风险类别的评测样本填充至该提示文本后作为任务提示输入该评测样本生成模型,生成用于测试大语言模型的测试样本。

Patent Agency Ranking