面向API异常检测的数据集生成方法及系统

    公开(公告)号:CN118245796A

    公开(公告)日:2024-06-25

    申请号:CN202410279277.6

    申请日:2024-03-12

    Abstract: 本发明公开一种面向API异常检测的数据集生成方法及系统,属于API异常检测技术领域。所述方法包括:构建包含正常样本和异常样本的专家数据集,并初始化一合成数据集;在专家数据集和合成数据集中进行样本采样,并基于生成的示例数据集引导大模型学习示例的格式特征后,得到伪造数据样本;生成伪造数据样本的第一质量分数;生成伪造数据样本的第二质量分数;根据第一质量分数和第二质量分数对伪造数据样本进行筛选,并将筛选结果放入到合成数据集中;循环上述步骤,直至得到最终数据集。本发明可以利用已有的小规模API请求专家数据集和大语言模型生成大量高质量的API异常检测数据集。

    一种基于强化对比学习微调的跨域小样本关系抽取方法和系统

    公开(公告)号:CN116561308A

    公开(公告)日:2023-08-08

    申请号:CN202310358885.1

    申请日:2023-04-06

    Abstract: 本发明涉及一种基于强化对比学习微调的跨域小样本关系抽取方法和系统。该方法包括:利用预训练语言模型和特定领域知识库,采用训练集和验证集训练得到预训练的特征提取模型;利用测试集中支持集的少量新类样本,通过类别感知层和数据增强层进行增强后,利用对比学习损失函数对预训练的特征提取模型和类别感知层进行微调;将待处理的查询实例通过预训练的特征提取模型提取特征,并通过类别感知层进行增强,计算增强后的查询实例与各个类别原型之间的相似度,选择最相似的类别原型所属的类别作为查询实例的关系类别。本发明能够弥合不同领域之间的语义空间差距,并从新类中学习新的类敏感信息,能够有效提高关系预测的准确度。

Patent Agency Ranking