-
公开(公告)号:CN118349820A
公开(公告)日:2024-07-16
申请号:CN202410529092.6
申请日:2024-04-29
Applicant: 中国科学院信息工程研究所
IPC: G06F18/211 , G06F18/214 , G06F18/2431 , G06F18/22 , G06N3/0455 , G06N3/084 , G06N3/094 , G06F40/30 , G06F16/35 , G06N3/048
Abstract: 本发明涉及一种基于协同自适应特征变换的跨域小样本关系抽取方法和系统。该方法包括:对支持集、查询集中的样本进行编码,得到样本的初步特征;将编码得到的样本的初步特征输入域感知变换模块,所述域感知变换模块利用目标域数据的分布特征对源域数据进行特征变换,得到领域感知特征;利用领域感知特征,通过协同自适应原型网络计算出支持集中各个类别的关系原型特征;计算查询样本与各个类别的关系原型特征之间的距离,选择距离最近的关系原型特征所属的类别作为查询样本的关系类别。本发明能够提高模型在不同领域间的泛化能力,能够显著提升模型对于目标域特征的理解和适应性,从而能够在目标域中获得更好的性能。
-
公开(公告)号:CN118245796A
公开(公告)日:2024-06-25
申请号:CN202410279277.6
申请日:2024-03-12
Applicant: 中国科学院信息工程研究所
IPC: G06F18/214 , G06F18/24 , G06N20/00 , G06F11/34
Abstract: 本发明公开一种面向API异常检测的数据集生成方法及系统,属于API异常检测技术领域。所述方法包括:构建包含正常样本和异常样本的专家数据集,并初始化一合成数据集;在专家数据集和合成数据集中进行样本采样,并基于生成的示例数据集引导大模型学习示例的格式特征后,得到伪造数据样本;生成伪造数据样本的第一质量分数;生成伪造数据样本的第二质量分数;根据第一质量分数和第二质量分数对伪造数据样本进行筛选,并将筛选结果放入到合成数据集中;循环上述步骤,直至得到最终数据集。本发明可以利用已有的小规模API请求专家数据集和大语言模型生成大量高质量的API异常检测数据集。
-
公开(公告)号:CN116561308A
公开(公告)日:2023-08-08
申请号:CN202310358885.1
申请日:2023-04-06
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/36 , G06F18/214 , G06F18/22 , G06F18/25 , G06N3/0499 , G06N3/092
Abstract: 本发明涉及一种基于强化对比学习微调的跨域小样本关系抽取方法和系统。该方法包括:利用预训练语言模型和特定领域知识库,采用训练集和验证集训练得到预训练的特征提取模型;利用测试集中支持集的少量新类样本,通过类别感知层和数据增强层进行增强后,利用对比学习损失函数对预训练的特征提取模型和类别感知层进行微调;将待处理的查询实例通过预训练的特征提取模型提取特征,并通过类别感知层进行增强,计算增强后的查询实例与各个类别原型之间的相似度,选择最相似的类别原型所属的类别作为查询实例的关系类别。本发明能够弥合不同领域之间的语义空间差距,并从新类中学习新的类敏感信息,能够有效提高关系预测的准确度。
-
-