-
公开(公告)号:CN117540730A
公开(公告)日:2024-02-09
申请号:CN202311316116.1
申请日:2023-10-10
Applicant: 鹏城实验室
IPC: G06F40/279 , G06F18/24 , G06F16/33 , G06F40/216
Abstract: 本申请实施例提供了一种文本标注方法和装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:获取原始文本和原始标注信息;对原始文本分类得到自动标注信息;接收由标注端对原始文本扩展得到同义文本,根据自动标注信息对同义文本筛选的扩展文本;将扩展文本和原始文本拼接得到候选文本,将自动标注信息和原始标注信息拼接得到候选标注信息;获取候选文本中候选标注信息的标注类别数量;根据标注类别数量对候选标注信息筛选得到目标标注信息;获取目标标注信息的标注比例;若标注比例低于预设比例阈值,生成反馈信息至专家系统以接收专家标注信息;将专家标注信息和候选文本组合得到目标文本数据。本申请实施例能够提高文本标注质量。
-
公开(公告)号:CN120046758A
公开(公告)日:2025-05-27
申请号:CN202510512026.2
申请日:2025-04-23
Applicant: 鹏城实验室
Abstract: 本申请实施例公开一种漏洞与攻击技战术关联分析大模型训练方法、装置及设备。根据网络安全知识图谱确定出每个网络漏洞对应的多个不同层级的关联实体,确定每个网络漏洞对应的网络漏洞特征和每个关联实体的实体特征;根据网络漏洞特征和实体特征确定出每个网络漏洞对应的聚合网络漏洞特征;根据不同聚合网络漏洞特征之间的相似度确定出每个网络漏洞对应的相似聚合网络漏洞特征;根据聚合网络漏洞特征和相似聚合网络漏洞特征确定出每个网络漏洞对应的提示文本并输入漏洞与攻击技战术关联分析大模型中,输出每个网络漏洞的预测安全分析结果;根据每个网络漏洞的标签安全分析结果和预测安全分析结果之间的差异对大模型进行训练,得到训练后的大模型。
-
公开(公告)号:CN117540730B
公开(公告)日:2024-10-18
申请号:CN202311316116.1
申请日:2023-10-10
Applicant: 鹏城实验室
IPC: G06F40/279 , G06F18/24 , G06F16/33 , G06F40/216
Abstract: 本申请实施例提供了一种文本标注方法和装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:获取原始文本和原始标注信息;对原始文本分类得到自动标注信息;接收由标注端对原始文本扩展得到同义文本,根据自动标注信息对同义文本筛选的扩展文本;将扩展文本和原始文本拼接得到候选文本,将自动标注信息和原始标注信息拼接得到候选标注信息;获取候选文本中候选标注信息的标注类别数量;根据标注类别数量对候选标注信息筛选得到目标标注信息;获取目标标注信息的标注比例;若标注比例低于预设比例阈值,生成反馈信息至专家系统以接收专家标注信息;将专家标注信息和候选文本组合得到目标文本数据。本申请实施例能够提高文本标注质量。
-
-