-
公开(公告)号:CN112214764B
公开(公告)日:2024-01-09
申请号:CN202010935440.1
申请日:2020-09-08
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56 , G06F21/64 , G06F18/241 , G06F18/22 , G06F18/214 , H04L9/40 , H04L9/32
Abstract: 本发明实施例提供一种面向复杂网络恶意程序分类方法及系统,该方法包括:获取网络恶意程序在预设时间内的完整网络流量,将所述完整网络流量划分为若干网络活动,对所述若干网络活动进行网络活动刻画,得到网络综合行为画像模型;通过行为距离度量函数和预设聚类算法,将所述网络综合行为画像模型中获取的样本网络行为特点生成行为签名;基于所述行为签名分别对已知恶意网络训练样本和未知测试样本进行整体相似度计算,得到未知网络恶意程序的类别归属。本发明实施例通过对网络恶意程序进行综合行为画像分类,细致全面地刻画复杂网络恶意程序的行为特点,进而做出正确的类别归属判断,且该分类方法不针对特定网络活动、协议及格式,适用性强。
-
公开(公告)号:CN112580624B
公开(公告)日:2023-08-04
申请号:CN202011295447.8
申请日:2020-11-18
Applicant: 中国科学院信息工程研究所
Abstract: 本发明实施例提供一种基于边界预测的多方向文本区域检测方法和装置,该方法包括:确定待测图像;将待测图像输入检测模型,输出文本分数图、上边界分数图、下边界分数图、左边界分数图和右边界分数图;其中,检测模型是基于样本文本图像和对应的文本区域标注框标签、上边界标注框标签、下边界标注框标签、左边界标注框标签和右边界标注框标签进行训练得到的;基于预设的文本分数阈值、上边界分数阈值、下边界分数阈值、左边界分数阈值、右边界分数阈值、所述文本分数图、上边界分数图、下边界分数图、左边界分数图和右边界分数图确定文本区域。本发明实施例提供的方法和装置,实现了多方向的文本区域检测和分离近距离的文本区域。
-
公开(公告)号:CN116434210A
公开(公告)日:2023-07-14
申请号:CN202111666783.3
申请日:2021-12-31
Applicant: 中国科学院信息工程研究所
IPC: G06V20/62 , G06V10/774 , G06V10/764 , G06V10/766 , G06V10/82
Abstract: 本发明提供一种文本检测方法、装置、电子设备及存储介质,文本检测方法,包括:将目标图像输入文本检测模型提取所述目标图像的特征图,并对所述特征图进行初始文本锚框标记以及回归量预测,得到所述目标图像的文本检测结果;其中,所述文本检测模型是基于训练样本、训练样本标签和回归损失函数对训练前的文本检测模型进行训练得到,在所述训练过程中所述回归损失函数中的各个回归变量的权重是根据所述文本检测模型的预测结果适配的,提升了极端长宽比文本回归的效果和文本检测结果的准确性。
-
公开(公告)号:CN116310937A
公开(公告)日:2023-06-23
申请号:CN202211678998.1
申请日:2022-12-26
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种深度伪造视频检测方法、装置、设备及介质,该方法包括:对待检测视频进行视频特征分析,得到待检测视频的视音频特征;将所述待检测视频的视音频特征输入预设的多层感知机分类模型,得出检测结果;其中,所述视音频特征包括视觉特征和音频特征,所述预设的多层感知机分类模型以深度伪造视频的视音频特征和真实视频的视音频特征为样本,以及与深度伪造视频的视音频特征与真实视频的视音频特征各自对应的标签训练得到。本发明的目的是解决现有技术中无法对深度伪造视频中的伪造的音频和视频进行分别检测的缺陷,导致对深度伪造视频进行检测的准确率不足的问题。
-
公开(公告)号:CN112580624A
公开(公告)日:2021-03-30
申请号:CN202011295447.8
申请日:2020-11-18
Applicant: 中国科学院信息工程研究所
Abstract: 本发明实施例提供一种基于边界预测的多方向文本区域检测方法和装置,该方法包括:确定待测图像;将待测图像输入检测模型,输出文本分数图、上边界分数图、下边界分数图、左边界分数图和右边界分数图;其中,检测模型是基于样本文本图像和对应的文本区域标注框标签、上边界标注框标签、下边界标注框标签、左边界标注框标签和右边界标注框标签进行训练得到的;基于预设的文本分数阈值、上边界分数阈值、下边界分数阈值、左边界分数阈值、右边界分数阈值、所述文本分数图、上边界分数图、下边界分数图、左边界分数图和右边界分数图确定文本区域。本发明实施例提供的方法和装置,实现了多方向的文本区域检测和分离近距离的文本区域。
-
公开(公告)号:CN112488930A
公开(公告)日:2021-03-12
申请号:CN202011156797.6
申请日:2020-10-26
Applicant: 中国科学院信息工程研究所
Abstract: 本发明实施例提供一种基于对抗干扰防护的敏感图像检测方法、装置和电子设备,该方法包括:将待检测图像输入去干扰模型,输出复原后图像;其中,所述去干扰模型是基于样本干扰图像和对应的原始图像标签进行训练后得到的,所述样本干扰图像是在对应的原始图像进行预设干扰处理后得到的;将所述复原后图像输入敏感检测模型,输出待检测图像是否属于敏感图像结果;其中,所述敏感检测模型是基于样本无干扰图像和对应的敏感结果标签进行训练后得到的。本发明实施例提供的方法、装置和电子设备,实现了提高抗干扰能力,适用于在敏感图像中加入不同干扰的不同场景和节约了计算资源。
-
公开(公告)号:CN112235242A
公开(公告)日:2021-01-15
申请号:CN202010935414.9
申请日:2020-09-08
Applicant: 中国科学院信息工程研究所
IPC: H04L29/06
Abstract: 本发明实施例提供C&C信道检测方法及系统,基于白名单方法将待测试流量中正常网络流量进行过滤;基于流量自身相似性以及预设聚类算法将待测试流量归聚为网络活动;通过启发式规则将C&C流量进行标注,得到C&C流量识别结果以及第一C&C信道集合;获取基于迁移学习的C&C信道行为检测模型,将剩余流量部分输入至C&C信道行为检测模型,得到第二C&C信道集合,并综合得到C&C信道检测结果。本发明实施例无需准备与待检测目标相关的C&C训练数据以及预备检测环境下的正常通信训练数据,具备更佳适用性。
-
公开(公告)号:CN111680291A
公开(公告)日:2020-09-18
申请号:CN202010365076.X
申请日:2020-04-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明实施例提供一种对抗样本生成方法、装置、电子设备及存储介质,所述方法包括:分别由恶意文档样本集和良性文档样本集获取第一关联规则和第二关联规则;基于第一预设规则,由第一关联规则与第二关联规则获取约束规则;以攻击样本对对机器学习模型进行迭代攻击,将成功攻击机器学习模型的攻击样本作为对抗样本,其中在每轮迭代攻击前基于约束规则对攻击样本进行迭代修改。通过分别获取恶意文档的第一关联规则与良性文档的第二关联规则,获得由两类特征指示的约束规则,进而以此生成具有更高通用性的对抗样本,使其适用于更多种类的检测器。
-
公开(公告)号:CN106951437B
公开(公告)日:2019-11-01
申请号:CN201710072161.5
申请日:2017-02-08
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332
Abstract: 本发明提供一种适于多个中文敏感词句的识别处理方法及装置,该方法包括:获取多个预设的敏感词句;根据所述敏感词句建立后缀树;获取待识别中文文本;根据所述后缀树对所述待识别中文文本进行匹配;若匹配成功后,获取所述待识别中文本中的敏感词句并输出显示,该方法针对中文的特点,把模式串在后缀树上的匹配时间由提高到达到节省时间和提高模式串在后缀树上的匹配速度,适用于多个敏感词句的中文模式串匹配。
-
公开(公告)号:CN106778278B
公开(公告)日:2019-09-10
申请号:CN201710081580.5
申请日:2017-02-15
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56
Abstract: 本发明提供了一种恶意文档检测方法及装置。该方法包括:根据统一化处理后的各个文档类型的文档的结构特征和元数据特征建立机器学习模型;获取待检测文档的结构特征和元数据特征;采用通用的结构特征模型表示所述待检测文档的结构特征,采用通用的元数据特征模型表示所述待检测文档的元数据特征;根据所述机器学习模型对所述待检测文档进行检测。本发明实施例通过将待检测文档采用通用的模型进行特征表示,可以实现对不同文档类型的文档的检测,无需针对各种文档类型建立机器学习模型,提高了文档检测的效率。
-
-
-
-
-
-
-
-
-