-
公开(公告)号:CN116432042A
公开(公告)日:2023-07-14
申请号:CN202111659455.0
申请日:2021-12-30
Applicant: 中国科学院信息工程研究所
IPC: G06F18/22 , G06F18/241 , G06N3/0464 , G06N3/0442 , G06N3/042 , G06N3/045 , G06F21/10 , G06F21/56 , G06F21/57
Abstract: 本发明提供一种二进制函数相似性检测方法及装置,包括:分别对待检测的两个二进制函数进行预处理,得到各个二进制函数的中间语言序列和控制流程图;基于第一预设神经网络模型,分别对各个二进制函数的中间语言序列进行语义特征提取,得到各个二进制函数的语义特征向量表示,并基于第二预设神经网络模型,分别对各个二进制函数的控制流程图进行结构特征提取,得到各个二进制函数的结构特征向量表示;将每个二进制函数的语义特征向量表示和结构特征向量表示输入到预设多层感知机分类器,得到两个二进制函数的相似性检测结果。本发明的方法有效地解决了语法和结构特征易受干扰等现有技术缺陷,提高了二进制函数相似性检测的精度和鲁棒性。
-
公开(公告)号:CN116431802A
公开(公告)日:2023-07-14
申请号:CN202111653782.5
申请日:2021-12-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F40/284 , G06F18/214 , G06F18/241
Abstract: 本发明提供一种单词识别方法、装置、电子设备及存储介质,该方法包括:将待识别文本输入单词识别模型;利用所述单词识别模型输出所述待识别文本中各个单词的单词类别,所述单词类别包括方面词、方面词子词、观点词、其他词和其他子词中的至少一个;其中,所述单词识别模型为根据多个训练样本训练得到。本发明通过多个训练样本训练得到单词识别模型,并利用该单词识别模型输出得到待识别文本中各个单词的单词类型,能准确识别出待识别文本中各个单词的单词类型,进而能准确得知待识别文本中哪些单词是方面词和观点词。
-
公开(公告)号:CN116150750A
公开(公告)日:2023-05-23
申请号:CN202211659438.1
申请日:2022-12-22
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56
Abstract: 本发明提供一种恶意软件检测方法、装置、电子设备及存储介质,该方法包括:对待检测软件进行动态分析,得到待检测软件的异质图;将待检测软件的异质图输入预设的神经网络模型进行检测,得到检测结果;其中,所述异质图包括系统资源节点和应用程序接口节点,且所述应用程序接口节点指向所述系统资源节点;所述预设的神经网络模型以恶意软件的异质图和正常软件的异质图为样本,以及与恶意软件的异质图和正常软件的异质图相对应的标签训练得到。本发明的目的是解决现有技术在对恶意软件进行检测时,无法有效应对较少的API调用,无法生成有效的API行为图,导致无法对恶意软件进行有效的准确检测的问题。
-
公开(公告)号:CN111680120B
公开(公告)日:2022-06-03
申请号:CN202010367249.1
申请日:2020-04-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/33 , G06F16/953 , G06K9/62
Abstract: 本发明实施例提供了一种新闻类别检测方法及系统,所述方法包括:获取待检测新闻的内容文本和社会属性文本;将内容文本以及社会属性文本输入至新闻类别粗检测模型,得到新闻类别粗检测模型输出的待检测新闻的第一类类别文本。所述方法还包括:将所述第一类类别文本、所述内容文本以及所述社会属性文本输入至新闻类别细检测模型,得到所述新闻类别细检测模型输出的所述待检测新闻的第二类类别文本。通过新闻类别粗检测模型以及细检测模型,实现特征提取、特征融合,并在特征融合时考虑到社会属性文本,使融合结果更加准确,也使得基于融合结果确定的检测结果更准确。
-
公开(公告)号:CN112508849A
公开(公告)日:2021-03-16
申请号:CN202011242471.5
申请日:2020-11-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明实施例提供一种数字图像拼接检测方法及装置,该方法包括:以预设大小的滑动窗口和步长,遍历待检测图像,得到多个图像块;将所述多个图像块,分别输入预设的第一卷积神经网络模型,得到每个图像块的拼接检测结果;若第一卷积神经网络模型判为拼接的图像块数量,占总图像块数量的比例大于预设阈值,则待检测图像为拼接图像;其中,第一卷积神经网络模型,根据已知拼接结果作为标签的图像块,进行训练后得到。该方法通过预设大小的滑动窗口和步长,遍历待检测图像,得到多个图像块,可以使用相对简单的策略进行训练,提高了模型的计算效率。此外,利用深度学习的特征提取及学习方式,大大提高在复杂彩色图像上的检测准确率,泛化能力较强。
-
公开(公告)号:CN108875374B
公开(公告)日:2020-09-25
申请号:CN201810333712.3
申请日:2018-04-13
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56
Abstract: 本发明实施例公开一种基于文档节点类型的恶意PDF检测方法及装置,能有效的提高检测的准确率,加强对模拟攻击的检测能力。方法包括:S1、以节点为单位对待检测的PDF文档进行划分,并对所述待检测的PDF文档的节点进行类型划分,以不同类型节点出现的属性分布为特征,对所述特征进行向量化表达;S2、将所述向量化表达的结果输入预先构建的检测模型,得到所述待检测的PDF文档是否为恶意PDF文档的检测结果。
-
公开(公告)号:CN109858248A
公开(公告)日:2019-06-07
申请号:CN201811601084.9
申请日:2018-12-26
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56
Abstract: 本发明实施例提供一种恶意Word文档检测方法和装置,所述方法包括:提取待检测的Word文档中的可疑代码及负载;根据恶意文档代码特征库对待检测的Word文档中的可疑代码及负载进行扫描和模式匹配,获取待检测的Word文档的特征向量;将所述待检测的Word文档的特征向量输入至恶意文档分类模型中,获取所述恶意文档分类模型输出的分类结果;根据所述分类结果和所述待检测的Word文档的特征向量,生成所述待检测的Word文档的检测报告。本发明实施例有针对性地提取Word文档中嵌入的恶意代码和恶意负载,可节省检测时间,且不受限于Word版本,对代码混淆攻击和未知类型的攻击也有很好的适应能力。
-
公开(公告)号:CN108804921A
公开(公告)日:2018-11-13
申请号:CN201810531207.X
申请日:2018-05-29
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56
CPC classification number: G06F21/563
Abstract: 本发明提供一种PowerShell代码的去混淆方法及装置,所述方法包括:提供目标Office文档自动运行的虚拟环境;利用Hook机制从所述目标Office文档内混淆过的代码中提取出初步去混淆的PowerShell代码;分析所述初步去混淆的PowerShell代码的混淆特征,并根据所述混淆特征对所述初步去混淆的PowerShell代码进行解混淆,获取原始PowerShell代码。本发明通过结合动静态解混淆方法,将混淆过的PowerShell代码从Office文档中提取出来并进行自动解混淆,可显著提高安全分析的效率。
-
公开(公告)号:CN112580624B
公开(公告)日:2023-08-04
申请号:CN202011295447.8
申请日:2020-11-18
Applicant: 中国科学院信息工程研究所
Abstract: 本发明实施例提供一种基于边界预测的多方向文本区域检测方法和装置,该方法包括:确定待测图像;将待测图像输入检测模型,输出文本分数图、上边界分数图、下边界分数图、左边界分数图和右边界分数图;其中,检测模型是基于样本文本图像和对应的文本区域标注框标签、上边界标注框标签、下边界标注框标签、左边界标注框标签和右边界标注框标签进行训练得到的;基于预设的文本分数阈值、上边界分数阈值、下边界分数阈值、左边界分数阈值、右边界分数阈值、所述文本分数图、上边界分数图、下边界分数图、左边界分数图和右边界分数图确定文本区域。本发明实施例提供的方法和装置,实现了多方向的文本区域检测和分离近距离的文本区域。
-
公开(公告)号:CN116434210A
公开(公告)日:2023-07-14
申请号:CN202111666783.3
申请日:2021-12-31
Applicant: 中国科学院信息工程研究所
IPC: G06V20/62 , G06V10/774 , G06V10/764 , G06V10/766 , G06V10/82
Abstract: 本发明提供一种文本检测方法、装置、电子设备及存储介质,文本检测方法,包括:将目标图像输入文本检测模型提取所述目标图像的特征图,并对所述特征图进行初始文本锚框标记以及回归量预测,得到所述目标图像的文本检测结果;其中,所述文本检测模型是基于训练样本、训练样本标签和回归损失函数对训练前的文本检测模型进行训练得到,在所述训练过程中所述回归损失函数中的各个回归变量的权重是根据所述文本检测模型的预测结果适配的,提升了极端长宽比文本回归的效果和文本检测结果的准确性。
-
-
-
-
-
-
-
-
-