-
公开(公告)号:CN115630357A
公开(公告)日:2023-01-20
申请号:CN202211320374.2
申请日:2022-10-26
Applicant: 四川大学
IPC: G06F21/55 , G06F16/35 , G06F16/31 , G06F40/295 , G06F40/14 , G06F18/22 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种应用程序越界收集个人信息行为的判定方法,包括:训练Word2vector词嵌入模型;训练命名实体识别模型;训练文本分类模型;确定每种类型的应用程序的基本业务和必要个人信息,形成合规三元组。形成待检测隐私政策文本的XML树结构;计算XML树中节点的title属性值与预定义文本的相似度,若相似度大于阈值,则将该节点中的文本内容作为第二信息;从所述第二信息中提取出业务内容和个人信息类别;利用文本分类模型预测业务内容的业务种类,形成待检测三元组;根据待检测应用程序的类型获取对应的合规三元组,将合规三元组与待检测三元组进行对比。本发明的方法极大提高了对隐私政策文本的解析速度和准确率。
-
公开(公告)号:CN113076543B
公开(公告)日:2022-02-08
申请号:CN202110301718.4
申请日:2021-03-22
Applicant: 四川大学
IPC: G06F21/57 , G06F40/295 , G06V10/774 , G06N3/04 , G06F16/951 , G06F16/33 , G06Q50/00
Abstract: 本发明涉及网络安全领域,为一种针对社交网络中漏洞利用知识库的构建方法,包括:收集社交网络中新出现和近三年的漏洞利用相关文本语料;对原始文本语料进行数据预处理,训练Word2vec词嵌入模型;判别文本语料是否提供漏洞利用代码;提取提供漏洞利用代码的文本语料中的实体信息;汇总实体信息构建漏洞利用知识库。本发明以漏洞利用代码为知识库的核心,为相关从业人员对于漏洞的研究提供一个攻击者的视角,并深入至源代码层面;以社交网络为主要信息来源,结合多种现有网络安全知识库,保证知识库中数据的广覆盖面和高时效性。
-
公开(公告)号:CN113901818A
公开(公告)日:2022-01-07
申请号:CN202111128673.1
申请日:2021-09-26
Applicant: 四川大学
IPC: G06F40/295 , G06F40/211 , G06F16/33 , G06F16/35 , G06F16/901 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明是一种面向威胁情报的实体识别及关系抽取方法,识别的对象为网络空间安全领域威胁情报。本方法主要应用于威胁情报领域,其核心是利用公开威胁情报数据训练图卷积网络实现网络安全实体识别并训练基于注意力引导的图卷积网络实现安全实体关系抽取,并将训练好的模型应用于新的威胁情报命名实体识别和关系抽取。本方法基于图卷积神经网络和注意力引导的图卷积神经网络实现了面向威胁情报的实体识别及关系抽取方法,为威胁情报实体识别及关系抽取提供了新的解决方法。
-
公开(公告)号:CN113901467A
公开(公告)日:2022-01-07
申请号:CN202111138074.8
申请日:2021-09-27
Applicant: 四川大学
Abstract: 本发明公开了一种针对Python开源库中潜藏恶意软件包的挖掘方法,属于计算机网络安全技术领域,该方法包括:基于Python开源库,下载当前可被获取的软件包及软件包元信息;利用抽象语法树获取完整安装时运行代码,结合正则匹配提取软件包代码特征;利用Levenshtein距离提取软件包名称特征;按照三折、五折和十折反向交叉验证将特征集输入至随机森林模型进行软件包的判定;对机器学习模型判定为异常的软件包进行人工审查,最终得到恶意软件包列表。本发明可发现整个Python开源库中存在的潜在恶意包,能够有效地预防和化解未知风险,减小人工审查的范围,缩减人工审查成本。
-
公开(公告)号:CN110717049B
公开(公告)日:2020-12-04
申请号:CN201910805363.5
申请日:2019-08-29
Applicant: 四川大学 , 中国科学院信息工程研究所
Abstract: 本发明为一种面向文本数据的威胁情报知识图谱构建方法。实现了从文本威胁情报数据中自动化提取出关键信息,构建威胁情报知识图谱的功能。提出了一种面向文本数据的威胁情报知识图谱构建方法。该方法首先定义威胁情报领域的本体结构,利用基于多因素的威胁情报命名实体识别模型与基于图神经网络的威胁情报实体关系抽取模型从文本数据中获取威胁情报实体与关系三元组,最后通过图数据库存储信息,构成威胁情报知识图谱。
-
公开(公告)号:CN109190653B
公开(公告)日:2020-06-05
申请号:CN201810744345.6
申请日:2018-07-09
Applicant: 四川大学
Abstract: 本发明依据绝大多数新增恶意代码属于已知的恶意代码家族这一特性,利用病毒库中已有样本的信息辅助恶意代码进行家族同源性分析以实现更准确的家族聚类,并在准确的家族聚类的基础上对同家族的恶意代码构建家族图以可视化的方式了解同一家族内恶意代码的变种之间的演化关系并预测变种的发展方向,为恶意代码的深度分析提供技术支撑。结合恶意代码本身的演化特点,提出了一种支持家族图构建的恶意代码同源性分析模型,通过实验证明该模型的有效性。提出了一种半监督密度聚类算法,通过实验证明该算法可以实现准确的家族聚类,并为未知家族的发现提供线索,提出了一种基于不对称相似度度量的家族演化图构建算法,对每个恶意家族构建演化图,可视化呈现同一家族内恶意样本间的演化关系。
-
公开(公告)号:CN109873800A
公开(公告)日:2019-06-11
申请号:CN201811507260.2
申请日:2018-12-11
Applicant: 四川大学
Abstract: 本发明是基于词向量和LSTM检测SQL注入行为,其主要针对Web应用所面对的最主要威胁——SQL注入攻击。现有的基于规则的SQL注入检测系统存在更新慢,反应慢,容易绕过的缺点。针对SQL注入检测问题,本专利提出了一种基于LSTM神经网络的SQL注入检测模型。该模型利用SQL语句的语义特征,对SQL语句进行语法解析,利用似然比检验构造出SQL语句词向量序列,利用LSTM神经网络对构造的词向量序列进行判定。实验表明,本发明基于词向量和LSTM检测SQL注入行为可以有效的判别SQL注入攻击。
-
公开(公告)号:CN109766693A
公开(公告)日:2019-05-17
申请号:CN201811507251.3
申请日:2018-12-11
Applicant: 四川大学
Abstract: 本发明中,我们提出了一种基于深度学习(称为DeepXSS)检测XSS攻击的新方法。首先,我们对输入的数据集进行预处理,预处理的步骤包括:解码、范化、标记。然后,我们使用word2vec提取标记后的XSS有效载荷的特征,捕获字序信息并将每个有效载荷映射到特征向量。最后,我们使用长期短期记忆(LSTM)递归神经网络训练和测试检测模型。实验结果表明,相比于之前常用的XSS攻击检测方法,基于深度学习的XSS检测模型在实际数据集中的准确率达到99.5%,召回率达到97.9%,这表明该方法能够有效识别XSS攻击。
-
公开(公告)号:CN109753798A
公开(公告)日:2019-05-14
申请号:CN201811507276.3
申请日:2018-12-11
Applicant: 四川大学
Abstract: 基于Web的远程访问木马是一种用于网络入侵的工具,可以上传到网站以访问Web服务管理权限。一旦攻击者成功注入,就会造成巨大的破坏,因此有效地检测Webshell至关重要。通过使用混淆技术,Webshell具有灵活性和可变性,这增加了检测的难度。本发明提出了一种PHP Webshell检测模型,该模型基于FastText算法和随机森林算法,称为FRF-WD,而PHP操作码序列将作为Webshell检测的重要特征。本发明设计的模型具有较高的检测率和较低的误报率。
-
公开(公告)号:CN108763920A
公开(公告)日:2018-11-06
申请号:CN201810499721.X
申请日:2018-05-23
Applicant: 四川大学
IPC: G06F21/46
CPC classification number: G06F21/46
Abstract: 本发明设计了一种基于多模型的集成学习的口令评估模型。首先,使用真实的口令训练集训练多个现有的口令评估模型作为子模型;其次,将多个经过训练的子模型作为基学习器进行集成学习,采用偏弱项投票法的结合策略实现各个子模型的优势集成;最后,实现一个以高准确性为前提的通用口令评估模型。基于多模型集成学习模型针对不同复杂程度的口令进行口令强度评估,其评估结果准确率高、通用性强,基于多模型集成学习在口令评估方面具有较好的适用性。
-
-
-
-
-
-
-
-
-