基于二进制动态插桩的Android恶意行为动态检测方法

    公开(公告)号:CN109992968A

    公开(公告)日:2019-07-09

    申请号:CN201910225536.6

    申请日:2019-03-25

    Abstract: 本发明涉及基于二进制动态插桩的Android恶意行为动态检测方法,属于计算机与信息科学技术领域。本发明首先将通过Android动态检测框架触发被测软件的所有潜在恶意行为;然后通过动态二进制插桩技术,构建程序对系统API的调用序列,使用N‑Gram模型提取函数的调用时序关系特征;最后,将生成的时序关系特征输入到训练好的GBDT(Gradient Boosting Decision Tree,梯度提升决策树)多分类算法检测模型中,识别恶意软件并将该软件存在的恶意行为进行细粒度分类。本发明使用动态二进制插桩技术,在不需要知道程序源码的情况下提取软件的系统函数调用时序特征,不仅对Android恶意行为检测具有较高的准确率,而且可以将软件的恶意行为分为六类,具有更细致的检测结论粒度,有效提升Android恶意软件的检测效率。

    基于混合神经网络的监督分类方法

    公开(公告)号:CN109978051A

    公开(公告)日:2019-07-05

    申请号:CN201910225643.9

    申请日:2019-03-25

    Abstract: 本发明涉及一种监督分类方法,即基于混合神经网络的监督分类方法,属于计算机与信息科学技术领域。该方法包括:使用K‑means算法完成数据划分的初始化;训练局部NN模型;使用EM算法联合优化门控函数和专家模型;通过随机梯度下降(SGD)更新门控网络参数,重新划分数据,利用新划分的数据子集重新训练局部NN模型;重复以上步骤直到收敛。由于本发明提供的监督分类方法将混合神经网络融合至监督分类,既将具有异质性的数据划分为多个同质性数据子集,在每个子集中学习局部专家模型,有效提高分类准确率,又在分类准确率上优于其他多数监督分类算法。

    一种基于深度学习的Android恶意软件检测方法

    公开(公告)号:CN109271788A

    公开(公告)日:2019-01-25

    申请号:CN201810963774.2

    申请日:2018-08-23

    Abstract: 本发明涉及一种基于深度学习的Android恶意软件检测方法,属于计算机与信息科学技术领域。本发明首先对Android应用软件进行特征提取,然后通过对Android应用文件进行解压缩和反编译等操作提取相关的安全特征。提取的特征包括3个方面:文件结构特征、安全经验特征和Dalvik指令集构成的N-gram统计特征。然后对提取的特征进行数值化处理,构建特征向量。最后基于上述提取的相关特征构建DNN(Deep Neural Network)模型。通过构建的模型对新来的Android软件进行分类和识别。该方法融合了指令集的分析,具有对抗恶意软件混淆的作用,同时基于深度模型的恶意软件检测能够增强特征学习,能够很好地表达大数据的丰富内在信息,更加容易适应不断进化的恶意软件。

    一种基于SinglePass算法的Android恶意软件家族聚类方法

    公开(公告)号:CN109145605A

    公开(公告)日:2019-01-04

    申请号:CN201810963865.6

    申请日:2018-08-23

    CPC classification number: G06F21/562 G06F2221/033

    Abstract: 本发明涉及一种基于SinglePass算法的Android恶意家族聚类方法,属于计算机与信息科学技术领域。本发明首先对Android恶意软件进行行为特征提取,得到该软件的敏感权限、系统Action、系统Category、和敏感系统API调用,将这些作为该软件的行为特征。然后用过滤式方法对构建的特征进行特征选择处理,筛选出相对重要的特征作为下一步分析的特征。最后通过计算软件和已有恶意家族之间的相似度作为家族归属的判定依据。判定过程中首先设定一个相似度阈值,如果相似度超过阈值则选取和所有已有家族中相似度最高的家族作为该恶意软件的家族归属。反之则将该软件划分为新的恶意软件家族。该发明相比于动态分析方法能够有效提高分析效率,发现新的软件恶意家族,具有较大的实用价值。

    基于规则生命周期检测的防火墙自适应能力提升方法

    公开(公告)号:CN108566382A

    公开(公告)日:2018-09-21

    申请号:CN201810233995.4

    申请日:2018-03-21

    Abstract: 本发明涉及基于规则生命周期检测的防火墙自适应能力提升方法,属于计算机与信息科学技术领域。本发明首先对防火墙日志中的匹配缺省规则的次数较多的数据包信息进行提取,根据数据包信息生成新的防火墙规则,将新生成的规则进行合并,把满足条件的新规则添加到规则集中;然后抓取到达防火墙的数据包,对合法的数据包进行入侵行为检测,若有入侵行为则生成警告信息,根据信息生成新规则添加到规则集中;最后,对新规则定期进行生命周期检测,及时删除生命周期结束的规则。本发明在不影响防火墙策略的情况下,分别采用日志分析和入侵检测两种方法生成防火墙规则,并加入了规则周期检测机制,解决了新规则过多造成的规则集臃肿问题,降低了数据包的平均匹配次数,提高了防火墙的过滤效率,有效的实现了防火墙的自适应能力。

    局部话题概率生成正则化自编码文本嵌入表示方法

    公开(公告)号:CN108470025A

    公开(公告)日:2018-08-31

    申请号:CN201810235907.4

    申请日:2018-03-21

    Abstract: 本发明涉及局部话题概率生成正则化自编码文本嵌入表示方法,属于自然语言处理与机器学习领域。本发明首先实现文本集近邻图的构建,包括计算任意文本词对相似性权重、查找文本对的最大加权匹配距离、计算平均化最大加权匹配距离(NMD)相似度、根据NMD结果选择k最近邻并以NMD结果作为边权构建近邻图;然后通过近邻图上直推式多代理随机游走过程构建子空间,进行子空间判定;最后利用子空间的LDA模型生成伪文本,并将伪文本作为正则约束项,与真实文本一起作为自编码网络的重构对象,指导编码网络对抗局部近邻文本话题概率生成结构变化,构建光滑的仿射映射。本发明可以有效保持局部近邻文本话题概率生成结构的光滑性,从而构建光滑的仿射映射函数,增强样本外文本嵌入表示向量的类内紧凑性及类间分离性,提升文本分类、聚类等应用效果。

    基于注意力双层LSTM的长文本情感倾向性分析方法

    公开(公告)号:CN108446275A

    公开(公告)日:2018-08-24

    申请号:CN201810234144.1

    申请日:2018-03-21

    Abstract: 本发明涉及基于注意力双层LSTM的长文本情感倾向性分析方法,属于自然语言处理与机器学习领域。主要为了解决长文本评论篇幅长,正负情感特征离散分布且每个句子的情感语义贡献度不同,导致难以准确判断全文情感倾向的问题。本发明首先利用LSTM学习句子级情感向量表示;然后采用双向LSTM对文档中所有句子的情感语义及句子间的语义关系进行编码,并基于注意力机制对具有不同情感语义贡献度的句子进行权值分配;最后,加权句子级情感向量表示得到长文本的文档级情感向量表示,经过Softmax层得到长文本情感倾向。在Yelp2015和IMDb电影评论语料上实验,结果表明本发明能达到较好的分类效果,进一步提升了情感分类的正确率。

    基于短语袋主题模型的话题发现方法

    公开(公告)号:CN108399162A

    公开(公告)日:2018-08-14

    申请号:CN201810233489.5

    申请日:2018-03-21

    CPC classification number: G06F17/2775 G06F16/35

    Abstract: 本发明涉及基于短语袋主题模型的话题发现方法,属于自然语言处理与机器学习领域,目的是为解决词袋模型丢失词之间的关联信息,以及无法准确反映话题信息的问题。本发明首先利用FP-growth算法快速生成频繁短语,再通过文本数据服从高斯分布的特性挖掘候选短语;然后基于短语袋假设进行主题建模,利用短语中词汇在同一主题下的“主题-词语”概率分布的Sa函数来修正“主题-短语”的概率分布;最后用生成的主题短语表述话题。本发明具有主题分配、话题发现准确率高以及话题表述可读性高等特点,有利于对微博舆情进行监控,具有很好的应用价值和推广价值。

    基于情感词扩充的短文本情感分类方法

    公开(公告)号:CN108376133A

    公开(公告)日:2018-08-07

    申请号:CN201810234391.1

    申请日:2018-03-21

    Abstract: 本发明涉及基于情感词扩充的短文本情感分类方法,属于计算机与信息科学技术领域。本发明首先将评论文本切分成句子集合,利用jieba分词工具进行分词和词性标注,得到预处理结果;其次,针对每一条短文本评论,用维基百科语料训练Glove获得每个词语的词向量,利用词向量计算其他词语与词性为N、V、Adj和Adv的初始情感特征的语义相似度,将语义相近的词扩充至初始情感特征集;然后提出DF-TF-MI,利用词语间统计特征改进传统特征降维方法进行特征降维,得到低维的特征集,再经过情感特征加权;最后将得到的特征向量通过由弱分类器加权组成的RADA算法进行情感倾向性分类。本发明解决了情感词典存在未登录词的问题,同时有效解决了短文本评论有效情感词少导致情感特征稀疏的问题,提升了情感倾向性分析的性能及准确率。

Patent Agency Ranking