基于多维度混合特征的Android恶意应用检测方法及系统

    公开(公告)号:CN114519187B

    公开(公告)日:2024-11-26

    申请号:CN202210147263.X

    申请日:2022-02-17

    Abstract: 本发明公开了一种基于多维度混合特征的Android恶意应用检测方法及系统,方法包括:获取Android应用数据集,获取对应Android应用的静态特征集合;利用N‑gram模型对静态特征集合进行处理,生成N‑gram操作码特征;利用特征选择算法FB‑SAGA,采用基于频繁度的适应度函数对N‑gram操作码特征进行筛选;将筛选得到的特征与预设的敏感权限数据库和敏感API数据库进行比对,并与N‑gram操作码特征生成特征矩阵;将特征矩阵输入已训练完成的机器学习分类模型中进行判别,判定当前Android应用是否为恶意应用。通过本发明的技术方案,提高了Android恶意应用检测的分类准确率和分类效率,有效提高对未知应用的检测能力。

    一种基于购物评论的人格特质分析方法及系统

    公开(公告)号:CN114519091A

    公开(公告)日:2022-05-20

    申请号:CN202210146150.8

    申请日:2022-02-17

    Abstract: 本发明公开了一种基于购物评论的人格特质分析方法及系统,方法包括:获取评论数据构建评论样本数据集,并进行分词及标注,得到实验数据集;将实验数据集向量化后输入LSTM网络模型,得到情感倾向;通过SC‑LIWC词典提取的关键词计算与每个人格维度的皮尔逊相关系数;将实验数据集的特征结合皮尔逊相关系数和情感倾向,输入以KNN、NB和SVM共同构建的人格特质分析融合模型进行训练;针对所需分析的评论数据进行文本特征及情感特征提取,通过LSTM网络模型得到情感倾向量化值,并输入人格特质分析融合模型,输出多标签的人格特质属性。通过本发明的技术方案,实现了对评论数据的情感倾向量化及人格特质分类,为个性推荐提供支持。

    基于多维度混合特征的Android恶意应用检测方法及系统

    公开(公告)号:CN114519187A

    公开(公告)日:2022-05-20

    申请号:CN202210147263.X

    申请日:2022-02-17

    Abstract: 本发明公开了一种基于多维度混合特征的Android恶意应用检测方法及系统,方法包括:获取Android应用数据集,获取对应Android应用的静态特征集合;利用N‑gram模型对静态特征集合进行处理,生成N‑gram操作码特征;利用特征选择算法FB‑SAGA,采用基于频繁度的适应度函数对N‑gram操作码特征进行筛选;将筛选得到的特征与预设的敏感权限数据库和敏感API数据库进行比对,并与N‑gram操作码特征生成特征矩阵;将特征矩阵输入已训练完成的机器学习分类模型中进行判别,判定当前Android应用是否为恶意应用。通过本发明的技术方案,提高了Android恶意应用检测的分类准确率和分类效率,有效提高对未知应用的检测能力。

    基于多模型的搜索引擎数据的用户画像刻画方法及系统

    公开(公告)号:CN113297482A

    公开(公告)日:2021-08-24

    申请号:CN202110530160.7

    申请日:2021-05-14

    Abstract: 本发明公开了一种基于多模型的搜索引擎数据的用户画像刻画方法及系统,方法包括:采用标注的训练样本数据对机器学习分类器和深度学习模型进行训练,并对比不同组合的训练结果,确定针对不同属性分类的最佳模型组合;获取所要刻画画像用户的搜索引擎数据,并通过自然语言处理技术进行特征提取及文本表示;将搜索引擎数据分别输入针对不同属性分类的最佳模型组合;将针对不同属性分类的预测结果作为二阶XGBOOST模型的输入,通过网格搜索方法确定最优参数组合,作为对所要刻画用户的画像。通过本发明的技术方案,合理且高效地挖掘搜索引擎数据中的用户数据,精准地对用户在不同属性分类上实现画像刻画,提高了用户画像刻画的准确率。

    基于多模型的搜索引擎数据的用户画像刻画方法及系统

    公开(公告)号:CN113297482B

    公开(公告)日:2024-03-15

    申请号:CN202110530160.7

    申请日:2021-05-14

    Abstract: 本发明公开了一种基于多模型的搜索引擎数据的用户画像刻画方法及系统,方法包括:采用标注的训练样本数据对机器学习分类器和深度学习模型进行训练,并对比不同组合的训练结果,确定针对不同属性分类的最佳模型组合;获取所要刻画画像用户的搜索引擎数据,并通过自然语言处理技术进行特征提取及文本表示;将搜索引擎数据分别输入针对不同属性分类的最佳模型组合;将针对不同属性分类的预测结果作为二阶XGBOOST模型的输入,通过网格搜索方法确定最优参数组合,作为对所要刻画用户的画像。通过本发明的技术方案,合理且高效地挖掘搜索引擎数据中的用户数据,精准地对用户在不同属性分类上实现画像刻画,提高了用户画像刻画的准确率。

    基于融合模型的多平台商品分类方法及系统

    公开(公告)号:CN114462404A

    公开(公告)日:2022-05-10

    申请号:CN202210130256.9

    申请日:2022-02-11

    Abstract: 本发明公开了一种基于融合模型的多平台商品分类方法及系统,方法包括:爬取多个不同平台的商品样本数据,并分别进行商品类目标签标注以及分词和停词处理,得到各平台的数据集;将多个平台的数据集合并,并划分为训练数据集和测试数据集;采用动态表征模型BERT进行文本向量化表示,分别输入基模型RCNN、CNN和SVM,并采用5折交叉验证方法进行训练和验证,将三个基模型的预测结果合并后输入XGBoost模型,寻至最优参数组合解得到融合模型;将待分类数据输入融合模型,以预测结果作为类目属性,实现商品分类。通过本发明的技术方案,提高了商品分类的精准度,还能同时处理多个不同平台数据,具有更高的泛化能力和更广泛的数据处理能力。

Patent Agency Ranking