-
公开(公告)号:CN105871630B
公开(公告)日:2019-03-05
申请号:CN201610370749.4
申请日:2016-05-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种确定网络用户的上网行为类别的方法,该方法,包括:提取每个待测网络用户的上网行为特征,并通过文档向量空间模型的量化方法形成用户行为特征矩阵X;根据所述用户行为特征矩阵X,通过概率潜在语义分析方法PLSA和EM算法,得到行为倾向集合T以及“用户‑倾向”概率分布矩阵D;根据所述用户行为特征矩阵X,通过支持向量机SVM算法,得到“特征词‑类别”概率分布矩阵C;通过矩阵乘法运行T×C得到“倾向‑类别”映射矩阵M;通过矩阵乘法运行D×M得到“用户‑类别”概率分布矩阵Y;根据任一待测网络用户在各个类别上的概率分布情况,将所述任一待测网络用户分类到概率值最大的类别中。
-
公开(公告)号:CN105871630A
公开(公告)日:2016-08-17
申请号:CN201610370749.4
申请日:2016-05-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种确定网络用户的上网行为类别的方法,该方法,包括:提取每个待测网络用户的上网行为特征,并通过文档向量空间模型的量化方法形成用户行为特征矩阵X;根据所述用户行为特征矩阵X,通过概率潜在语义分析方法PLSA和EM算法,得到行为倾向集合T以及“用户?倾向”概率分布矩阵D;根据所述用户行为特征矩阵X,通过支持向量机SVM算法,得到“特征词?类别”概率分布矩阵C;通过矩阵乘法运行T×C得到“倾向?类别”映射矩阵M;通过矩阵乘法运行D×M得到“用户?类别”概率分布矩阵Y;根据任一待测网络用户在各个类别上的概率分布情况,将所述任一待测网络用户分类到概率值最大的类别中。
-
公开(公告)号:CN104866567A
公开(公告)日:2015-08-26
申请号:CN201510266326.3
申请日:2015-05-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/904
Abstract: 本发明提供一种业务数据呈现方法及装置,用于解决目前业务数据到单一图表的转化方式难以满足用户对业务逻辑、成果的多样化展示的问题。该方法包括:根据预先设置的业务场景模型中各单元格内的业务规则中定义的业务数据获取规则获取待呈现的业务数据的集合;按照所述业务规则中预先设定的与所述各单元格对应的图表类型以图表的形式呈现所述数据集合中对应于所述各单元格的业务数据,该方案使得业务数据得以根据用户的需求被多样化的展示,提升了用户体验。
-
公开(公告)号:CN104573033A
公开(公告)日:2015-04-29
申请号:CN201510020876.7
申请日:2015-01-15
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30876 , G06F17/30887
Abstract: 本发明提出了一种动态URL过滤方法及装置,该方法包括:基于URL标注集创建信息字典;针对URL标注集中的每一个URL,根据所述信息字典生成对应的特征向量,由URL标注集中所有的URL对应的特征向量组成特征矩阵;对URL特征矩阵进行分类得到特征权重向量和二分类阈值;基于所述信息字段对待预测的URL进行特征提取,并基于提取出的特征生成所述待预测的URL的特征向量;将所述待预测的URL的特征向量与所述特征权重向量对应相乘后相加得到目标数值,将目标数值与二分类阈值相比较以判断所述待预测的URL是动态URL还是静态URL。本发明可以离线处理,不需要访问网络、减少了存储,比较节省处理时间和计算资源。
-
公开(公告)号:CN119600625A
公开(公告)日:2025-03-11
申请号:CN202510143447.2
申请日:2025-02-10
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及自然语言处理技术领域,提供一种变体词识别方法及装置,所述方法包括:对待识别文本进行分词,得到至少一个文本分词;对各文本分词进行文本图像生成,得到各文本分词对应的分词图像;基于各文本分词的编码特征,以及对应分词图像的编码特征,得到各文本分词的变体词识别结果。本发明结合各文本分词的编码特征以及对应分词图像的编码特征,可以融合文本语义与视觉细节信息,将文本模态的文本分词和图像模态的分词图像对齐到同一语义空间,更全面地理解和识别变体词,有效提升了变体词识别的准确率。
-
公开(公告)号:CN118277914B
公开(公告)日:2025-01-24
申请号:CN202311471891.4
申请日:2023-11-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2431 , G06F18/24 , G06F18/213 , G06F18/22
Abstract: 本发明涉及APP分类分析技术领域,公开了一种基于动静结合多维度APK特征的移动应用分类方法,首先进行APP特征构建,基于主流手机应用商店、互联网小型分发平台、APP传播页面对APP的信息进行采集,具体通过APP所提供的功能或呈现的信息内容,识别APP的业务分类,采集通信类的信息,形成初始的测试数据集;再基于APP源码进行分析,获取APP的静态源码特征、动态流量和页面特征数据,具体包括名称、流量和内容信息;进行建立规则匹配模型和匹配机制,具体通过构建定时扫描程序,通过预设的各分类规则匹配模型进行识别和研判。本发明对具有显著技术特征或内容特征的APP具有较高的识别准确率,降低人工审核参与度。
-
公开(公告)号:CN114817661B
公开(公告)日:2024-08-13
申请号:CN202210448777.9
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9035 , G06F18/22 , G06F18/23 , G06F18/24
Abstract: 本发明涉及一种基于IP地址画像的大规模IP自动分类方法,本方法首先基于各个IP画像的相似度关系构建图结构,由此确定核心的IP节点,对于新加入的节点,本方法对其进行分类的计算复杂度为O(n),n为核心节点的数量,因此适用于大规模IP数据的线上实时处理。同时,本方法在进行IP分类结果的更新时,会将之前的核心节点与新抽样的节点混合起来重新聚类,这一过程在一定程度上保证了各IP群体的核心稳定性,同时又能较好地反映它们的实时变化。本发明还涉及一种基于IP地址画像的大规模IP自动分类装置和存储介质。
-
公开(公告)号:CN115190217B
公开(公告)日:2024-03-26
申请号:CN202210801788.0
申请日:2022-07-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04N1/44 , H04N19/60 , H04L9/40 , G06T9/00 , G06F21/60 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种融合自编码网络的数据安全加密方法和装置,涉及互联网数据处理技术领域。本发明为了解决现有数据安全加密时面对包含大量图片的海量数据存储资源开销大、数据传输不安全、数据传输效率低的缺陷,其方法为采用文本加密模块对文本类型数据作加密处理,构建图片自编码网络模型,采用图片压缩模块对待加密的原始图片类型数据作预压缩处理;采用图片加密模块对图片压缩编码作加密处理,采用解密模块对需要应用于下游任务的文本密文数据或图片密文数据进行解密,采用图片重建模块对解密后的图片压缩编码进行重建复原,译码器将码字通过重建处理后得到重建图片类型数据。本发明主要用于海量数据传输。
-
公开(公告)号:CN117591119A
公开(公告)日:2024-02-23
申请号:CN202311441226.0
申请日:2023-11-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。
-
公开(公告)号:CN116962996B
公开(公告)日:2024-01-16
申请号:CN202311222480.1
申请日:2023-09-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W4/12 , H04W4/08 , H04L51/063 , H04L51/214 , H04L51/52 , H04L51/56 , G06N3/006
Abstract: 本发明提供一种基于粒子群算法的信息传播预测方法、装置和设备,属于信息处理技术领域,该方法包括:确定在第一时刻目标信息对应的各个类型的用户的数量;其中,各个类型的用户对目标信息的信任程度和/或传播方式不同;根据第一时刻目标信息对应的各个类型的用户的数量和信息传播模型,确定目标信息的传播预测结果;目标信息的传播预测结果中包括在第二时刻目标信息对应的各个类型的用户的数量;信息传播模型用于对信息在传播过程中各个类型用户数量的变化情况进行预测。本发明的方法实现了对目标信息传播过程中各类型用户数量变化情况的准确预测,提升了信息传播预测结果的准确性。
-
-
-
-
-
-
-
-
-