-
公开(公告)号:CN110704612A
公开(公告)日:2020-01-17
申请号:CN201910732451.7
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35 , G06F16/31 , G06F40/216 , G06F40/30 , G06Q50/00
Abstract: 本发明提出了一种社交群体发现方法、装置和存储介质,用以提高社交群体发现精度和准确度。所述社交群体发现方法,包括:利用预先设定的种子用户和约束条件,从通信数据源中查找候选用户,所述候选用户包括与所述种子用户通信的第一用户和/或满足所述约束条件的第二用户;从所述候选用户的通信数据中提取与所述种子用户关联的关联特征信息;根据提取的关联特征信息,确定每一候选用户对应的置信度;确定对应的置信度大于预设阈值的候选用户为目标用户;根据目标用户之间的通信联系建立初始群体网络;利用群体发现算法从所述初始群体网络中发现社交群体子网络。
-
公开(公告)号:CN110674673A
公开(公告)日:2020-01-10
申请号:CN201910697979.5
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种视频关键帧抽取方法、装置和存储介质,用以减少视频处理过程中的冗余信息,提高视频处理速度。所述视频关键帧抽取方法,包括:从待分析视频中提取I帧;针对提取的每一I帧,利用深度哈希网络确定其对应的深度哈希码,所述深度哈希网络为利用预先生成的图像样本对进行训练得到的;根据各I帧对应的深度哈希码,分别确定两两I帧深度哈希码之间的汉明距离;根据两两I帧深度哈希码之间的汉明距离,对提取的I帧进行聚类;针对每一聚类,分别确定该聚类中包含的每一I帧的信息熵;从每一聚类中,提取信息熵最大的I帧组成所述待分析视频的关键帧。
-
公开(公告)号:CN110674390A
公开(公告)日:2020-01-10
申请号:CN201910747703.3
申请日:2019-08-14
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/9535 , G06F16/9536
Abstract: 本发明公开了一种基于置信度的群体发现方法及装置,所述方法包括:步骤1,设置群体的约束条件,基于所述约束条件生成群体的候选用户集及候选网络;步骤2,基于所述候选用户集及所述候选网络综合得到每个候选用户属于该群体的置信度;步骤3,根据所述候选用户的置信度,与预先设置的置信度阈值进行比较,发现新种子用户和新候选用户;步骤4,获取新种子用户,重复执行步骤1-4直到达到预先设置的迭代次数。
-
公开(公告)号:CN109359301A
公开(公告)日:2019-02-19
申请号:CN201811219240.5
申请日:2018-10-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/27 , G06F16/35 , G06F16/958
Abstract: 本发明公开了一种网页内容的多维度标注方法及装置,该方法包括:将待标注的网页内容文本转换为词向量;根据词向量,进行卷积神经网络分类,并将分类结果作为第一类维度标注结果;对待标注的网页内容进行第二类维度实体识别,得到第二类维度实体词;构建第二类维度规则知识库;将第二类维度实体词与第二类维度规则知识库进行匹配,得到第二类维度标注结果。本发明从网页的内容出发,利用有监督的深度学习分类方法卷积神经网络对第一类维度进行标注,解决了传统基于词频统计分类方法分类准确率低的问题;利用命名实体识别和规则知识库对第二类维度进行标注,丰富了网页的标注内容,提升了用户体验。
-
公开(公告)号:CN119600625A
公开(公告)日:2025-03-11
申请号:CN202510143447.2
申请日:2025-02-10
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及自然语言处理技术领域,提供一种变体词识别方法及装置,所述方法包括:对待识别文本进行分词,得到至少一个文本分词;对各文本分词进行文本图像生成,得到各文本分词对应的分词图像;基于各文本分词的编码特征,以及对应分词图像的编码特征,得到各文本分词的变体词识别结果。本发明结合各文本分词的编码特征以及对应分词图像的编码特征,可以融合文本语义与视觉细节信息,将文本模态的文本分词和图像模态的分词图像对齐到同一语义空间,更全面地理解和识别变体词,有效提升了变体词识别的准确率。
-
公开(公告)号:CN114817661B
公开(公告)日:2024-08-13
申请号:CN202210448777.9
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9035 , G06F18/22 , G06F18/23 , G06F18/24
Abstract: 本发明涉及一种基于IP地址画像的大规模IP自动分类方法,本方法首先基于各个IP画像的相似度关系构建图结构,由此确定核心的IP节点,对于新加入的节点,本方法对其进行分类的计算复杂度为O(n),n为核心节点的数量,因此适用于大规模IP数据的线上实时处理。同时,本方法在进行IP分类结果的更新时,会将之前的核心节点与新抽样的节点混合起来重新聚类,这一过程在一定程度上保证了各IP群体的核心稳定性,同时又能较好地反映它们的实时变化。本发明还涉及一种基于IP地址画像的大规模IP自动分类装置和存储介质。
-
公开(公告)号:CN115190217B
公开(公告)日:2024-03-26
申请号:CN202210801788.0
申请日:2022-07-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04N1/44 , H04N19/60 , H04L9/40 , G06T9/00 , G06F21/60 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种融合自编码网络的数据安全加密方法和装置,涉及互联网数据处理技术领域。本发明为了解决现有数据安全加密时面对包含大量图片的海量数据存储资源开销大、数据传输不安全、数据传输效率低的缺陷,其方法为采用文本加密模块对文本类型数据作加密处理,构建图片自编码网络模型,采用图片压缩模块对待加密的原始图片类型数据作预压缩处理;采用图片加密模块对图片压缩编码作加密处理,采用解密模块对需要应用于下游任务的文本密文数据或图片密文数据进行解密,采用图片重建模块对解密后的图片压缩编码进行重建复原,译码器将码字通过重建处理后得到重建图片类型数据。本发明主要用于海量数据传输。
-
公开(公告)号:CN117591119A
公开(公告)日:2024-02-23
申请号:CN202311441226.0
申请日:2023-11-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。
-
公开(公告)号:CN116962996B
公开(公告)日:2024-01-16
申请号:CN202311222480.1
申请日:2023-09-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W4/12 , H04W4/08 , H04L51/063 , H04L51/214 , H04L51/52 , H04L51/56 , G06N3/006
Abstract: 本发明提供一种基于粒子群算法的信息传播预测方法、装置和设备,属于信息处理技术领域,该方法包括:确定在第一时刻目标信息对应的各个类型的用户的数量;其中,各个类型的用户对目标信息的信任程度和/或传播方式不同;根据第一时刻目标信息对应的各个类型的用户的数量和信息传播模型,确定目标信息的传播预测结果;目标信息的传播预测结果中包括在第二时刻目标信息对应的各个类型的用户的数量;信息传播模型用于对信息在传播过程中各个类型用户数量的变化情况进行预测。本发明的方法实现了对目标信息传播过程中各类型用户数量变化情况的准确预测,提升了信息传播预测结果的准确性。
-
公开(公告)号:CN116628515A
公开(公告)日:2023-08-22
申请号:CN202310538586.6
申请日:2023-05-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/22 , G06F18/25 , G06N3/0464 , G06N3/08 , G06F17/16
Abstract: 本发明涉及社交网络技术领域,尤其为基于同空间用户特征传递的多网络身份对齐系统及方法,包括:数据采集模块:用于采集社交网络中的用户数据;身份学习模块:用于通过搭建网络拓扑结构与采集的用户数据相结合进行用户的多社交网络身份学习;身份传递模块:用于通过网络拓扑结构将用户数据进行多社交网络传递;向量生成模块:用于通过所述网络拓扑结构和用户数据获取多社交网络用户在同一个空间上的用户向量;身份对齐模块:用于通过相似度算法实现对未标注的潜在锚链路进行用户身份对齐。本发明利用自注意力机制,对用户的不同属性特征进行学习、融合,进行锚链路对齐判别,对用户的不同属性信息进行有效地整合与协调,进一步提高了用户身份的对齐准确性。
-
-
-
-
-
-
-
-
-