-
公开(公告)号:CN110188805B
公开(公告)日:2021-02-26
申请号:CN201910414965.8
申请日:2019-05-17
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
IPC: G06K9/62
Abstract: 一种诈骗群体的识别方法,包括有:步骤一、提取每对疑似诈骗号码和受害人号码之间的通话和短信话单,分别构建通话特征向量和短信特征向量,将所有疑似诈骗号码和受害人号码的通话特征向量和短信特征向量输入诈骗行为特征提取模型,从而获得每对疑似诈骗号码和受害人号码的诈骗特征指纹;其中,诈骗特征指纹用于标识每对疑似诈骗号码和受害人号码之间的诈骗行为程度;步骤二、根据每对疑似诈骗号码和受害人号码的诈骗特征指纹,识别每两个疑似诈骗号码之间的区别度,并将相互之间区别度低的疑似诈骗号码构成一个诈骗群体。本发明属于信息技术领域,能基于通话和短信话单,全面且准确的识别由诈骗行为接近的诈骗号码所构成的诈骗群体。
-
公开(公告)号:CN111785253A
公开(公告)日:2020-10-16
申请号:CN202010554156.X
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种分布不均衡的语种识别方法及系统,该方法包括如下步骤:步骤SS1:训练步骤,具体包括:对各语种的语音数据进行BN特征提取,生成的特征参数输入语种识别系统生成语种识别模型;步骤SS2:识别步骤,具体包括:加载步骤SS1获得的语种识别模型,对待识别的语音做判别,输出识别结果。通过本发明,使语种识别可以在分布不均衡的数据环境下同样产生有效作用,解决现有通用技术下的语种识别问题。
-
公开(公告)号:CN111641531A
公开(公告)日:2020-09-08
申请号:CN202010399499.3
申请日:2020-05-12
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种基于DPDK的数据包分发和特征提取方法,包括:步骤一、设置多台Worker服务器和1台采集Proxy服务器,并对每台服务器预先进行DPDK环境部署;步骤二、采集Proxy服务器从绑定网卡中读取网络数据包并存入缓冲区中,同时,按照每个数据包的五元组信息,将缓存区中五元组信息相对应的所有数据包分发给其中1台对应的Worker服务器;步骤三、每台Worker服务器从收到的数据包中提取数据特征信息。本发明属于信息技术领域,能有效提高对网络海量数据包的处理效率和正确率。
-
公开(公告)号:CN110602332A
公开(公告)日:2019-12-20
申请号:CN201910708779.5
申请日:2019-08-01
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
Abstract: 本发明公开了一种通信线路特征提取方法、通信线路识别方法及装置。所述通信线路特征提取方法包括:获取主叫端与被叫端之间的通话音频;对所述通话音频进行处理,以去除所述通话音频中的人声音频;分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征,从而能够准确且高效的提取通信线路特征,进而提高通信线路识别的准确性和高效性,提高电话通信的可靠性。
-
公开(公告)号:CN110177179A
公开(公告)日:2019-08-27
申请号:CN201910410802.2
申请日:2019-05-16
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种基于图嵌入的诈骗号码识别方法,包括:基于用户在一段时间内的通话信令,计算用户的通话特征指标,并构成每个用户的通话特征指标向量,同时,提取和用户在一段时间内存在通话关系的联系人作为用户的直接邻居,构成每个用户的直接邻居组;构建、并训练识别诈骗号码的图嵌入神经网络,其输入是目标用户和多个关联用户的通话特征指标向量,输出是标识目标用户号码是否是疑似诈骗号码的标签信息;将待识别的目标用户和多个关联用户的通话特征指标向量输入训练后的图嵌入神经网络,然后根据输出判断待识别的目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能基于诈骗电话“多点—点”的通联关系结构模式来实现诈骗号码的精准识别。
-
公开(公告)号:CN117593679A
公开(公告)日:2024-02-23
申请号:CN202311340257.7
申请日:2023-10-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V40/16 , G06V10/764 , G06V10/25 , G06V10/82 , G06N3/084 , G06N3/0499
Abstract: 本发明提供一种伪造视频检测方法、装置、电子设备及存储介质,涉及计算机技术领域,方法包括:基于待检测视频,确定待检测视频对应的第一判别特征向量和第二判别特征向量;第一判别特征向量表示待检测视频中每帧人脸图像之间的时域特征信息;第二判别特征向量表示待检测视频中每帧人脸图像之间的频域特征信息;基于第一判别特征向量和第二判别特征向量,确定待检测视频对应的目标特征向量;目标特征向量表示融合时域特征信息和频域特征信息的特征信息;基于目标特征向量,确定待检测视频的检测结果。通过时域特征信息和频域特征信息的融合,能够准确确定待检测视频的检测结果,提升了待检测视频的检测精度。
-
公开(公告)号:CN111625661B
公开(公告)日:2023-09-08
申请号:CN202010408234.5
申请日:2020-05-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/45 , G06F16/483 , H04N21/845 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/084
Abstract: 本发明实施例公开了一种音视频片段分类方法及装置,所述方法包括:基于待分类音视频片段的视频帧序列提取目标视频帧,基于待分类音视频片段的音频帧序列提取目标音频帧;基于目标视频帧/目标音频帧的第一出现时刻/第二出现时刻及预设子片段时长确定第一音视频子片段/第二音视频子片段;基于第一音视频子片段/第二音视频子片段提取第一视频分量特征和第一音频分量特征/第二视频分量特征和第二音频分量特征;通过预设音视频分类模型基于第一视频分量特征、第一音频分量特征、第二视频分量特征和第二音频分量特征确定待分类音视频片段的音视频分类结果。采用本发明可以提高音视频分类效率,提高音视频分类的鲁棒性和准确率。
-
公开(公告)号:CN115759043A
公开(公告)日:2023-03-07
申请号:CN202211434726.7
申请日:2022-11-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/30 , G06N3/0464 , G06N3/08 , G06F18/241
Abstract: 本发明涉及一种文档级敏感信息检测模型训练及预测方法,所述训练方法包括:获取训练样本集;使用上下文编码器对所述文档中的每个句子进行编码,得到句子中每个单词的上下文表示,根据所述句子中最短依赖路径上的关系和所述上下文语义的关联强度,生成文档级实体注意力权重图;将所述注意力权重图输入到图卷积神经网络中,得到文档级跨句语义结构,根据所述文档级跨句语义结构,更新所述注意力权重图;将更新后的注意力权重图输入到分类器中,得到分类分数;根据所述分类分数与所述标签计算损失值,根据所述损失值对所述上下文编码器、图卷积神经网络和分类器进行训练,得到训练完成的模型。
-
公开(公告)号:CN115221940A
公开(公告)日:2022-10-21
申请号:CN202210617794.0
申请日:2022-06-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于决策树的历史通讯记录异常行为分析方法及系统,所述一种基于决策树的历史通讯记录异常行为分析方法包括采集历史通讯记录数据进行预处理得到历史通讯记录预处理数据;利用所述历史通讯记录预处理数据得到历史通讯记录异常行为分析结果,结合通话行为和标记库与互联网标记等信息,实现异常电话的精准发现,避免错误捕捉正常用户号码,进而对正常用户实现保护。
-
公开(公告)号:CN113436616B
公开(公告)日:2022-08-02
申请号:CN202110594183.4
申请日:2021-05-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本申请提出一种多领域自适应的端到端语音识别方法,所述方法包括:提取待识别语音的第一特征;将所述第一特征和领域标签输入训练好的端到端语音识别模型;所述领域标签是为所述待识别语音的预先设定的口音标签;基于所述训练好的端到端语音识别模型,根据所述领域标签提取第二特征,将所述第一特征与所述第二特征拼接后进行编码得到第三特征;对所述第三特征进行解码,得到多条候选文本,输出第一文本候选列表,所述第一文本候选列表包括所述多条候选文本。本申请通过使用多领域自适应的方法,利用丰富资源领域预训练模型、多目标领域数据及多目标领域鉴别特征来提升在多个目标领域上的语音识别性能。
-
-
-
-
-
-
-
-
-