-
公开(公告)号:CN115525758A
公开(公告)日:2022-12-27
申请号:CN202210628092.2
申请日:2022-06-06
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于SVM的特定文本大数据分析方法及系统,所述一种基于SVM的特定文本大数据分析方法包括:利用历史特定文本大数据得到历史特定文本大数据特征;利用所述历史特定文本大数据特征获取历史特定文本大数据分析结果,采用SVM的大数据分析系统的技术,全面提高特定文本的分类的准确性和覆盖率,通过在海量数据中实现对特定内容的精准分类,大大提高了特定内容分类的及时性和准确性,从而提高了系统层面对特定内容处理的流转环节,大大提高了应用系统的处理能力。
-
公开(公告)号:CN115238703A
公开(公告)日:2022-10-25
申请号:CN202210616914.5
申请日:2022-06-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/35 , G06N20/00
Abstract: 本发明涉及一种包含历史深度语义特定文本的识别方法及系统,所述一种包含历史深度语义特定文本的识别方法包括:利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定文本初始数据;利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果,通过大数据分析特定文本进行模型训练,并对特定内容的语义特征进行分析筛除,进而进行分类、识别及定性,提升了对于特定文本的识别准确率,避免误差的产生。
-
公开(公告)号:CN114937455B
公开(公告)日:2022-10-11
申请号:CN202210861977.7
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L17/04 , G10L15/187 , G10L17/02 , G10L17/14 , G06K9/62
Abstract: 本公开涉及一种语音检测方法及装置、设备及存储介质,所述方法包括:接收待检测语音,根据待检测语音的编码状态序列中每一个编码状态向量及其对应的权重值确定语义声学特征;将待检测语音输入预先训练好的语音检测模型,将所述语音检测模型的隐藏层的输出作为语音声学特征;拼接所述语义声学特征和所述语音声学特征,并将拼接后的声学特征输入所述语音检测模型的输出层,输出待检测语音是真实的还是伪造的检测结果,结合待检测语音的语义声学特征检测语音的真伪,通过语义声学特征中待检测语音的编码状态向量与解码状态向量之间的相关性,能够结合待检测语音的上下文之间的相关性检测语音的真伪,提高检测的准确性。
-
公开(公告)号:CN114937455A
公开(公告)日:2022-08-23
申请号:CN202210861977.7
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L17/04 , G10L15/187 , G10L17/02 , G10L17/14 , G06K9/62
Abstract: 本公开涉及一种语音检测方法及装置、设备及存储介质,所述方法包括:接收待检测语音,根据待检测语音的编码状态序列中每一个编码状态向量及其对应的权重值确定语义声学特征;将待检测语音输入预先训练好的语音检测模型,将所述语音检测模型的隐藏层的输出作为语音声学特征;拼接所述语义声学特征和所述语音声学特征,并将拼接后的声学特征输入所述语音检测模型的输出层,输出待检测语音是真实的还是伪造的检测结果,结合待检测语音的语义声学特征检测语音的真伪,通过语义声学特征中待检测语音的编码状态向量与解码状态向量之间的相关性,能够结合待检测语音的上下文之间的相关性检测语音的真伪,提高检测的准确性。
-
公开(公告)号:CN114915650A
公开(公告)日:2022-08-16
申请号:CN202210430295.0
申请日:2022-04-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L67/14 , H04L65/1104 , H04L65/65
Abstract: 本发明公开一种基于网元信息聚合的VoIP服务观测视角的判定方法及系统,涉及互联网语音传输服务领域,通过在单一观测点下对被动流量中VoIP网元信息进行聚合分析,进而判断其服务观测位置,可在全局观测点下提供各VoIP服务网元的相关信息,并为全局VoIP会话链路还原提供有效参考。
-
公开(公告)号:CN110188805B
公开(公告)日:2021-02-26
申请号:CN201910414965.8
申请日:2019-05-17
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司 , 长安通信科技有限责任公司
IPC: G06K9/62
Abstract: 一种诈骗群体的识别方法,包括有:步骤一、提取每对疑似诈骗号码和受害人号码之间的通话和短信话单,分别构建通话特征向量和短信特征向量,将所有疑似诈骗号码和受害人号码的通话特征向量和短信特征向量输入诈骗行为特征提取模型,从而获得每对疑似诈骗号码和受害人号码的诈骗特征指纹;其中,诈骗特征指纹用于标识每对疑似诈骗号码和受害人号码之间的诈骗行为程度;步骤二、根据每对疑似诈骗号码和受害人号码的诈骗特征指纹,识别每两个疑似诈骗号码之间的区别度,并将相互之间区别度低的疑似诈骗号码构成一个诈骗群体。本发明属于信息技术领域,能基于通话和短信话单,全面且准确的识别由诈骗行为接近的诈骗号码所构成的诈骗群体。
-
公开(公告)号:CN111641531A
公开(公告)日:2020-09-08
申请号:CN202010399499.3
申请日:2020-05-12
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种基于DPDK的数据包分发和特征提取方法,包括:步骤一、设置多台Worker服务器和1台采集Proxy服务器,并对每台服务器预先进行DPDK环境部署;步骤二、采集Proxy服务器从绑定网卡中读取网络数据包并存入缓冲区中,同时,按照每个数据包的五元组信息,将缓存区中五元组信息相对应的所有数据包分发给其中1台对应的Worker服务器;步骤三、每台Worker服务器从收到的数据包中提取数据特征信息。本发明属于信息技术领域,能有效提高对网络海量数据包的处理效率和正确率。
-
公开(公告)号:CN110942783A
公开(公告)日:2020-03-31
申请号:CN201910978660.X
申请日:2019-10-15
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明涉及一种基于音频多级聚类的群呼型骚扰电话分类方法,该方法包括:S100,将包括有多个音频数据的音频池划分为多个等同分组,将每个分组依次进行特征提取及特征对比,进而执行聚类分析,得到音频聚类;S200,将音频进行语音转写,将语音转写的文本进行关键词库检索对比,得到关键词对比结果;S300,将音频聚类执行音频库检索对比,得到音频聚类结果;S400,对所述关键词对比结果及音频聚类结果进行合并分析,得到自动分类的群呼型骚扰电话。本发明的有益效果为:能够有效检测和发现群呼型骚扰电话;结合关键词、文本转写等手段,对骚扰电话实现了自动分类,节省了人工成本,提高了效率。
-
公开(公告)号:CN110602332A
公开(公告)日:2019-12-20
申请号:CN201910708779.5
申请日:2019-08-01
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
Abstract: 本发明公开了一种通信线路特征提取方法、通信线路识别方法及装置。所述通信线路特征提取方法包括:获取主叫端与被叫端之间的通话音频;对所述通话音频进行处理,以去除所述通话音频中的人声音频;分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征,从而能够准确且高效的提取通信线路特征,进而提高通信线路识别的准确性和高效性,提高电话通信的可靠性。
-
公开(公告)号:CN110248322A
公开(公告)日:2019-09-17
申请号:CN201910572375.8
申请日:2019-06-28
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及一种基于诈骗短信的诈骗团伙识别方法及识别系统,该识别方法包括:实时识别并提取诈骗短信的敏感信息;对该诈骗短信进行通联关系分析,获取预定时间范围内所有相关通讯数据;从所有相关通讯数据中分别提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息;根据所有主叫信息获取诈骗团伙的诈骗地区、诈骗时间、团伙成员、团伙剧本。本发明提取诈骗短信的敏感信息,并获取与诈骗短信同一主叫的有关语音信息进行分析,从而获取以多种方式向被叫信息发送敏感信息的所有主叫信息和主叫语音,对所有主叫信息进行整体分析,以获取诈骗团伙的诈骗地区、诈骗时间、团伙成员等,实现诈骗团伙识别的自动化。
-
-
-
-
-
-
-
-
-