-
公开(公告)号:CN110942783A
公开(公告)日:2020-03-31
申请号:CN201910978660.X
申请日:2019-10-15
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明涉及一种基于音频多级聚类的群呼型骚扰电话分类方法,该方法包括:S100,将包括有多个音频数据的音频池划分为多个等同分组,将每个分组依次进行特征提取及特征对比,进而执行聚类分析,得到音频聚类;S200,将音频进行语音转写,将语音转写的文本进行关键词库检索对比,得到关键词对比结果;S300,将音频聚类执行音频库检索对比,得到音频聚类结果;S400,对所述关键词对比结果及音频聚类结果进行合并分析,得到自动分类的群呼型骚扰电话。本发明的有益效果为:能够有效检测和发现群呼型骚扰电话;结合关键词、文本转写等手段,对骚扰电话实现了自动分类,节省了人工成本,提高了效率。
-
公开(公告)号:CN110602332A
公开(公告)日:2019-12-20
申请号:CN201910708779.5
申请日:2019-08-01
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
Abstract: 本发明公开了一种通信线路特征提取方法、通信线路识别方法及装置。所述通信线路特征提取方法包括:获取主叫端与被叫端之间的通话音频;对所述通话音频进行处理,以去除所述通话音频中的人声音频;分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征,从而能够准确且高效的提取通信线路特征,进而提高通信线路识别的准确性和高效性,提高电话通信的可靠性。
-
公开(公告)号:CN113761903B
公开(公告)日:2025-01-17
申请号:CN202010504536.2
申请日:2020-06-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F40/30 , G06F40/232 , G06F16/35 , G06N3/0464 , G06N3/045
Abstract: 本发明提出一种针对海量高噪音口语化短文本的文本筛选方法,属于自然语言处理领域,通过对训练语料和待筛选的目标文本进行预处理;对预处理后的训练语料中的标注的正类语料进行句式信息提取,区分出业务强相关句式和弱相关句式;利用提取的句式信息对预处理后的目标文本进行句式匹配,将业务强相关句式的匹配结果归为正类文本,对业务弱相关句式的匹配结果进行以下步骤的处理;对目标文本和训练语料都进行文本处理,将处理后的文本转化为词向量表示;使用训练语料的词向量表示训练文本分类模型,将目标文本的词向量表示输入到训练好的文本分类模型中对文本进行分类,实现对目标文本的文本筛选。
-
公开(公告)号:CN113742478B
公开(公告)日:2023-09-05
申请号:CN202010474192.5
申请日:2020-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/33 , G06F40/295 , G06N3/0464
Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。
-
公开(公告)号:CN110266902B
公开(公告)日:2021-04-02
申请号:CN201910444314.3
申请日:2019-05-27
Applicant: 国家计算机网络与信息安全管理中心 , 南京中新赛克科技有限责任公司
Abstract: 本发明公开了一种VoIP信令与媒体数据关联系统、方法及计算机存储介质,系统包括识别过滤装置、解析处理装置、核心关联装置和数据分析反馈装置,方法上采用多维度数据对互联网VoIP网络电话协议信令与媒体数据进行关联。本发明从功能上,既保证了关联结果的高质量性,又保证关联结果的高数量性;从可靠性上,对关联结果的后续分析并将分析结果反馈给关联使用,逐步优化系统的关联效果;从可扩展性上,采用多装置处理的方式,使得需要拓展功能时,只需要修改或者扩展单装置功能而不影响整体的功能以及效果。
-
公开(公告)号:CN110708418A
公开(公告)日:2020-01-17
申请号:CN201910848492.2
申请日:2019-09-09
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
Abstract: 本发明公开了一种识别呼叫方属性的方法及装置,涉及通信技术领域,包括:接收到第二设备的通话请求后,与所述第二设备建立通话连接;获取所述第二设备发送的语音数据;提取所述语音数据的噪声特征,作为待处理噪声特征;所述噪声特征包括以下任意一项或多项:期望、熵和超熵;在预先建立的噪声特征与属性标签的对应关系中,查找所述待处理噪声特征对应的属性标签,作为所述第二设备的第一属性。本发明通过噪声特征来识别呼叫方的属性,相比于现有技术提升了识别准确性。
-
公开(公告)号:CN110556114A
公开(公告)日:2019-12-10
申请号:CN201910684343.7
申请日:2019-07-26
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
Abstract: 本发明公开了一种基于注意力机制的说话人识别方法及装置,包括如下步骤:采集多个被测试通话人的通话录音和测试通话人的通话录音;根据所述被测试通话人对应的通话录音,建立通话人语音库;采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型;存储所述测试通话人的通话录音,获得录音文件;将所述录音文件采用所述训练模型识别所述被测试通话人是否目标通话人。通过采用基于注意力的神经网络对所述被测试通话人语音进行训练,获得训练模型,采用训练模型识别所述被测试通话人,确认了拨号码对应的主人的一致性,避免了由于通话人身份被仿冒带来的通信安全隐患,进一步提高了通话过程中的信息的安全性。
-
公开(公告)号:CN110545359A
公开(公告)日:2019-12-06
申请号:CN201910713518.2
申请日:2019-08-02
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
IPC: H04M3/22
Abstract: 本发明公开了一种通信线路特征提取方法、通信线路识别方法及装置。所述方法包括:通过运营商通信线路建立位于主叫地的主叫终端与位于被叫地的被叫终端之间的通话连接;在所述主叫终端处播放语音;在所述被叫终端处获取所述语音对应的音频;从所述音频中提取音频特征作为通信线路特征,所述通信线路特征为所述主叫地与所述被叫地之间的所述运营商通信线路的特征,从而有助于准确且高效的识别相应的运营商和来源地,进而提高用户通话的可靠性。
-
公开(公告)号:CN111091809B
公开(公告)日:2023-05-23
申请号:CN201911051663.5
申请日:2019-10-31
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G10L15/00 , G10L15/02 , G10L15/08 , G06F18/2411 , G06F18/214 , G06F18/25
Abstract: 本发明提供一种深度特征融合的地域性口音识别方法和装置,方法包括:提取待识别语音的瓶颈BN特征和滑动差分倒谱SDC特征;将瓶颈BN特征和滑动差分倒谱SDC特征输入预先训练后的支持向量机SVM分类器中,得到输出的待识别语音的语音类别。本发明采用多特征融合的语种识别系统,提取语音的深度特征,融合传统的SDC特征,输入SVM分类器,实现更鲁棒的语种识别功能,取得了对地域性方言普通话较好的分类效果。
-
公开(公告)号:CN110111814B
公开(公告)日:2021-09-21
申请号:CN201910419117.6
申请日:2019-05-20
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明实施例提供一种网络类型识别方法及装置。所述方法包括:获取待识别语音;将待识别语音输入至预设的网络识别模型,得到识别结果;其中,所述网络识别模型为通过样本数据对随机森林模型以及支持向量机模型进行预设数据训练得到的。本发明实施例将网络类型识别的过程自动化实现,效率较高,可有效降低人工成本;且网络识别通过机器学习的方式建立,满足精确度需求;预先通过大量样本数据建立网络识别模型,适用于VoIP通话;本发明实施例解决了现有技术中,VoIP电话的出现使得难以准确地根据号码判断主叫方网络类型的问题。
-
-
-
-
-
-
-
-
-