-
公开(公告)号:CN111863007A
公开(公告)日:2020-10-30
申请号:CN202010554629.6
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G10L21/0208 , G10L21/0272 , G06N3/04
Abstract: 本发明公开了一种基于深度学习的语音增强方法及系统,该方法包括如下步骤:步骤SS1:获得带噪语音的多个IRM预测值的解的集合;步骤SS2:将来自所述Boosting-DNN语音增强模型输出的IRM的解的集合拼接带噪特征作为输入,预测最终的IRM预测值集合 本发明通过将Boosting-DNN语音增强模型和Ensemble-DNN集成语音增强模型这两个DNN串接起来的方式,有效的解决了一个神经网络由于层次太深训练不稳定的现象,构建一种非常深的网络结构,彻底解决前端语音增强技术就可以确保把语音从带噪信号中分离出来,以便后端识别模型能正确识别语音的内容。
-
公开(公告)号:CN112466310A
公开(公告)日:2021-03-09
申请号:CN202011105315.4
申请日:2020-10-15
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了深度学习声纹识别方法、装置、电子设备及存储介质,该方法包括:获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令。本发明解决了传统声纹识别算法或者单纯数字密码验证的局限性,实现了较理想的密码验证准确率。
-
公开(公告)号:CN111785281A
公开(公告)日:2020-10-16
申请号:CN202010554305.2
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G10L17/02 , G10L17/04 , G10L17/06 , G10L17/18 , G10L21/0208
Abstract: 本发明公开了一种基于信道补偿的声纹识别方法及系统,该方法包括如下步骤:步骤SS1:初始化去噪网络G和判别网络D;步骤SS2:输入噪声音频到去噪网络G,生成fake音频,将所述fake音频和真实的干净音频送入到判别网络D进行训练,更新判别网络D的网络参数,得到新一代判别网络D1;步骤SS3:冻结判别网络D1的参数,在去噪网络G中输入噪声音频,同时将对应的判别标签设为True,来欺骗判别网络D1;步骤SS4:重复步骤SS2至步骤SS3,直至判别网络D收敛,转入步骤SS5;步骤SS5:去噪网络G输出增强音频信号。本发明对于声纹识别大幅提高了整体准确率。
-
公开(公告)号:CN119311871A
公开(公告)日:2025-01-14
申请号:CN202411222450.5
申请日:2024-09-02
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/36 , G06F18/25 , G06F18/213 , G06N3/045
Abstract: 本申请涉及舆情监测技术领域,公开一种面向噪声文本信息的检测方法及系统,所述方法包括:获取目标数据集;对目标数据集进行预处理,获取预处理后的文本特征;构成汉化文本分类模型预训练模型,其中,汉化文本分类模型预训练模型用于预处理后的文本特征,以获取文本的表示向量;构建两个结构不同的基于汉化文本分类预训练模型作为双塔模型的基分类器A和基分类器B;用相同数据集对基分类器A和基分类器B进行调整。本发明能够对双塔模型进行相互校验,对双塔模型的输出结果进行综合考量,并输出最终结果,从而有效提高整体的特定内容检测准确率。
-
公开(公告)号:CN113779961B
公开(公告)日:2024-10-01
申请号:CN202010518026.0
申请日:2020-06-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/253 , G06F40/289
Abstract: 本发明提供一种自然语言文本的惯用句式提取方法及电子装置,包括:对采集到的每一语句进行分词、词性标注及依存句法分析;将各语句转换为若干单句,并依据词性标注结果与依存句法分析结果,对各单句主干进行抽取,将各单句表示为词汇和词性标签的列表;将各单句的列表进行合并,得到各语句的惯用句式。本发明提出一种不损失句式信息的长难句化简方法,针对句式提取的需要对中文长难句中非句子主干部分进行处理,提高句式提取准确度,本发明还提出一种句式信息表示结构,使用词汇、词汇候选集、词性标签来表示句式信息,保留尽可能多的句式信息。
-
公开(公告)号:CN112331181B
公开(公告)日:2024-07-05
申请号:CN201910694870.6
申请日:2019-07-30
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于目标语音提取和自适应技术领域,具体涉及一种基于多说话人条件下目标说话人语音提取方法,该方法具体包括:实时获取多个说话人混合的语音,提取多个说话人混合的语音的频谱;将锚语音输入到预先训练的说话人识别模型中,提取出目标说话人的特征向量;将获取的多个说话人混合的语音的频谱和目标说话人的特征向量输入至预先训练的目标说话人语音提取网络中,获取目标说话人的语音频谱;基于该目标说话人的语音频谱,获取目标说话人的语音。
-
公开(公告)号:CN117295072A
公开(公告)日:2023-12-26
申请号:CN202210694396.9
申请日:2022-06-16
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: H04W12/67 , H04W12/03 , H04W12/122 , H04W24/08 , H04W24/10 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种5G网络中OTT语音业务风险管控策略的生成方法及装置,包括:分析OTT语音业务流量,生成异常OTT语音业务流量或用户行为的检测结果报告;根据所述检测结果报告与预置的OTT语音业务风险情报知识进行风险评估,OTT业务流量风险评估功能生成应急异常OTT语音业务或异常用户行为的风险等级,并依据所述风险等级,生成应急处置建议;基于应急处置建议,策略控制功能生成OTT语音业务风险管控策略。本发明引入新的流量风险评估功能实现对有害加密OTT语音业务、用户行为的风险评估,并结合5G策略控制体系实现有害OTT业务的应急处置。
-
公开(公告)号:CN113326689B
公开(公告)日:2023-08-18
申请号:CN202010128327.2
申请日:2020-02-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/205 , G06F40/211 , G06F18/214 , G06F18/2415 , G06N3/045 , G06N3/092
Abstract: 本发明属于数据通信和数据处理技术领域,具体涉及一种基于深度强化学习模型的数据清洗方法,该方法包括:获取待清洗的带标签的数据集;采用预筛选算法,删除待清洗的带标签的数据集中的无内容数据、不在标签集内的标签数据和标签矛盾的数据,获得待分类的数据集;将待分类的数据集输入至预先训练的深度强化学习模型中,获得不同类别的延迟奖励;再根据获得的不同类别的延迟奖励,依据预先训练的深度强化学习模型中的动作集合,丢弃掉有偏数据,保留有效数据,并更新状态列表S,最大化每一类别的延迟奖励值,将每一类别的最大延迟奖励值对应的带标签的训练数据集作为清洗干净的带标签的训练数据集,从而完成数据清洗。
-
公开(公告)号:CN115828277A
公开(公告)日:2023-03-21
申请号:CN202211327183.9
申请日:2022-10-25
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请提供一种数据预测方法、装置、电子设备及存储介质。该方法包括:获取原始明文数据和待预测明文数据;利用根据全同态加密技术得到的公钥对原始明文数据加密以确定原始密文数据,并利用公钥对待预测明文数据加密以确定待预测密文数据;利用原始密文数据训练得到预测模型;根据预测模型对待预测密文数据进行预测以确定预测密文数据;利用根据全同态加密技术得到的私钥对预测密文数据进行解密以确定预测明文数据。本申请全过程中的数据均通过全同态加密技术进行加密,在神经网络模型的训练以及数据预测过程中都可以有效的保证用户的隐私数据不被泄露,为数据安全性提供了保障。
-
公开(公告)号:CN115525758A
公开(公告)日:2022-12-27
申请号:CN202210628092.2
申请日:2022-06-06
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于SVM的特定文本大数据分析方法及系统,所述一种基于SVM的特定文本大数据分析方法包括:利用历史特定文本大数据得到历史特定文本大数据特征;利用所述历史特定文本大数据特征获取历史特定文本大数据分析结果,采用SVM的大数据分析系统的技术,全面提高特定文本的分类的准确性和覆盖率,通过在海量数据中实现对特定内容的精准分类,大大提高了特定内容分类的及时性和准确性,从而提高了系统层面对特定内容处理的流转环节,大大提高了应用系统的处理能力。
-
-
-
-
-
-
-
-
-