-
公开(公告)号:CN112836042A
公开(公告)日:2021-05-25
申请号:CN202011092228.X
申请日:2020-10-13
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种有害音频识别方法、装置、电子设备及计算机可读介质。该有害音频识别方法,包括:获取待识别音频数据进行特征提取,并输入到关键词匹配模型,输出音频数据的开始时间和结束时间以及识别的文本内容;对所述识别的文本内容通过向量机算法SVM进行分类,生成文本集合结果。本发明通过获取待识别音频数据进行特征提取,并输入到关键词匹配模型,输出音频数据的开始时间和结束时间以及识别的文本内容;对所述识别的文本内容通过向量机算法SVM进行分类,生成文本集合结果,不断更新有害音频的正例样本库,提高有害音频检测的准确率。
-
公开(公告)号:CN108882242A
公开(公告)日:2018-11-23
申请号:CN201810589825.X
申请日:2018-06-08
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
Abstract: 本发明公开了基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,具体包括如下步骤:步骤SS1:建立诈骗人声纹模型库和诈骗人意图模型库;步骤SS2:诈骗人声纹模型库更新步骤;步骤SS3:诈骗人意图模型库更新步骤。本发明利用声纹预警数据自动为意图理解模型积累训练用诈骗文本;利用意图理解预警数据自动添加诈骗人声纹模型库,两种技术手段互相补充,有效解决数据积累期间新诈骗人的漏警和意图理解模型训练文本人工积累的问题。
-
公开(公告)号:CN108806668A
公开(公告)日:2018-11-13
申请号:CN201810590276.8
申请日:2018-06-08
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G10L15/02 , G10L15/06 , G10L15/08 , G10L15/26 , G10L17/02 , G10L17/04 , G10L17/22 , G10L21/0272 , G10L25/87
CPC classification number: G10L15/02 , G10L15/063 , G10L15/08 , G10L15/26 , G10L17/02 , G10L17/04 , G10L17/22 , G10L21/0272 , G10L25/87
Abstract: 本发明公开一种音视频多维度标注与模型优化方法,具体包括如下步骤:首先进行样本管理与分拣,针对输入系统的样本数据进行去重,编号,建立样本标注任务库;音频数据预处理阶段,将任务库的视频数据进行音频抽取,同时完成对音频数据的预处理操作;音频内容分析与特征提取阶段,在完成音频预处理后,并依据后台已配置的标注规范体系进行深度分析输出标签数据;步骤304:视频内容分析与特征提取阶段,通过对视频内容进行图像分析,并依据后台已配置的标注规范体系进行深度分析输出标签数据;步骤305:特征融合与标签生成,将识别特征与标签信息融合,输出该样本的标签结果;人工复核与模型优化,系统产生的标签结果数据会经由人工进行复核确认。
-
公开(公告)号:CN111881682A
公开(公告)日:2020-11-03
申请号:CN202010554413.X
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G06F40/295 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种改进的DRNN模型的意图识别方法及装置,该方法包括如下步骤:步骤SS1:将输入序列输入到DRNN循环神经网络中进行阻断信息流动,使输入序列传递固定的步长K;步骤SS2:将DRNN循环神经网络的每个隐层标识送入MLP多层感知器中,来抽取更高层的特征信息;步骤SS3:通过Max Pooling池化操作来抽取整个输入序列的文本中最重要的特征信息;步骤SS4:通过一层MLP多层感知器送入softmax逻辑回归模型中进行分类,输出文本分类结果。本发明通过改进的DRNN(Disconnected Recurrent Neural Networks)进行意图识别分类,以提高文本分类的准确性,使相关技术在实际应用场景中达到更好效果。
-
公开(公告)号:CN109493882A
公开(公告)日:2019-03-19
申请号:CN201811304612.4
申请日:2018-11-04
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
Abstract: 本发明公开一种诈骗电话语音自动标注系统,包括基础维度标注模块、声纹标注模块、连续语音识别标注模块,所述基础维度标注模块的输出端分别与所述声纹标注模块的输入端、所述连续语音识别标注模块的输入端相连接。本发明还提出一种诈骗电话语音自动标注方法,具体包括如下步骤:基础维度标注步骤;连续语音识别步骤;声纹标注步骤。本发明通过智能语音技术实现对输入语音数据进行自动处理,实现语音数据的自动分析识别,并进行标签预标注工作,再结合人工确认,进行目标数据维度标签的有效标注管理,有效地利用通话语音数据,优化智能语音技术在电话诈骗场景下的应用及效果,同时保证数据在标注过程中的脱密及加密传输。
-
公开(公告)号:CN111863007A
公开(公告)日:2020-10-30
申请号:CN202010554629.6
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G10L21/0208 , G10L21/0272 , G06N3/04
Abstract: 本发明公开了一种基于深度学习的语音增强方法及系统,该方法包括如下步骤:步骤SS1:获得带噪语音的多个IRM预测值的解的集合;步骤SS2:将来自所述Boosting-DNN语音增强模型输出的IRM的解的集合拼接带噪特征作为输入,预测最终的IRM预测值集合 本发明通过将Boosting-DNN语音增强模型和Ensemble-DNN集成语音增强模型这两个DNN串接起来的方式,有效的解决了一个神经网络由于层次太深训练不稳定的现象,构建一种非常深的网络结构,彻底解决前端语音增强技术就可以确保把语音从带噪信号中分离出来,以便后端识别模型能正确识别语音的内容。
-
公开(公告)号:CN111785253A
公开(公告)日:2020-10-16
申请号:CN202010554156.X
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种分布不均衡的语种识别方法及系统,该方法包括如下步骤:步骤SS1:训练步骤,具体包括:对各语种的语音数据进行BN特征提取,生成的特征参数输入语种识别系统生成语种识别模型;步骤SS2:识别步骤,具体包括:加载步骤SS1获得的语种识别模型,对待识别的语音做判别,输出识别结果。通过本发明,使语种识别可以在分布不均衡的数据环境下同样产生有效作用,解决现有通用技术下的语种识别问题。
-
公开(公告)号:CN109243492A
公开(公告)日:2019-01-18
申请号:CN201811263371.3
申请日:2018-10-28
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
Abstract: 本发明公开一种语音情感识别系统,包括语音预处理模块、情感特征提取模块、情感分析模块,所述语音预处理模块的输入端接语音数据,所述语音预处理模块的输出端与所述情感特征提取模块的输入端相联接,所述情感特征提取模块的输出端与所述情感分析模块的输入端相联接,所述情感分析模块的输出端输出分析识别结果;所述语音预处理模块通过对语音数据进行处理获得语音信号,并传递到所述情感特征提取模块对所述语音信号中与情感关联紧密的声学参数进行提取,最后送入所述情感分析模块完成情感的判断。本发明还提出一种语音情感识别方法,增加了电话诈骗系统的检出手段,对于语音数据可进行多维度分析,系统的检出准确率提高了5%。
-
公开(公告)号:CN112466281A
公开(公告)日:2021-03-09
申请号:CN202011092988.0
申请日:2020-10-13
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了有害音频识别解码方法及装置,该方法包括:获取待识别音频数据,提取待测音频中的声学特征,对所述声学特征进行有效音频检测得到有效音频段;将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;将所述文本集合分类结果输入声学模型中输出解码结果。本发明通过对声学特征进行有效音频检测得到有效音频段;将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;将所述文本集合分类结果输入声学模型中输出解码结果,通过构建元学习的目标函数,获取大数据量的意图分类网络参数更新过程,提高有害音频识别解码的准确率。
-
公开(公告)号:CN111785281A
公开(公告)日:2020-10-16
申请号:CN202010554305.2
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G10L17/02 , G10L17/04 , G10L17/06 , G10L17/18 , G10L21/0208
Abstract: 本发明公开了一种基于信道补偿的声纹识别方法及系统,该方法包括如下步骤:步骤SS1:初始化去噪网络G和判别网络D;步骤SS2:输入噪声音频到去噪网络G,生成fake音频,将所述fake音频和真实的干净音频送入到判别网络D进行训练,更新判别网络D的网络参数,得到新一代判别网络D1;步骤SS3:冻结判别网络D1的参数,在去噪网络G中输入噪声音频,同时将对应的判别标签设为True,来欺骗判别网络D1;步骤SS4:重复步骤SS2至步骤SS3,直至判别网络D收敛,转入步骤SS5;步骤SS5:去噪网络G输出增强音频信号。本发明对于声纹识别大幅提高了整体准确率。
-
-
-
-
-
-
-
-
-