-
公开(公告)号:CN111508505B
公开(公告)日:2023-11-03
申请号:CN202010349219.8
申请日:2020-04-28
Applicant: 讯飞智元信息科技有限公司
Abstract: 本申请提供了一种说话人识别方法、装置、设备及存储介质,其中,方法包括:以趋于由混合高斯模型针对待识别语音确定的说话人特征为获取方向,从待识别语音中获取目标说话人特征,其中,混合高斯模型采用多个说话人的多条语音数据训练得到,混合高斯模型能够对语音数据中说话人个性特征的分布进行描述;根据目标说话人特征,识别待识别语音对应的说话人。本申请提供的说话人识别方法能够准确地识别出待识别语音对应的说话人。
-
公开(公告)号:CN108074576B
公开(公告)日:2022-04-08
申请号:CN201711342251.8
申请日:2017-12-14
Applicant: 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种审讯场景下的说话人角色分离方法及系统,该方法包括:获取审讯场景下的语音数据;从所述语音数据中提取每个分析单元的角色识别特征,每个分析单元只包含一个说话人语音段;依次将每个分析单元的角色识别特征输入预先构建的说话人角色识别模型,根据模型输出确定当前分析单元对应的说话人角色;所述说话人角色包括:讯问人和被讯问人。利用本发明,可以准确识别审讯场景下的说话人角色。
-
公开(公告)号:CN103730112A
公开(公告)日:2014-04-16
申请号:CN201310733001.2
申请日:2013-12-25
Applicant: 安徽讯飞智元信息科技有限公司
Abstract: 本发明提供一种语音多信道模拟与采集方法,该方法使用多种不同型号的麦克风实现多通道语音的同步采集,提高训练语音对麦克风信道覆盖能力;采用不同的语音编解码方法实现多种编码方式的信道模拟。由于本发明采用多通道同步采集并模拟多种语音信道,能快速获得多种信道处理后的语音数据,相比现有的多信道数据的采集方法能极大地提高数据采集效率,降低多信道数据的采集成本。
-
公开(公告)号:CN111833842B
公开(公告)日:2023-11-03
申请号:CN202010621981.7
申请日:2020-06-30
Applicant: 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种合成音模板发现方法、装置以及设备。本发明的构思在于利用合成音模板的重复特性,先在大量语音素材之间进行发音相似度比对,从中初选出疑似合成音模板,并将筛选出的语音素材进行切割,再结合合成音模板的发音特性,对切割后的各语音段进行归类,最后依据同类中所含语音段的数量,发现所需的合成音模板。本发明为后续的合成音检测补充了可靠的合成音模板样本,省去后续由人工进行大量的标注、辨识等工作,而且通过对疑似各语音片段进行独立分析,还能够解决语料中自然语音与合成语音相混淆的问题,由此可见,本发明可以在控制成本前提下,有效提升后续合成音检测的准确度。
-
公开(公告)号:CN106952208A
公开(公告)日:2017-07-14
申请号:CN201710160390.2
申请日:2017-03-17
Applicant: 讯飞智元信息科技有限公司
IPC: G06Q50/26
CPC classification number: G06Q50/26
Abstract: 本发明公开了一种犯罪自动预测方法及系统,该方法包括:获取待预测区域,并将所述待预测区域划分为一个或多个分区;获取所述待预测区域内的历史犯罪案件信息;根据所述历史犯罪案件信息对历史犯罪案件进行时空建模,得到每个分区的犯罪预测概率;对得到的每个分区的犯罪预测概率进行校正,得到每个分区校正后的犯罪预测概率。利用本发明,可以提高预测结果的准确性。
-
公开(公告)号:CN103730112B
公开(公告)日:2016-08-31
申请号:CN201310733001.2
申请日:2013-12-25
Applicant: 讯飞智元信息科技有限公司
IPC: G10L19/008 , G10L17/04
Abstract: 本发明提供一种语音多信道模拟与采集方法,该方法使用多种不同型号的麦克风实现多通道语音的同步采集,提高训练语音对麦克风信道覆盖能力;采用不同的语音编解码方法实现多种编码方式的信道模拟。由于本发明采用多通道同步采集并模拟多种语音信道,能快速获得多种信道处理后的语音数据,相比现有的多信道数据的采集方法能极大地提高数据采集效率,降低多信道数据的采集成本。
-
公开(公告)号:CN111833842A
公开(公告)日:2020-10-27
申请号:CN202010621981.7
申请日:2020-06-30
Applicant: 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种合成音模板发现方法、装置以及设备。本发明的构思在于利用合成音模板的重复特性,先在大量语音素材之间进行发音相似度比对,从中初选出疑似合成音模板,并将筛选出的语音素材进行切割,再结合合成音模板的发音特性,对切割后的各语音段进行归类,最后依据同类中所含语音段的数量,发现所需的合成音模板。本发明为后续的合成音检测补充了可靠的合成音模板样本,省去后续由人工进行大量的标注、辨识等工作,而且通过对疑似各语音片段进行独立分析,还能够解决语料中自然语音与合成语音相混淆的问题,由此可见,本发明可以在控制成本前提下,有效提升后续合成音检测的准确度。
-
公开(公告)号:CN111508505A
公开(公告)日:2020-08-07
申请号:CN202010349219.8
申请日:2020-04-28
Applicant: 讯飞智元信息科技有限公司
Abstract: 本申请提供了一种说话人识别方法、装置、设备及存储介质,其中,方法包括:以趋于由混合高斯模型针对待识别语音确定的说话人特征为获取方向,从待识别语音中获取目标说话人特征,其中,混合高斯模型采用多个说话人的多条语音数据训练得到,混合高斯模型能够对语音数据中说话人个性特征的分布进行描述;根据目标说话人特征,识别待识别语音对应的说话人。本申请提供的说话人识别方法能够准确地识别出待识别语音对应的说话人。
-
公开(公告)号:CN108074576A
公开(公告)日:2018-05-25
申请号:CN201711342251.8
申请日:2017-12-14
Applicant: 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种审讯场景下的说话人角色分离方法及系统,该方法包括:获取审讯场景下的语音数据;从所述语音数据中提取每个分析单元的角色识别特征,每个分析单元只包含一个说话人语音段;依次将每个分析单元的角色识别特征输入预先构建的说话人角色识别模型,根据模型输出确定当前分析单元对应的说话人角色;所述说话人角色包括:讯问人和被讯问人。利用本发明,可以准确识别审讯场景下的说话人角色。
-
公开(公告)号:CN104765996B
公开(公告)日:2018-04-27
申请号:CN201410005651.X
申请日:2014-01-06
Applicant: 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种声纹密码认证方法及系统,属于密码认证技术领域。该方法包括:接收用户输入的语音信号;对所述语音信号进行语音识别,获得密码文本;确定是否存在所述密码文本对应的背景模型;如果是,则获取所述背景模型;如果否,则根据所述密码文本对预先训练得到的发音单元模型进行扩展,获得所述密码文本对应的背景模型;利用所述语音信号中的声纹特征序列、所述背景模型和所述用户的声纹密码模型对所述用户进行认证。利用该方法及系统,可以满足用户自定义密码及频繁更改密码的需求。
-
-
-
-
-
-
-
-
-