-
公开(公告)号:CN103730112A
公开(公告)日:2014-04-16
申请号:CN201310733001.2
申请日:2013-12-25
Applicant: 安徽讯飞智元信息科技有限公司
Abstract: 本发明提供一种语音多信道模拟与采集方法,该方法使用多种不同型号的麦克风实现多通道语音的同步采集,提高训练语音对麦克风信道覆盖能力;采用不同的语音编解码方法实现多种编码方式的信道模拟。由于本发明采用多通道同步采集并模拟多种语音信道,能快速获得多种信道处理后的语音数据,相比现有的多信道数据的采集方法能极大地提高数据采集效率,降低多信道数据的采集成本。
-
公开(公告)号:CN115910104A
公开(公告)日:2023-04-04
申请号:CN202211567062.1
申请日:2022-12-07
Applicant: 讯飞智元信息科技有限公司 , 甘肃省国家安全特种技术重点实验室
Abstract: 本发明提供一种伪造语音检测方法、装置、电子设备和存储介质,其中方法包括:确定待检测的语音;将语音输入至语音检测模型中,得到语音检测模型输出的语音检测结果,语音检测结果为真实语音和伪造语音中的一种;其中,语音检测模型是根据样本语音对进行对比训练得到,样本语音对包含真实语音样本和伪造语音样本,真实语音样本和伪造语音样本的文本信息和声学特征相同。提高语音真伪检测的准确性和通用性。
-
公开(公告)号:CN105679323B
公开(公告)日:2019-09-03
申请号:CN201510998519.8
申请日:2015-12-24
Applicant: 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种号码发现方法及系统,所述方法包括:根据收集的目标人的语音数据构建目标人声纹模型;获取目标人的已知使用号码和候选测试号码以及各号码的通话信息;提取所述候选测试号码的使用人的声纹特征;计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分;计算结束后,基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整;根据规整后的相似度得分确认目标人使用的号码。本发明由于对相似度得分的规整不仅仅依赖于非目标人的声纹模型的均值和方差均值,可以进一步地提升声纹识别的准确性。
-
公开(公告)号:CN103730112B
公开(公告)日:2016-08-31
申请号:CN201310733001.2
申请日:2013-12-25
Applicant: 讯飞智元信息科技有限公司
IPC: G10L19/008 , G10L17/04
Abstract: 本发明提供一种语音多信道模拟与采集方法,该方法使用多种不同型号的麦克风实现多通道语音的同步采集,提高训练语音对麦克风信道覆盖能力;采用不同的语音编解码方法实现多种编码方式的信道模拟。由于本发明采用多通道同步采集并模拟多种语音信道,能快速获得多种信道处理后的语音数据,相比现有的多信道数据的采集方法能极大地提高数据采集效率,降低多信道数据的采集成本。
-
公开(公告)号:CN106952208A
公开(公告)日:2017-07-14
申请号:CN201710160390.2
申请日:2017-03-17
Applicant: 讯飞智元信息科技有限公司
IPC: G06Q50/26
CPC classification number: G06Q50/26
Abstract: 本发明公开了一种犯罪自动预测方法及系统,该方法包括:获取待预测区域,并将所述待预测区域划分为一个或多个分区;获取所述待预测区域内的历史犯罪案件信息;根据所述历史犯罪案件信息对历史犯罪案件进行时空建模,得到每个分区的犯罪预测概率;对得到的每个分区的犯罪预测概率进行校正,得到每个分区校正后的犯罪预测概率。利用本发明,可以提高预测结果的准确性。
-
公开(公告)号:CN103714826B
公开(公告)日:2016-08-17
申请号:CN201310700673.3
申请日:2013-12-18
Applicant: 讯飞智元信息科技有限公司
Abstract: 本发明提供一种面向声纹鉴定的共振峰自动匹配方法,该方法使用基于连续语音识别的音素切分(Forced Alignment,FA)技术自动标注出声纹鉴定中检材和样本中的音素边界位置;对检材与样本的相同元音音素片段,利用基频、共振峰和功率谱密度参数自动判断当前音素是否为有效可分析音素;采用利用DTW(Dynamic Time Warping,动态时间归整)算法自动给出相应共振峰时频面积的偏差比例,作为最终人工声纹鉴定的分析依据。本发明自动标注音素边界、并判断音素发音是否有效,可大幅度提高处理效率;同时,对有效音素对的自动共振峰偏差比对算法,可提高共振峰比对的精度。
-
公开(公告)号:CN103714826A
公开(公告)日:2014-04-09
申请号:CN201310700673.3
申请日:2013-12-18
Applicant: 安徽讯飞智元信息科技有限公司
Abstract: 本发明提供一种面向声纹鉴定的共振峰自动匹配方法,该方法使用基于连续语音识别的音素切分(Forced Alignment,FA)技术自动标注出声纹鉴定中检材和样本中的音素边界位置;对检材与样本的相同元音音素片段,利用基频、共振峰和功率谱密度参数自动判断当前音素是否为有效可分析音素;采用利用DTW(Dynamic Time Warping,动态时间归整)算法自动给出相应共振峰时频面积的偏差比例,作为最终人工声纹鉴定的分析依据。本发明自动标注音素边界、并判断音素发音是否有效,可大幅度提高处理效率;同时,对有效音素对的自动共振峰偏差比对算法,可提高共振峰比对的精度。
-
公开(公告)号:CN108074576A
公开(公告)日:2018-05-25
申请号:CN201711342251.8
申请日:2017-12-14
Applicant: 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种审讯场景下的说话人角色分离方法及系统,该方法包括:获取审讯场景下的语音数据;从所述语音数据中提取每个分析单元的角色识别特征,每个分析单元只包含一个说话人语音段;依次将每个分析单元的角色识别特征输入预先构建的说话人角色识别模型,根据模型输出确定当前分析单元对应的说话人角色;所述说话人角色包括:讯问人和被讯问人。利用本发明,可以准确识别审讯场景下的说话人角色。
-
公开(公告)号:CN104765996B
公开(公告)日:2018-04-27
申请号:CN201410005651.X
申请日:2014-01-06
Applicant: 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种声纹密码认证方法及系统,属于密码认证技术领域。该方法包括:接收用户输入的语音信号;对所述语音信号进行语音识别,获得密码文本;确定是否存在所述密码文本对应的背景模型;如果是,则获取所述背景模型;如果否,则根据所述密码文本对预先训练得到的发音单元模型进行扩展,获得所述密码文本对应的背景模型;利用所述语音信号中的声纹特征序列、所述背景模型和所述用户的声纹密码模型对所述用户进行认证。利用该方法及系统,可以满足用户自定义密码及频繁更改密码的需求。
-
公开(公告)号:CN107832756A
公开(公告)日:2018-03-23
申请号:CN201711002755.5
申请日:2017-10-24
Applicant: 讯飞智元信息科技有限公司
CPC classification number: G06K9/2054 , G06K9/342 , G06K9/344
Abstract: 本公开提供一种快递单信息提取方法及装置、存储介质、电子设备。该方法包括:获取快递单图像,并对快递单图像进行分栏处理,得到至少2个栏目,每个栏目表示一种信息类型;将每个栏目中的文本行转换为矩形图像块;根据每个栏目在快递单图像中的位置、以及每个栏目包括的矩形图像块,在预设模板库中查找相似模板;如果查找到相似模板,则获取相似模板对应的栏目集合,并根据栏目集合,从快递单图像中确定出对应的待提取栏目;将待提取栏目包括的矩形图像块转换为文字信息,并确定出每个矩形图像块对应的文本行的类别;快递单信息包括:待提取栏目的信息类型、文本行的类别、文字信息。如此方案,有助于提高快递单信息提取的准确率。
-
-
-
-
-
-
-
-
-