-
公开(公告)号:CN116504251A
公开(公告)日:2023-07-28
申请号:CN202310413099.7
申请日:2023-04-18
Applicant: 浙江大学
IPC: G10L17/04 , G10L17/18 , G10L17/06 , G10L21/0208
Abstract: 本发明公开了一种基于声场重构的语音分析身份认证方法,该方法包括距离感知、声场重建、声场提取及模型训练与推断,距离感知是通过扬声器发出啁啾信号并接收,利用互相关方法获取用户到手机的距离;声场重建通过建立一个与距离相关的脉冲响应数据库,根据测量的距离获得相应的传递函数,继而将验证位置的声场重建到注册位置的声场;声场提取将重建声场后的语音信号双声道分别进行信号处理,提取出场纹;模型训练与推断为利用注册场纹和验证阶段重建场纹来构建语音认证模型,本方法可以有效解决原声场方法进行说话人验证时对距离敏感的问题,用户验证时无需保持与注册时固定的距离。
-
公开(公告)号:CN116312560A
公开(公告)日:2023-06-23
申请号:CN202310262464.9
申请日:2023-03-17
Applicant: 浙江大学
IPC: G10L17/04 , G10L17/08 , G10L21/0216 , G10L21/0232 , G10L21/013 , G10L25/24 , G10L25/18 , G06F21/32 , G06F17/18 , G06F17/16 , G16Y30/10
Abstract: 本发明公开了一种基于声场的音调不敏感的说话人认证方法,该方法提出一种基于音调不敏感的双麦克风声场提取方法以鲁棒地认证不同音调下的同一说话人。该方法能够在说话人病理性等产生的音调变化(如感冒时区别于正常情况下的语音)场景下得到正确的认证结果,且可立即在各种类型的现有设备上实现。本发明使用与设备无关的正常可听音频数据,实现统一模型训练,从而对音调变化数据实现检测。本发明方法可以有效解决现有说话人认证系统在音调变化音频、病理性音频数据上的较差性能,可用于后续智能设备(如手机等)说话人认证系统的鲁棒性提高上,故需要为每个要保护的设备定制功能、数据集和型号可能造成的成本高昂的问题。
-