-
公开(公告)号:CN109903774A
公开(公告)日:2019-06-18
申请号:CN201910293479.5
申请日:2019-04-12
Applicant: 南京大学
Abstract: 本发明公开了一种基于角度间隔损失函数(简称AM-Softmax)的声纹识别方法,包括使用AM-Softmax损失函数训练模型的步骤,以及对说话人身份进行识别和验证的步骤:首先利用已标注过说话人身份的语音数据,以AM-Softmax损失函数为训练准则,训练深度神经网络模型;最后在识别和验证系统中,通过训练得到的深度神经网络模型提取表示说话人身份的特征向量,并和数据库中注册的人的特征向量进行比对,识别或验证说话人的身份。
-
公开(公告)号:CN110309343B
公开(公告)日:2023-08-08
申请号:CN201910574215.7
申请日:2019-06-28
Applicant: 南京大学
IPC: G06F16/61 , G06F16/63 , G06F16/65 , G06F16/683
Abstract: 本发明公开了一种基于深度哈希的声纹检索方法,达到了声纹检索任务中存储空间低且检索高效的效果。该方法包括训练深度声纹哈希模型的步骤,构建哈希编码数据库的步骤,对查询语音在数据库中检索的步骤:首先构建端到端的深度神经网络结构,利用已标注过说话人身份的语音数据,训练深度神经网络模型,得到深度声纹哈希函数。之后通过深度声纹哈希函数计算训练集对应的哈希编码,构建数据库;对于新录入的语音数据,使用深度声纹哈希函数计算对应的哈希编码,实时增加到数据库。在检索过程中,对于给定的语音,使用深度声纹哈希函数计算对应的哈希编码,最后在数据库中基于索引或海明距离排序得到检索结果。
-
公开(公告)号:CN110309343A
公开(公告)日:2019-10-08
申请号:CN201910574215.7
申请日:2019-06-28
Applicant: 南京大学
IPC: G06F16/61 , G06F16/63 , G06F16/65 , G06F16/683
Abstract: 本发明公开了一种基于深度哈希的声纹检索方法,达到了声纹检索任务中存储空间低且检索高效的效果。该方法包括训练深度声纹哈希模型的步骤,构建哈希编码数据库的步骤,对查询语音在数据库中检索的步骤:首先构建端到端的深度神经网络结构,利用已标注过说话人身份的语音数据,训练深度神经网络模型,得到深度声纹哈希函数。之后通过深度声纹哈希函数计算训练集对应的哈希编码,构建数据库;对于新录入的语音数据,使用深度声纹哈希函数计算对应的哈希编码,实时增加到数据库。在检索过程中,对于给定的语音,使用深度声纹哈希函数计算对应的哈希编码,最后在数据库中基于索引或海明距离排序得到检索结果。
-
-