Patent search ap:("南京大学") AND inv:"樊磊" Page 1

1.

发明公开
一种基于角度间隔损失函数的声纹识别方法无效

公开(公告)号：CN109903774A

公开(公告)日：2019-06-18

申请号：CN201910293479.5

申请日：2019-04-12

Applicant: 南京大学

Inventor： 李武军 , 樊磊 , 余亚奇

IPC: G10L17/18 , G10L17/04 , G10L17/02

Abstract: 本发明公开了一种基于角度间隔损失函数(简称AM-Softmax)的声纹识别方法，包括使用AM-Softmax损失函数训练模型的步骤，以及对说话人身份进行识别和验证的步骤：首先利用已标注过说话人身份的语音数据，以AM-Softmax损失函数为训练准则，训练深度神经网络模型；最后在识别和验证系统中，通过训练得到的深度神经网络模型提取表示说话人身份的特征向量，并和数据库中注册的人的特征向量进行比对，识别或验证说话人的身份。

2.

发明授权
一种基于深度哈希的声纹检索方法有权

公开(公告)号：CN110309343B

公开(公告)日：2023-08-08

申请号：CN201910574215.7

申请日：2019-06-28

Applicant: 南京大学

Inventor： 李武军 , 樊磊 , 蒋庆远 , 余亚奇

IPC: G06F16/61 , G06F16/63 , G06F16/65 , G06F16/683

Abstract: 本发明公开了一种基于深度哈希的声纹检索方法，达到了声纹检索任务中存储空间低且检索高效的效果。该方法包括训练深度声纹哈希模型的步骤，构建哈希编码数据库的步骤，对查询语音在数据库中检索的步骤：首先构建端到端的深度神经网络结构，利用已标注过说话人身份的语音数据，训练深度神经网络模型，得到深度声纹哈希函数。之后通过深度声纹哈希函数计算训练集对应的哈希编码，构建数据库；对于新录入的语音数据，使用深度声纹哈希函数计算对应的哈希编码，实时增加到数据库。在检索过程中，对于给定的语音，使用深度声纹哈希函数计算对应的哈希编码，最后在数据库中基于索引或海明距离排序得到检索结果。

3.

发明公开
一种基于深度哈希的声纹检索方法有权

公开(公告)号：CN110309343A

公开(公告)日：2019-10-08

申请号：CN201910574215.7

申请日：2019-06-28

Applicant: 南京大学

Inventor： 李武军 , 樊磊 , 蒋庆远 , 余亚奇

IPC: G06F16/61 , G06F16/63 , G06F16/65 , G06F16/683

Abstract: 本发明公开了一种基于深度哈希的声纹检索方法，达到了声纹检索任务中存储空间低且检索高效的效果。该方法包括训练深度声纹哈希模型的步骤，构建哈希编码数据库的步骤，对查询语音在数据库中检索的步骤：首先构建端到端的深度神经网络结构，利用已标注过说话人身份的语音数据，训练深度神经网络模型，得到深度声纹哈希函数。之后通过深度声纹哈希函数计算训练集对应的哈希编码，构建数据库；对于新录入的语音数据，使用深度声纹哈希函数计算对应的哈希编码，实时增加到数据库。在检索过程中，对于给定的语音，使用深度声纹哈希函数计算对应的哈希编码，最后在数据库中基于索引或海明距离排序得到检索结果。

Patent Agency Ranking