一种面向实时语音通讯的丢包补偿方法

    公开(公告)号:CN116248229A

    公开(公告)日:2023-06-09

    申请号:CN202211572689.6

    申请日:2022-12-08

    Abstract: 本发明公开一种面向实时语音通讯的丢包补偿方法,包括如下步骤:构建基于对抗神经网络的补偿训练模型,所述补偿训练模型包括补偿系数生成器、谐波组和逼真度判别器;将历史音频输入至所述补偿系数生成器和谐波组中处理,获得初始修补音频;通过所述逼真度判别器计算初始修补音频与所述历史音频所对应的无丢包真实音频之间的相似度;基于相似度,更新补偿训练模型的参数,继续训练,直到模型收敛或达到最大迭代次数,输出当前的补偿系数生成器和谐波组作为训练好的丢包补偿模型。本发明能够更加准确地预测出丢失的音频帧,提高实时语音通讯中的音频质量。

    基于大数据自监督的声纹识别模型训练方法、系统

    公开(公告)号:CN115472167A

    公开(公告)日:2022-12-13

    申请号:CN202210986290.6

    申请日:2022-08-17

    Abstract: 本方案涉及一种基于大数据自监督的声纹识别模型训练方法、系统。所述方法包括:各个分布式主机获取多源录音数据进行分布式存储,并对录音数据进行数据清洗,得到带标签的录音数据以及未带标签的录音数据;各个分布式主机对带标签的录音数据以及未带标签的录音数据切片处理,分别向切片处理后的录音数据加入噪声干扰,得到样本对并输入到自监督学习模型中,与服务器进行联邦学习模型训练,在服务器上训练得到声纹识别基础模型;服务器基于带标签的录音数据对基础模型的模型参数进行监督学习精调,得到声纹识别精调模型。采用横向联邦学习由服务器统筹存储在不同分布式主机上的多源数据用于声纹识别模型的大规模训练,可实现海量数据模型训练。

    电话卡冒用检测方法、系统、计算机设备及存储介质

    公开(公告)号:CN113763963B

    公开(公告)日:2025-02-18

    申请号:CN202110974150.2

    申请日:2021-08-24

    Abstract: 本方案涉及一种电话卡冒用检测方法、系统、计算机设备及存储介质。所述方法包括:获取包含有疑似被冒用电话卡的电话号码的嫌疑名单;获取与电话号码对应机主的电话录音,并通过重采样算法将电话录音的采集频率调整为目标采集频率;将含有目标采集频率的电话录音输入至声纹识别算法模型中,得到与电话录音对应的声纹特征;在注册录音底库中查找与电话号码对应的注册声纹特征;将声纹特征与注册声纹特征进行比对,得到比对结果,并根据比对结果确定电话号码对应的电话卡是否被冒用。通过对采集的电话录音以及数据库中的目标电话录音进行声纹识别,从而根据声纹识别结果确定电话录音对应的机主是否为注册机主,可以准确检测出电话卡是否被冒用。

    一种面向实时语音通讯的丢包补偿方法

    公开(公告)号:CN116248229B

    公开(公告)日:2023-12-01

    申请号:CN202211572689.6

    申请日:2022-12-08

    Abstract: 本发明公开一种面向实时语音通讯的丢包补偿方法,包括如下步骤:构建基于对抗神经网络的补偿训练模型,所述补偿训练模型包括补偿系数生成器、谐波组和逼真度判别器;将历史音频输入至所述补偿系数生成器和谐波组中处理,获得初始修补音频;通过所述逼真度判别器计算初始修补音频与所述历史音频所对应的无丢包真实音频之间的相似度;基于相似度,更新补偿训练模型的参数,继续训练,直到模型收敛或达到最大迭代次数,输出当前的补偿系数生成器和谐波组作为训练好的丢包补偿模型。本发明能够更加准确地预测出丢失的音频帧,提高实时语音通讯中的音频质量。

    语音活动检测方法、装置、计算机设备及存储介质

    公开(公告)号:CN116312568A

    公开(公告)日:2023-06-23

    申请号:CN202211090025.6

    申请日:2022-09-07

    Abstract: 本方案涉及一种语音活动检测方法、装置、计算机设备及存储介质。所述方法包括:随机采样语音片段并加入噪声数据拼接成多人对话仿真录音;通过可学习自监督语音表征模型对仿真录音进行编码处理后输入至门控循环单元中,得到活动语音检测特征;获取目标语者注册语音,并将目标语者注册语音输入至通道注意与传播聚合网络中,得到目标语者声纹特征;采集待检测语音,并将待检测语音、目标语者注册语音输入至双向编码器网络中,得到验证特征;将活动语音检测特征、目标语者声纹特征、验证特征依次输入至语音活动检测模型中,得到检测结果。由于输入的特征多元化,可以提高语音活动检测模型的检测结果,从而提高语音活动检测的准确率。

    分布式声纹检索方法及系统
    6.
    发明公开

    公开(公告)号:CN115357751A

    公开(公告)日:2022-11-18

    申请号:CN202211021152.0

    申请日:2022-08-24

    Abstract: 本方案涉及一种分布式声纹检索方法及系统。所述方法包括:中心服务器训练声纹编码器并发给各个分布式存储端;各个分布式存储端构建本地声纹底库,并构建底库矩阵;中心服务器接收声纹查询数据,并根据声纹查询数据构建查询矩阵并广播至各个分布式存储端;各个分布式存储端接收查询矩阵,根据查询矩阵与底库矩阵进行声纹检索计算,得到打分矩阵并发送给中心服务器;中心服务器根据打分矩阵确定与声纹查询数据对应的说话人声纹检索结果。通过将声纹底库数据采用分布式存储的方式存储在各个存储端中,并通过查询矩阵和打分矩阵进行声纹查询,当存在大规模检索数据时,通过分布式存储端进行辅助声纹查询可以提高声纹检索的效率。

    基于大数据自监督的声纹识别模型训练方法、系统

    公开(公告)号:CN115472167B

    公开(公告)日:2024-11-01

    申请号:CN202210986290.6

    申请日:2022-08-17

    Abstract: 本方案涉及一种基于大数据自监督的声纹识别模型训练方法、系统。所述方法包括:各个分布式主机获取多源录音数据进行分布式存储,并对录音数据进行数据清洗,得到带标签的录音数据以及未带标签的录音数据;各个分布式主机对带标签的录音数据以及未带标签的录音数据切片处理,分别向切片处理后的录音数据加入噪声干扰,得到样本对并输入到自监督学习模型中,与服务器进行联邦学习模型训练,在服务器上训练得到声纹识别基础模型;服务器基于带标签的录音数据对基础模型的模型参数进行监督学习精调,得到声纹识别精调模型。采用横向联邦学习由服务器统筹存储在不同分布式主机上的多源数据用于声纹识别模型的大规模训练,可实现海量数据模型训练。

    跨信道声纹比对方法、系统、计算机设备及存储介质

    公开(公告)号:CN114023329A

    公开(公告)日:2022-02-08

    申请号:CN202111192550.4

    申请日:2021-10-13

    Abstract: 本方案涉及一种跨信道声纹比对方法。所述方法包括:获取通过第一信道、第二信道采集的第一语音数据、第二语音数据并进行数据预处理,得到第一目标语音数据、第二目标语音数据;通过重采样算法对第一目标语音数据、第二目标语音数据的采样频率进行处理使其频率相同;查找与第一目标语音数据、第二目标语音数据的状态属性对应的声纹特征提取模型,通过声纹特征提取模型得到第一声纹特征、第二声纹特征;计算第一声纹特征与第二声纹特征的余弦相似度,并根据余弦相似度得到比对结果。通过对不同信道采集的语音数据进行预处理、重采样处理等,将语音数据的采样频率统一,进而对识别的声纹特征进行比对,可以提高声纹比对的精确度。

    电话卡冒用检测方法、系统、计算机设备及存储介质

    公开(公告)号:CN113763963A

    公开(公告)日:2021-12-07

    申请号:CN202110974150.2

    申请日:2021-08-24

    Abstract: 本方案涉及一种电话卡冒用检测方法、系统、计算机设备及存储介质。所述方法包括:获取包含有疑似被冒用电话卡的电话号码的嫌疑名单;获取与电话号码对应机主的电话录音,并通过重采样算法将电话录音的采集频率调整为目标采集频率;将含有目标采集频率的电话录音输入至声纹识别算法模型中,得到与电话录音对应的声纹特征;在注册录音底库中查找与电话号码对应的注册声纹特征;将声纹特征与注册声纹特征进行比对,得到比对结果,并根据比对结果确定电话号码对应的电话卡是否被冒用。通过对采集的电话录音以及数据库中的目标电话录音进行声纹识别,从而根据声纹识别结果确定电话录音对应的机主是否为注册机主,可以准确检测出电话卡是否被冒用。

Patent Agency Ranking