-
公开(公告)号:CN116110415A
公开(公告)日:2023-05-12
申请号:CN202211644919.5
申请日:2022-12-20
Applicant: 桂林理工大学
Abstract: 本发明公开了一种基于BERT的非平行语料下的语音转换方法,属于语音信号处理技术领域。在模型训练过程中,首先由音频特征算法从音素语料库提取语音特征,将特征导入到音素识别模块进行训练;接着对目标语音进行音频特征提取,然后导入到音素识别模型得到目标语音的音素特征;最后将音素特征和目标语音特征导入到特征转换模型,共同完成语音特征转换训练。在语音转换过程中,利用特征算法对源语音进行特征提取,然后输出到音素识别模块得到其音素特征,再将其输出到特征转换模块即可实现语音特征转换,最后进入语音合成模块获得转换后的语音。本方法将音素提取及特征转换应用在BERT模型中,运算简洁,为非平行语料转换提供技术支撑。
-
公开(公告)号:CN114998971B
公开(公告)日:2024-11-22
申请号:CN202210743072.X
申请日:2022-06-27
Applicant: 桂林理工大学
IPC: G06V40/16 , G06N3/0464 , G06N3/084 , G06V10/25 , G06V10/774 , G06V10/82
Abstract: 本发明涉及深度学习隐私保护技术领域,具体涉及一种人脸识别的混合扰动差分隐私保护方法,包括抓取人脸数据;对所述人脸数据进行预处理,得到最小检测框;对所述最小检测框进行人脸重定位,得到训练数据;基于所述训练数据构建混合扰动差分隐私模型;改变三元组损失函数,使得所述混合扰动差分隐私模型通过所述训练数据训练后,得到混合扰动的神经元结点权重。所述混合扰动差分隐私模型将神经网络权重分割为网络权重和噪声权重,使得网络权重能够尽力去为神经网络提供学习能力,而噪声权重利用目标扰动又尽力去为网络权重提供隐私保护,解决了现有的隐私保护方法的深度神经网络的可用性较差的问题。
-
公开(公告)号:CN114998971A
公开(公告)日:2022-09-02
申请号:CN202210743072.X
申请日:2022-06-27
Applicant: 桂林理工大学
Abstract: 本发明涉及深度学习隐私保护技术领域,具体涉及一种人脸识别的混合扰动差分隐私保护方法,包括抓取人脸数据;对所述人脸数据进行预处理,得到最小检测框;对所述最小检测框进行人脸重定位,得到训练数据;基于所述训练数据构建混合扰动差分隐私模型;改变三元组损失函数,使得所述混合扰动差分隐私模型通过所述训练数据训练后,得到混合扰动的神经元结点权重。所述混合扰动差分隐私模型将神经网络权重分割为网络权重和噪声权重,使得网络权重能够尽力去为神经网络提供学习能力,而噪声权重利用目标扰动又尽力去为网络权重提供隐私保护,解决了现有的隐私保护方法的深度神经网络的可用性较差的问题。
-
-