-
公开(公告)号:CN117995198B
公开(公告)日:2024-07-05
申请号:CN202410389359.6
申请日:2024-04-02
Applicant: 暨南大学
IPC: G10L17/18 , G10L15/06 , G10L17/04 , G10L25/51 , G06F18/213 , G06F18/24 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/048 , G06N3/094
Abstract: 本发明公开了一种基于多任务对抗解耦学习的语音隐私保护方法及系统,该方法包括下述步骤:对语音信号提取声学特征得到特征编码结果,基于三个并行的通道注意力计算模块构建信息解耦模块,将特征编码结果进行多任务解耦特征学习,进行年龄段分类、自动语音解码和身份识别,并基于年龄段分类、自动语音解码和身份识别对应的损失函数进行监督训练,计算解耦特征信息的整体相似度并构建最小‑最大目标,HiFi‑GAN生成器将相加后的特征信息进行隐秘音频重建,输出隐秘音频。本发明在维护隐私的同时避免丢失其中的年龄属性,并确保下游的年龄估计任务具有良好的预测精度,并且从隐私保护的角度出发添加相似度约束,实现高精度的年龄识别。
-
公开(公告)号:CN117995198A
公开(公告)日:2024-05-07
申请号:CN202410389359.6
申请日:2024-04-02
Applicant: 暨南大学
IPC: G10L17/18 , G10L15/06 , G10L17/04 , G10L25/51 , G06F18/213 , G06F18/24 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/048 , G06N3/094
Abstract: 本发明公开了一种基于多任务对抗解耦学习的语音隐私保护方法及系统,该方法包括下述步骤:对语音信号提取声学特征得到特征编码结果,基于三个并行的通道注意力计算模块构建信息解耦模块,将特征编码结果进行多任务解耦特征学习,进行年龄段分类、自动语音解码和身份识别,并基于年龄段分类、自动语音解码和身份识别对应的损失函数进行监督训练,计算解耦特征信息的整体相似度并构建最小‑最大目标,HiFi‑GAN生成器将相加后的特征信息进行隐秘音频重建,输出隐秘音频。本发明在维护隐私的同时避免丢失其中的年龄属性,并确保下游的年龄估计任务具有良好的预测精度,并且从隐私保护的角度出发添加相似度约束,实现高精度的年龄识别。
-