-
公开(公告)号:CN118366475A
公开(公告)日:2024-07-19
申请号:CN202410415397.4
申请日:2024-04-08
Applicant: 南京邮电大学 , 南京龙垣信息科技有限公司
Abstract: 本发明公开了一种基于局部差异信息辅助的小样本类增量音频分类方法,本发明包括计算模块预训练阶段和分类器融合阶段,将音频分类数据集样本按照类别划分为基类、伪新类和新类,这三个类别互不重叠;所述计算模块预训练阶段为训练特征提取网络,基类分类器和小样本分类权重生成器;所述分类器融合阶段为:从基类中选取每个类别的代表性样本与新类样本混合得到混合样本,将基类分类器与新类分类器级联输入到知识保存模块中,基于混合样本训练知识保存模块,输出能够同时识别基类和新类的统一分类器。本发明改善了相似的新类与基类之间的混淆问题,提高了模型同时识别基类和新类的准确率。
-
公开(公告)号:CN120048241A
公开(公告)日:2025-05-27
申请号:CN202510192231.5
申请日:2025-02-21
Applicant: 南京邮电大学 , 南京龙垣信息科技有限公司
IPC: G10L13/02 , G10L13/033 , G10L25/18 , G10L25/30 , G10L25/90
Abstract: 本发明涉及语言转换技术领域,具体涉及一种基于图卷积网络的匿名说话人攻击方法;包括如下步骤:将F0特征与原始F0特征进行拼接融合作为新F0特征;提取音频的特征并进行矢量量化;将处理后的F0特征和特征进行拼接,生成匿名化语音;计算来自试验话语和注册话语的说话者嵌入;输出匿名化试验话语嵌入和匿名化注册话语嵌入的相似性分数,根据分数判断是否属于同一说话人;通过多个试验和注册话语对,计算等错误率作为性能指标,评估攻击者系统对匿名化系统的攻击能力;通过考虑F0特征不同帧之间的时间相关性,利用图卷积网络和F0特征协同匿名说话人身份信息,来提升攻击者系统性能。
-
公开(公告)号:CN119993175A
公开(公告)日:2025-05-13
申请号:CN202510157170.9
申请日:2025-02-13
Applicant: 南京邮电大学 , 南京龙垣信息科技有限公司
IPC: G10L21/02 , G10L21/0208 , G10L21/0224 , G10L21/0232 , G10L25/30 , G06N3/0464
Abstract: 本发明涉及语音增强技术领域,具体涉及一种基于改进卷积循环网络的轻量化单通道语音增强方法:充分利用改进卷积循环网络在提取特征时的出色能力,使用聚合分组双路径循环网络和卷积混合分组双路径循环网络来提升多通道的深度时频特征以及对各通道之间的特征进行融合,使得深度特征所包含的语音信息更加的丰富,再利用深度特征来训练分离模型,进一步增强语音的性能,并且提出了聚合分组双路径循环网络和卷积混合分组双路径循环网络,改进了分组双路径循环网络架构,不仅使得卷积循环网络的语音增强性能得到了提升,而且保持了模型的轻量化,从而提高了增强模型的有效性,使得增强语音的清晰度和可懂度提高。
-
公开(公告)号:CN119993192A
公开(公告)日:2025-05-13
申请号:CN202510160462.8
申请日:2025-02-13
Applicant: 南京邮电大学
Abstract: 本发明涉及语音验证技术领域,尤其涉及一种基于对数图傅立叶变换特征提取的语音检测方法,包括以下步骤:构建语音图的平移算子,使用指数函数描述语音样本之间依赖关系的衰减,生成图的拉普拉斯矩阵,并将语音信号表示为无向图以捕获帧内和帧间的结构关系;将语音信号的样本值映射为图节点信号,将语音信号从时域转化到图频域,提取频域特征,并通过同步合并帧内和帧间的振荡分析,结合时域特征形成增强特征表示;生成检测分数以判断语音信号是否存在回放攻击或属于正常语音。本发明通过引入对数图傅立叶变换和图信号处理方法,有效解决了现有技术在回放语音检测中的局限性,显著提升了特征提取的全面性、判别能力和检测系统的性能。
-
-
-