一种基于残差网络及融合特征的说话人年龄性别分类方法

    公开(公告)号:CN111785262B

    公开(公告)日:2022-08-05

    申请号:CN202010578989.X

    申请日:2020-06-23

    Inventor: 文军 汪伟 宋文豪

    Abstract: 本发明提供了一种基于残差网络及融合特征的说话人年龄性别分类方法,本发明将MFCC参数和基频F0结合,将它们的复合特征作为说话人性别年龄分类的语音特征;本发明采用卷积残差网络训练说话人性别年龄识别模型,残差网络解决了深度神经网络中,因为网络层次的加深导致的梯度爆炸和消失,使得在训练中能够使用更深的网络,提取出更深层的语音特征,从而提高识别的准确度。本发明根据说话人的性别年龄,仅仅将说话人分为(未成年男女 =55)共六个分类,以提高识别度。

    一种基于残差网络及融合特征的说话人年龄性别分类方法

    公开(公告)号:CN111785262A

    公开(公告)日:2020-10-16

    申请号:CN202010578989.X

    申请日:2020-06-23

    Inventor: 文军 汪伟 宋文豪

    Abstract: 本发明提供了一种基于残差网络及融合特征的说话人年龄性别分类方法,本发明将MFCC参数和基频F0结合,将它们的复合特征作为说话人性别年龄分类的语音特征;本发明采用卷积残差网络训练说话人性别年龄识别模型,残差网络解决了深度神经网络中,因为网络层次的加深导致的梯度爆炸和消失,使得在训练中能够使用更深的网络,提取出更深层的语音特征,从而提高识别的准确度。本发明根据说话人的性别年龄,仅仅将说话人分为(未成年男女 =55)共六个分类,以提高识别度。

Patent Agency Ranking