一种基于文本相关信息感知的说话人识别方法与系统

    公开(公告)号:CN113705671A

    公开(公告)日:2021-11-26

    申请号:CN202110996082.X

    申请日:2021-08-27

    Applicant: 厦门大学

    Inventor: 李琳 刘妍 洪青阳

    Abstract: 本发明给出了一种基于文本相关信息感知的说话人识别方法与系统,包括利用包含说话人分类、文本相关信息分类的子网络构建网络结构,其中文本相关信息分类子网络可以有效辅助说话人识别;提出的文本相关信息感知注意力池化,有效利用文本相关信息分类子网络的信息,对帧级别共享特征赋予不同的文本相关信息的权重值,区分不同特征向量对于系统识别能力的贡献度;提出文本相关信息感知动态角边距损失函数,有效利用文本相关信息分类子网络的信息,针对每个输入样本对应的角边距赋予不同的文本相关信息的权重值,压缩类内间距,加快损失函数收敛。可应用于跨信道、跨语种、噪声干扰等多种情况下的生物智能识别、安防领域,提高说话人识别的准确率。

    一种基于文本相关信息感知的说话人识别方法与系统

    公开(公告)号:CN113705671B

    公开(公告)日:2023-08-29

    申请号:CN202110996082.X

    申请日:2021-08-27

    Applicant: 厦门大学

    Inventor: 李琳 刘妍 洪青阳

    Abstract: 本发明给出了一种基于文本相关信息感知的说话人识别方法与系统,包括利用包含说话人分类、文本相关信息分类的子网络构建网络结构,其中文本相关信息分类子网络可以有效辅助说话人识别;提出的文本相关信息感知注意力池化,有效利用文本相关信息分类子网络的信息,对帧级别共享特征赋予不同的文本相关信息的权重值,区分不同特征向量对于系统识别能力的贡献度;提出文本相关信息感知动态角边距损失函数,有效利用文本相关信息分类子网络的信息,针对每个输入样本对应的角边距赋予不同的文本相关信息的权重值,压缩类内间距,加快损失函数收敛。可应用于跨信道、跨语种、噪声干扰等多种情况下的生物智能识别、安防领域,提高说话人识别的准确率。

Patent Agency Ranking