-
公开(公告)号:CN118355436A
公开(公告)日:2024-07-16
申请号:CN202280077165.1
申请日:2022-11-30
Applicant: 三星电子株式会社
Inventor: 金明钟 , 维延德拉·拉吉·埃普斯格卡 , 迪亚·尼拉吉里 , 奇泰延
IPC: G10L17/18 , G10L15/00 , G10L21/0272 , G10L15/16
Abstract: 一种用于处理语音数据的设备可包括被配置为进行以下操作的处理器:从输入语音分离语音信号;识别从所述输入语音分离的所述语音信号中的每一个语音信号的语言;使用至少一个神经网络,基于所述语音信号中的每一个语音信号的语言从所述语音信号中提取说话人嵌入,其中,所述至少一个神经网络被配置为接收所述语音信号并输出所述说话人嵌入;以及通过迭代地聚类所述说话人嵌入来识别所述语音信号中的每一个语音信号的说话人。