-
公开(公告)号:CN118284932A
公开(公告)日:2024-07-02
申请号:CN202280076890.7
申请日:2022-11-28
Applicant: 三星电子株式会社
Inventor: 金明锺 , 维坚德拉·拉杰·安普辛格卡尔 , 艾维亚乐·安舒 , 奇泰延
IPC: G10L17/02 , G10L17/18 , G10L25/18 , G10L17/04 , G10L21/0272
Abstract: 一种用于处理语音数据的装置可包括:处理器,被配置为:将输入语音分离成语音信号;识别语音信号中的每个语音信号的带宽;使用被配置为接收语音信号并输出说话人嵌入的至少一个神经网络,基于语音信号中的每个语音信号的带宽从语音信号中提取说话人嵌入;以及将说话人嵌入聚类为一个或更多个说话人聚类,其中,每个说话人聚类与说话人标识对应。