-
公开(公告)号:CN114766052A
公开(公告)日:2022-07-19
申请号:CN202080083901.5
申请日:2020-12-21
Applicant: 格林伊登美国控股有限责任公司
Abstract: 本发明公开了一种方法,该方法包括:接收包括语音信号的多个音频片段,其中音频片段表示多个言语交互;接收与在音频片段中的每个音频片段中表达的情绪状态相关联的标签;基于指定的帧持续时间,将音频片段中的每个音频片段划分成多个帧;从帧中的每个帧提取多个声学特征;相对于表示音频片段中的音素边界的帧序列,计算声学特征的统计数据;在训练阶段,在训练集上训练机器学习模型,该训练集包括:与音频片段相关联的统计数据,和标签;以及在推理阶段,将训练后的模型应用于包括语音信号的一个或多个目标音频片段,以检测在目标音频片段中表达的情绪状态。
-
公开(公告)号:CN114556468A
公开(公告)日:2022-05-27
申请号:CN202080073153.2
申请日:2020-10-21
Applicant: 格林伊登美国控股有限责任公司
Abstract: 本发明公开了一种方法,该方法包括:接收输入音频文件;将经训练的语音识别算法应用于所述输入音频文件以获得与所述输入音频文件中的每个输入音频文件对应的经识别的语音;选择具有指定句法模式的一个或多个部分(“选定部分”);过滤所述选定部分以导出经过滤的一组选定部分,其中该过滤基于以下中的一者:所述选定部分的内容、持续时间或置信度得分;针对所述过滤组中的所述选定部分中的每个选定部分创建训练音频文件;针对所述训练音频文件中的每个训练音频文件获得训练转录;以及在训练集上重新训练所述经训练的语音识别算法,该训练集具有针对所述经过滤的一组选定部分中的所述选定部分中的每个选定部分的所述训练音频文件和所述对应的训练转录。
-