基于任务的多项式损失提升多语言元学习语音识别方法

    公开(公告)号:CN116229948A

    公开(公告)日:2023-06-06

    申请号:CN202211655769.8

    申请日:2022-12-22

    Abstract: 本发明提供一种基于任务的多项式损失提升多语言元学习语音识别方法。该方法包括:步骤1:初始化语音识别模型,输入原始语音特征序列;步骤2:从多语言数据集中抽取任务Ti,将Ti分为支持集和查询集;步骤3:计算Ti的ASR损失,使用梯度下降得到在支持集上更新后的参数θi;步骤4:使用在支持集上更新后的参数θi在查询集上计算查询损失步骤5:根据Ti的计算得到Ti的多项式损失;步骤6:重复N次步骤2至步骤5,计算得到N个任务对应的多项式损失;步骤7:基于所有任务对应的多项式损失来更新语音识别模型参数θ;步骤8:重复步骤2至步骤7,直至更新后的语音识别模型fθ满足给定要求。

    一种可视化人声分离系统、方法以及装置

    公开(公告)号:CN114464198A

    公开(公告)日:2022-05-10

    申请号:CN202111437237.2

    申请日:2021-11-30

    Abstract: 本发明属于人工智能人声分离技术领域,特别涉及一种可视化人声分离系统、方法以及装置,该方法包括打开可视化人声分离系统,把要分离的音/视频文件导入系统中;把音/视频转换成和人声分离算法相匹配的音频格式;把要处理的音频文件进行逻辑切分,按时间先后顺序进行分句,最终形成每句话包含说话人名称、开始时间和结束时间的json文件;把分离后的结果在界面上进行展示,音频文件以波形形式展示在上半部分,解析后的json文件以列表形式展示在下半部分;在结果展示界面进行每句话的播放和调整,实现精准人声分离;把分离好的人声分句,根据需求进行选中导出。本发明在人工智能人声分离算法基础上,进行界面可视化的手动调整,达到精准人声分离效果。

    面向序列任务的Transformer监督学习双重一致性正则化方法及系统

    公开(公告)号:CN116611473A

    公开(公告)日:2023-08-18

    申请号:CN202310629724.1

    申请日:2023-05-31

    Abstract: 本发明涉及人工智能应用技术领域,特别涉及一种面向序列任务的Transformer监督学习双重一致性正则化方法及系统,通过对训练输入序列添加扰动,得到用于模型训练的扰动序列数据;基于扰动序列数据确定基础模型训练损失、及基础模型和均值模型之间一致性损失,其中,基础模型为采用Transformer结构建模的序列任务端到端模型,均值模型为基于基础模型并利用指数移动平均值对基础模型反向传播更新参数进行迁移来获取的模型结构;基于基础模型训练损失和基础模型和均值模型之间一致性损失获取基础模型的整体训练损失;基于整体训练损失调整基础模型参数,得到目标序列任务端到端模型。本发明可提升序列生成模型鲁棒性,便于机器翻译、文本摘要等序列任务中应用。

Patent Agency Ranking