语音识别方法、装置、电子设备及存储介质

    公开(公告)号:CN116913268A

    公开(公告)日:2023-10-20

    申请号:CN202211687297.4

    申请日:2022-12-27

    Abstract: 本发明提供一种语音识别方法、装置、电子设备及存储介质,该方法包括:接收待识别的目标语音数据,从目标语音数据中提取声学特征数据;利用预设的目标类预测器,对声学特征数据进行处理,得到目标类特征,基于得到的目标类特征,生成目标向量;将声学特征数据和目标向量输入到自适应编码模型,得到目标特征向量,根据对目标特征向量的解码处理,得到语言识别结果,自适应编码模型包括多层编码器,编码器是将多个适配器引入预训练语音识别模型后进行自适应任务训练所生成的,目标向量用于对每层对应的多个适配器的输出特征进行融合。通过本申请,通过引入语种嵌入特征和场景嵌入特征,实现不同适配器的软融合,提高识别准确率的有益效果。

    语音识别方法、装置、设备及存储介质

    公开(公告)号:CN116913267A

    公开(公告)日:2023-10-20

    申请号:CN202211476833.6

    申请日:2022-11-23

    Abstract: 本申请公开了一种语音识别方法、装置、设备及存储介质。该方法包括:对语音特征数据进行编码处理,得到编码后的特征序列;获取特征序列的第一影响力值和第二影响力值;其中,第一影响力值表示句子粒度的影响力值,第二影响力值表示语音帧粒度的影响力值;对特征序列结合第一影响力值经第一解码处理,得到解码后的第一字符序列;对第一字符序列中的至少一个字符基于置信度和第二影响力值,进行掩蔽处理,得到掩码序列;对特征序列经第二解码处理,得到解码后的第二字符序列;基于第二字符序列和掩码序列,得到作为语音识别的输出结果的第三字符序列。

    一种语音增强方法、装置、设备及存储介质

    公开(公告)号:CN118800266A

    公开(公告)日:2024-10-18

    申请号:CN202311753307.4

    申请日:2023-12-19

    Abstract: 本申请提供一种语音增强方法、装置、设备及存储介质,应用于人工智能技术领域,该方法包括对混合语音进行语音增强,得到所述混合语音中估计的语音和估计的噪声;对所述估计的语音和估计的噪声进行分析,确定所述混合语音中估计的浊音区域噪声;根据所述估计的浊音区域噪声和所述混合语音,确定所述混合语音中估计的非浊音区域噪声;根据所述估计的非浊音区域噪声和所述混合语音,确定所述混合语音中估计的清音。该方法以反向学习估计的浊音区域噪声为依托,得到混合语音中的非浊音区域噪声,然后利用学习得到的非浊音区域的噪声以及原来的混合信号,完整地实现了清音的恢复。

    说话人日志模型训练、说话人日志处理方法、装置及设备

    公开(公告)号:CN118800242A

    公开(公告)日:2024-10-18

    申请号:CN202311549209.9

    申请日:2023-11-20

    Abstract: 本公开提供了一种说话人日志模型训练、说话人日志处理方法、装置及设备,包括:获取目标音频,并通过待训练的说话人日志模型提取目标音频的音频特征;通过待训练的说话人日志模型对音频特征进行音频估计,得到目标音频的音频估计结果;根据音频特征和音频估计结果,确定目标音频的错误估计结果;基于错误估计结果和音频估计结果,对待训练的说话人日志模型进行训练,得到训练后说话人日志模型。不仅提供了音频的特征分析和音频中说话人的分类,还根据错误估计结果对待训练的说话人日志模型进行训练,使得训练后说话人日志模型预测的结果能够更准确。

    无参考说话人日志系统评价方法、装置及设备

    公开(公告)号:CN116978405A

    公开(公告)日:2023-10-31

    申请号:CN202211405269.9

    申请日:2022-11-10

    Abstract: 本申请实施例提供一种无参考说话人日志系统评价方法、装置及设备,该装置包括:错误拒绝与接受模块,用于根据待测样本的帧级别的语音特征和帧级别的序列标签,获得错误接受与拒绝率;混淆模块,用于根据待测样本的帧级别的语音特征和帧级别的序列标签,获得说话人混淆的语音帧率;边界清晰度模块,用于根据待测样本的帧级别的语音特征和帧级别的序列标签,获得说话人轮换边界的清晰度;神经网络模型,用于根据所述错误接受与拒绝率、说话人混淆的语音帧率、说话人轮换边界的清晰度,获取待测样本的评价分数,所述评价分数用于表示说话人日志系统分割性能。

    一种多模态情感识别方法、装置、电子设备和存储介质

    公开(公告)号:CN115905995A

    公开(公告)日:2023-04-04

    申请号:CN202110887127.X

    申请日:2021-08-03

    Inventor: 刘敏

    Abstract: 本申请提供一种多模态情感识别方法、装置、电子设备和计算机存储介质,该方法包括:获取待测样本文件,对所述待测样本文件中N个模态的信息进行特征提取,得到帧级别特征;其中,所述待检测样本文件表示与情感信息相关的文件,N为大于2的整数;从所述N个模态的每个模态的帧级别特征获取L个帧级别特征;根据所述N个模态各自对应的L个帧级别特征,得到N个3阶时序特征张量;L为大于1的整数的平方;根据所述N个3阶时序特征张量,得到N阶多模态融合特征张量;基于所述N阶多模态融合特征张量,确定所述待测样本文件的情感分类结果。

    数据处理方法、装置、电子设备和计算机程序产品

    公开(公告)号:CN116975703A

    公开(公告)日:2023-10-31

    申请号:CN202210995364.2

    申请日:2022-08-18

    Abstract: 本申请涉及数据处理技术领域,提供一种数据处理方法、装置、电子设备和计算机程序产品。所述方法包括:确定待处理数据的特征属性;根据所述特征属性对所述待处理数据进行分类;根据分类结果以及第一知识图谱确定分类数据模型,以根据所述分类数据模型构建第二知识图谱;所述第一知识图谱是基于个体的大数据确定的,所述第二知识图谱是产品应用的知识图谱;根据所述分类结果、所述分类数据模型以及所述第二知识图谱,更新数据模型以及数据关联信息。本申请通过对待处理数据进行数据分类和构建知识图谱处理,解决了数据使用维护效率低、成本高,数据冗余度高等问题,提升了数据的处理效率和使用价值。

    一种共享流量包的余量预警方法、装置及产品

    公开(公告)号:CN119652688A

    公开(公告)日:2025-03-18

    申请号:CN202411766988.2

    申请日:2024-12-04

    Inventor: 刘敏 张旻 李伦辉

    Abstract: 本发明提供一种共享流量包的余量预警方法、装置及产品,其中,包括:将多个第一IP在第一预设时长内使用共享流量资源的第一历史数据作为输入,输入至预先获得的流量分析预测模型中,获得第一IP在当前时间之后的第二预设时长内的第一预测消耗流量值;根据第一预测消耗流量值,在共享流量资源中的至少一个共享流量包的当前流量中进行流量模拟抵扣,获得当前流量在进行流量模拟抵扣后的剩余流量;在剩余流量小于第一阈值的情况下,进行流量告警提示。将不同资源池的共享流量包统一模拟抵扣并在当前流量不够抵扣时进行告警,能够提前提示用户补充新的共享流量包,从而避免流量包余量告警失效,跳过告警,直接产生流量费用的问题。

Patent Agency Ranking