-
公开(公告)号:CN118821912A
公开(公告)日:2024-10-22
申请号:CN202410009690.0
申请日:2024-01-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06N3/0985 , G06N3/084 , G06N3/045
Abstract: 本申请公开了一种数据处理方法、装置、设备及计算机可读存储介质。其中,所述方法包括:获取训练数据;将所述训练数据输入至第一模型中,得到所述第一模型的输出结果;其中,所述第一模型表征待优化模型,所述第一模型由至少两个待优化子模型级联得到;各所述待优化子模型包括至少一个搜索空间模块,所述搜索空间模块用于对搜索空间中各候选路径的调整方式进行搜索,以得到目标调整策略;所述目标调整策略用于对所述第一模型的参数进行调整。
-
公开(公告)号:CN118800204A
公开(公告)日:2024-10-18
申请号:CN202410232862.0
申请日:2024-02-29
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种演奏乐曲的评分方法、装置、电子设备、存储介质及计算机程序产品,方法包括:调用卷积循环神经网络对基于第一乐谱演奏的第一音频信号的对数梅尔谱特征进行处理,得到第一序列,所述第一序列表征基于所述第一音频信号确定出的每个音符对应的一个或多个第一特征的预测值;再调用Transformer网络对基于第一乐谱生成的乐MIDI序列的第二序列进行处理,得到第三序列;所述第三序列表征基于第一乐谱生成的MIDI序列的一个或多个第一特征的后验概率特征序列;将第一序列与第三序列进行对齐处理,得到在特征空间上与基于第一乐谱生成的MIDI序列对齐的第五序列,然后基于第五序列中的一个或多个第一特征的特征值,得到第一音频信号的评分。
-
公开(公告)号:CN118505243A
公开(公告)日:2024-08-16
申请号:CN202310123484.8
申请日:2023-02-16
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06Q30/018 , G10L15/26 , G10L25/24 , G06F16/332 , G06F16/35 , G06F18/24 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/0895 , G06N3/096
Abstract: 本发明提供了一种数据处理方法、装置及设备,其中,数据处理方法包括:根据待识别对象所对应的通信数据,构建多模态通信图;将所述多模态通信图经过图嵌入处理后,输入图注意力模型,得到用户表示向量;根据所述用户表示向量,对所述待识别对象进行分类或聚类识别。本方案能够实现根据多模态通信数据得到多模态通信图以进行对象识别,据此提高反诈对象的识别准确率,很好的解决现有技术中针对反诈对象识别的处理方案准确率低的问题。
-
公开(公告)号:CN116992929A
公开(公告)日:2023-11-03
申请号:CN202211147941.9
申请日:2022-09-19
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06N3/0475 , G06N5/01 , G06N3/08 , G06N20/20 , G06F16/901 , G06F16/903 , G06F40/166 , G06F40/205 , G06F40/279
Abstract: 本发明公开了一种网络架构确定方法、装置和存储介质;所述方法包括:根据目标任务查询预设的数据库,确定实现所述目标任务所需的目标AI能力集合;根据所述目标AI能力集合,建立所述目标任务对应的超网络;所述超网络包括至少一条路径的AI能力组合;根据所述超网络进行路径搜索,确定所述目标任务对应的目标AI能力组合。
-
公开(公告)号:CN116913244A
公开(公告)日:2023-10-20
申请号:CN202310192642.5
申请日:2023-02-24
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本发明提供一种语音合成方法、设备及介质,涉及人工智能领域,其中,所述语音合成方法包括:获取待合成的音素信息;利用非自回归声学模型处理所述音素信息,获取所述音素信息对应的第一梅尔频谱信息;根据所述第一梅尔频谱信息,合成目标语音。在语音合成过程中,具体采用非自回归声学模型对音素信息进行处理,获取对应的梅尔谱,能够充分利用处理器的并行能力,进而可以加快合成速度,且减少错误累积和错误传递,即在提高语音合成速度的同时提高语音合成的鲁棒性。
-
公开(公告)号:CN118800242A
公开(公告)日:2024-10-18
申请号:CN202311549209.9
申请日:2023-11-20
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本公开提供了一种说话人日志模型训练、说话人日志处理方法、装置及设备,包括:获取目标音频,并通过待训练的说话人日志模型提取目标音频的音频特征;通过待训练的说话人日志模型对音频特征进行音频估计,得到目标音频的音频估计结果;根据音频特征和音频估计结果,确定目标音频的错误估计结果;基于错误估计结果和音频估计结果,对待训练的说话人日志模型进行训练,得到训练后说话人日志模型。不仅提供了音频的特征分析和音频中说话人的分类,还根据错误估计结果对待训练的说话人日志模型进行训练,使得训练后说话人日志模型预测的结果能够更准确。
-
公开(公告)号:CN117037823A
公开(公告)日:2023-11-10
申请号:CN202311013611.5
申请日:2023-08-11
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G10L21/013 , G10L25/30 , G10L19/00
Abstract: 本实施例公开了一种语音转换方法、装置、电子设备和存储介质,该方法包括:获取源说话人的第一语音数据和目标说话人的第二语音数据;对所述第一语音数据提取第一线性谱,对所述第二语音数据提取第一说话人向量;通过对所述第一线性谱进行编码,得出所述第一语音数据的第一内容分布;根据所述第一说话人向量,对所述第一内容分布进行变换分布,得到第二内容分布;根据所述第一说话人向量和所述第二内容分布,重构所述目标说话人的语音数据。
-
公开(公告)号:CN116978405A
公开(公告)日:2023-10-31
申请号:CN202211405269.9
申请日:2022-11-10
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本申请实施例提供一种无参考说话人日志系统评价方法、装置及设备,该装置包括:错误拒绝与接受模块,用于根据待测样本的帧级别的语音特征和帧级别的序列标签,获得错误接受与拒绝率;混淆模块,用于根据待测样本的帧级别的语音特征和帧级别的序列标签,获得说话人混淆的语音帧率;边界清晰度模块,用于根据待测样本的帧级别的语音特征和帧级别的序列标签,获得说话人轮换边界的清晰度;神经网络模型,用于根据所述错误接受与拒绝率、说话人混淆的语音帧率、说话人轮换边界的清晰度,获取待测样本的评价分数,所述评价分数用于表示说话人日志系统分割性能。
-
公开(公告)号:CN116913247A
公开(公告)日:2023-10-20
申请号:CN202211466722.7
申请日:2022-11-22
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本申请实施例提供了一种语音识别方法,该方法包括:获取待识别语音数据;其中,待识别语音数据为包括至少一种方言的语音数据;确定待识别语音数据对应的语音声学特征和方言嵌入特征;将语音声学特征和方言嵌入特征输入至编码网络,获取待识别语音数据对应的特征序列;其中,编码网络包括至少一层编码器,至少一层编码器均包括门控网络,共享专家网络以及多个私有专家网络;根据特征序列生成待识别语音数据对应的识别结果,通过编码网络中的门控网络输出的权重值动态选择相对应的私有专家网络对待识别语音数据对应的声学编码特征进行处理,且同时通过共享专家网络可以建模不同方言间的共性特征,以此来提升语音识别的准确率。
-
公开(公告)号:CN118800220A
公开(公告)日:2024-10-18
申请号:CN202311641006.2
申请日:2023-12-01
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种用于语音识别的模型训练及应用方法、设备和存储介质。该方法包括:获取训练样本集,所述训练样本集包括多组训练样本,每组所述训练样本包括成对的语音数据和文本数据,所述文本数据与所述语音数据的内容相同;针对各组所述训练样本,对每组所述训练样本中所述语音数据的语音嵌入特征和所述文本数据的文本语义特征进行特征融合,获得各组所述训练样本的融合特征;基于各组所述训练样本的融合特征和对应的所述文本数据,确定语音识别模型的各损失值;基于各所述损失值和设定的损失函数的目标值,对语音识别模型的参数进行调整,直至获得训练好的语音识别模型。采用本申请的方法,可以提高语音识别的准确性。
-
-
-
-
-
-
-
-
-