语音场景篡改鉴别的方法、装置、电子设备及存储介质

    公开(公告)号:CN114155875B

    公开(公告)日:2022-05-03

    申请号:CN202210120276.8

    申请日:2022-02-09

    Abstract: 本申请涉及一种语音场景篡改鉴别的方法、装置、电子设备及存储介质,所述语音场景篡改鉴别的方法,包括以下步骤:提取输入的待鉴别音频的对数功率谱的声学特征;将提取的待鉴别音频的对数功率谱的声学特征输入预先训练的语音场景篡改识别模型中,输出待鉴别音频场景是否被篡改的结果,其中,所述语音场景篡改识别模型由语音场景篡改后的音频与原始语音数据按照预设比例混合作为训练集训练得到的,本申请能够通过待鉴别音频的对数功率谱识别出语音的篡改,特别是能够应用于语音场景的篡改,从而应对语音场景篡改这一手段的危害。

    语音检测方法及装置、电子设备及存储介质

    公开(公告)号:CN114420100A

    公开(公告)日:2022-04-29

    申请号:CN202210321299.5

    申请日:2022-03-30

    Abstract: 本公开涉及一种语音检测方法及装置、电子设备及存储介质,所述方法包括:对待检测语音进行声学特征提取,得到第一声学特征和第二声学特征;将第一声学特征序列输入预先训练好的采样率预测模型,得到采样率信息特征;将第二声学特征和采样率信息特征输入预先训练好的语音检测模型,得到待检测语音为真实语音或合成语音的分类结果,结合采样率信息特征对待检测语音进行检测,能够对实际场景中音频进行音频质量的快速判别,帮助语音检测模型对实际音频的不同频带进行更加有侧重的识别,避免假高频语音对模型判别进行干扰,提高检测模型的分类精确度。

    一种知识图谱自动补全方法

    公开(公告)号:CN114399049A

    公开(公告)日:2022-04-26

    申请号:CN202210289845.1

    申请日:2022-03-22

    Abstract: 本发明提供一种知识图谱自动补全方法,对于图谱中每一实体,统计其连接的关系边的种类和指向情况生成连边信息项集,通过对实体连边信息项集进行频繁二项集挖掘并生成关联规则,区分主要连边信息并进一步生成逆向关联规则,由关联规则生成实体的缺失连边信息并作为待补全三元组。此外,在处理过程中将会剔除明显的多对一关系的头实体连边信息以及明显的一对多关系的尾实体连边信息。解决了传统图谱补全算法无法自动获得待补全三元组的问题,为图谱补全算法提供了对信息搜索和补全的指导,节约时间和成本,提高效率和准确率,能提升在生物医学、金融信息、安保防护等多种领域下涉及图谱的算法表现。

    语音对抗样本生成方法及装置、电子设备及存储介质

    公开(公告)号:CN114267363A

    公开(公告)日:2022-04-01

    申请号:CN202210201797.6

    申请日:2022-03-03

    Abstract: 本公开涉及一种语音对抗样本生成方法及装置、电子设备及存储介质,所述方法包括:接收目标文本,并从所述目标文本中提取文本特征序列;将所述文本特征序列输入预先训练好的声学模型,得到多维声学参数序列;将所述多维声学参数序列输入预先训练好的声码器模型,生成语音的时域采样序列,作为目标文本对应的对抗样本,声学模型的输出为多维声学参数序列,使得生成的语音内容在多种声学特征维度描述下保证高相似度(匹配度),因而,在语音对抗样本的生成过程中利用多维声学参数重构方法,能够提升语音对抗样本的抗检测能力,更加有效对语音生成检测模型进行欺骗。

    一种语音识别与语音翻译端到端系统及设备

    公开(公告)号:CN113920989B

    公开(公告)日:2022-04-01

    申请号:CN202111516645.7

    申请日:2021-12-13

    Abstract: 本发明提供一种语音识别与语音翻译端到端系统及电子设备,其中,系统包括:声学编码器、多任务解码器和语义不变性约束模块,同时完成识别系统与翻译系统这两个任务,另外根据不同任务的文本语义相同特点,对模型施加语义约束,学习高层次语义信息,语义信息可以有效提升语音识别与语音翻译的性能。本发明具有避免了串行系统的误差累积问题,同时模型的计算代价低,实时性很高;同时利用不同任务之间文本的语义一致性特点,对模型施加语义约束,学习高层次语义信息。

    编辑音频的方法、装置、电子设备及存储介质

    公开(公告)号:CN113724686B

    公开(公告)日:2022-04-01

    申请号:CN202111292710.2

    申请日:2021-11-03

    Abstract: 本申请涉及一种编辑音频的方法、装置、电子设备及存储介质,所述方法包括:获取根据已知的修改文本对已知的待编辑音频的原始文本进行修改得到的修改后文本;预测所述修改文本对应的音频持续时长;根据所述修改文本对应的音频持续时长对所述待编辑音频的待编辑区域进行调整,得到调整后的待编辑音频;基于预先训练的音频编辑模型,根据调整后的待编辑音频与修改后文本得到编辑后音频,本申请通过音频编辑模型得到的编辑后音频上下文听感自然,而且支持合成未出现在语料库中的新词的功能。

    语音识别方法、系统、电子设备和存储介质

    公开(公告)号:CN113948085B

    公开(公告)日:2022-03-25

    申请号:CN202111577269.2

    申请日:2021-12-22

    Abstract: 本发明实施例公开了一种语音识别方法、系统、电子设备和存储介质,涉及语音识别技术领域。该实施例包括:对待识别音频进行编码表示,获得所述待识别音频的声学编码状态向量序列;对所述待识别音频的声学编码状态向量序列进行稀疏编码,获得声学编码稀疏向量;确定预设的词表中每一标签的文本预测向量;根据所述声学编码稀疏向量和所述文本预测向量,识别所述待识别音频,确定与所述待识别音频对应的文本内容。本发明实施例通过对待识别音频的声学编码状态向量进行稀疏编码,得到待识别音频的声学编码稀疏向量,从而降低编码帧数以实现降低计算代价,提升语音识别的速度。

    生成语音的检测方法、装置、电子设备及存储介质

    公开(公告)号:CN113808579B

    公开(公告)日:2022-03-08

    申请号:CN202111383856.8

    申请日:2021-11-22

    Abstract: 本公开涉及一种生成语音的检测方法、装置、电子设备及存储介质,上述方法包括:获取待检测语音,并提取所述待检测语音的第一声学特征和第二声学特征;将所述第一声学特征输入语音识别模型,输出所述第一声学特征对应的文本序列;分别通过词嵌入模型与语音嵌入模型提取所述文本序列的词向量和音向量;对所述词向量和所述音向量进行拼接处理,得到第一融合特征,并将所述第一融合特征输入韵律节奏预测模型,输出韵律节奏特征;对所述第二声学特征和所述韵律节奏特征进行所述拼接处理,得到第二融合特征,并将所述第二融合特征输入语音检测模型,输出语音检测结果。

    麦克风阵列语音增强的方法、装置、电子设备及存储介质

    公开(公告)号:CN113889137A

    公开(公告)日:2022-01-04

    申请号:CN202111473848.2

    申请日:2021-12-06

    Abstract: 本申请涉及一种麦克风阵列语音增强的方法、装置、电子设备及存储介质,所述方法包括:通过麦克风阵列获取已知声源方向的待增强语音信号;提取所述待增强语音信号的频谱特征和方向相干特征;将所述待增强语音信号的频谱特征和方向相干特征输入预先训练好的语音增强网络中,得到所述待增强语音信号的增强后傅里叶系数;对所述待增强语音信号的增强后傅里叶系数进行逆傅里叶变换,得到增强后语音信号,本申请通过语音增强网络实现了波束形成的滤波操作,并且波束形成的权重系数基于数据驱动的监督性学习方法训练得到,更接近实际应用场景,以提高语音增强效果。

Patent Agency Ranking