一种音频指纹的提取方法、装置、电子设备及存储介质

    公开(公告)号:CN112037814B

    公开(公告)日:2024-01-30

    申请号:CN202010845686.X

    申请日:2020-08-20

    Inventor: 陈晓敏 姜涛

    Abstract: 本公开提供一种音频指纹的提取方法、装置、电子设备及存储介质,涉及声纹识别技术领域,用于提高音频指纹的鲁棒性。该方法包括:确定待处理的音频信号,并对待处理的音频信号进行频谱特征提取处理,获得目标频谱图;从目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,局部峰值点候选集包括目标频谱图上按照预设频段划分的各区域中的峰值点;从目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合;基于局部峰值点候选集和平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据目标局部峰值点集合确定待处理的音频信号的音频指纹,目标局部峰值点集合包括从局部峰值点候选集中剔除平坦区域的局部峰值点集合中的峰值点。

    一种旋律生成方法及装置
    3.
    发明公开

    公开(公告)号:CN114582305A

    公开(公告)日:2022-06-03

    申请号:CN202011380378.0

    申请日:2020-11-30

    Abstract: 本公开公开了一种旋律生成方法及装置。该方法中获取歌词文本中的至少一个分句;对各分句进行情感分析,得到相应分句的情感信息;将各分句与相应分句的情感信息进行拼接后,输入已训练的基于自注意力机制的模型,得到各分句对应的旋律向量;其中,基于自注意力机制的模型用于依照上一输入数据获得的旋律向量,对当前输入数据进行处理,得到当前输入数据对应的旋律向量;基于各分句的旋律向量,生成歌词文本的旋律。该方法在存在歌词文本的条件下,通过对歌词文本进行文字情感分析,得到该歌词文本对应的情感信息使生成的旋律在情感上与歌词保持一致,提高了生成旋律的自然程度,以及生成旋律的质量。

    一种音频信号人声增强的方法及装置

    公开(公告)号:CN111508519B

    公开(公告)日:2022-04-26

    申请号:CN202010259819.5

    申请日:2020-04-03

    Inventor: 邓峰 姜涛 李岩

    Abstract: 本公开关于一种音频信号人声增强的方法及装置,涉及多媒体技术领域,能够以较低的数据处理复杂度,解决实时音频文件传输中的人声对话增强的技术问题。该方法包括:对原始音频信号进行加窗分帧处理,得到多个音频信号片段;根据多个音频信号片段得到每个音频信号片段的基频信息和多个特征参数;其中,每个音频信号片段的多个特征参数包括每个音频信号片段在幅度谱上被划分为多个巴克Bark子带的特征参数;根据神经网络算法依次对每个音频信号片段片段进行增强处理,分别得到每个音频信号片段的人声增强信号;将每个音频信号片段的人声增强信号依次叠接相加,得到目标增强信号。

    一种混响消除方法及装置

    公开(公告)号:CN112289334B

    公开(公告)日:2021-04-02

    申请号:CN202011588741.8

    申请日:2020-12-29

    Abstract: 本申请涉及语音处理技术领域,公开了一种混响消除方法及装置,用以解决难以消除混响时间较长的语音信号的问题。该方法包括:生成音频对应的声谱图和相位谱图,声谱图上的每一帧对应一个语音信号组;对各帧进行特征提取得到对应的语音特征,并确定各个语音特征的上下文关联向量;再基于各个语音特征以及对应的上下文关联向量,确定出声谱图上各个语音信号的语音掩蔽估计值,并根据各个语音掩蔽估计值对声谱图执行消除混响操作,得到去混响的声谱图;最后利用去混响的声谱图和相位谱图得到去混响的音频。通过对输入的语音特征图添加注意力,可以使得语音特征图上的语音特征以干净语音信息或者混响语音信息为主导,从而区分干净语音和混响语音。

    一种音频分类方法、装置及存储介质

    公开(公告)号:CN112380382A

    公开(公告)日:2021-02-19

    申请号:CN202011324279.0

    申请日:2020-11-23

    Inventor: 张文文 李岩 姜涛

    Abstract: 本申请公开了一种音频分类方法、装置及存储介质,涉及音频处理领域,以挖掘出当前最新的,播放热度高的歌曲。该方法中,通过目标音频的音频指纹获取对应的音频检索资源,并将目标指纹分别与对应的音频检索资源进行指纹匹配,从而得到目标指纹的待分类音频集合。将目标音频与待分类音频集合中的各待分类音频进行分类,得到分类结果。这样,通过对目标音频的音频分类,可以得到目标音频分类后的音频,从而在较多的音频内容中,提高音频分类的准确性。

    语种识别方法、装置、服务器及存储介质

    公开(公告)号:CN112185347A

    公开(公告)日:2021-01-05

    申请号:CN202011033457.4

    申请日:2020-09-27

    Abstract: 本公开关于一种语种识别方法、装置、服务器及存储介质,该方法包括:获取待检测音频信号中的声学特征;将声学特征输入预先训练的声纹特征提取网络模型中,得到预先训练的声纹特征提取网络模型中目标神经网络层输出的特征,作为待检测音频信号中的声纹特征;根据待检测音频信号中的声纹特征以及各个预设语种音频信号中的声纹特征,确定待检测音频信号与各个预设语种音频信号之间的对数似然比值;根据各个对数似然比值,确定待检测音频信号与各个预设语种音频信号之间的特征相似度;根据特征相似度,从各个预设语种音频信号对应的语种信息中,确定待检测音频信号的语种信息。采用本方法,有利于提高语种识别的准确度。

    多音轨序列生成方法、装置、设备及存储介质

    公开(公告)号:CN109616090B

    公开(公告)日:2020-12-18

    申请号:CN201811584207.2

    申请日:2018-12-24

    Inventor: 姜涛 李岩

    Abstract: 本公开是关于一种多音轨序列生成方法、装置、设备及存储介质,属于互联网技术领域,该方法包括:生成与原始音频对应的第一旋律单元序列;获取预设数据库,预设数据库中包括乐理知识规则以及多个模板数据;根据第一旋律单元序列与多个模板数据之间的匹配度,从预设数据库中获取与第一旋律单元序列匹配的模板数据;根据第一旋律单元序列匹配的模板数据,得到第二旋律单元序列;将第一旋律单元序列和第二旋律单元序列进行合成,得到多音轨的第三旋律单元序列。本公开利用乐理知识规则生成与原始音频匹配的多音轨旋律单元序列,从而得到了与原始音频匹配的音乐作品,提高了音乐作品的多样性和表现能力,增强了趣味性,更好的满足了用户的需求。

    一种音频指纹的提取方法、装置、电子设备及存储介质

    公开(公告)号:CN112037814A

    公开(公告)日:2020-12-04

    申请号:CN202010845686.X

    申请日:2020-08-20

    Inventor: 陈晓敏 姜涛

    Abstract: 本公开提供一种音频指纹的提取方法、装置、电子设备及存储介质,涉及声纹识别技术领域,用于提高音频指纹的鲁棒性。该方法包括:确定待处理的音频信号,并对待处理的音频信号进行频谱特征提取处理,获得目标频谱图;从目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,局部峰值点候选集包括目标频谱图上按照预设频段划分的各区域中的峰值点;从目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合;基于局部峰值点候选集和平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据目标局部峰值点集合确定待处理的音频信号的音频指纹,目标局部峰值点集合包括从局部峰值点候选集中剔除平坦区域的局部峰值点集合中的峰值点。

    音频文件的原唱检测方法、装置、服务器及存储介质

    公开(公告)号:CN111508506A

    公开(公告)日:2020-08-07

    申请号:CN202010259245.1

    申请日:2020-04-03

    Inventor: 张文文 李岩 姜涛

    Abstract: 本公开关于一种音频文件的原唱检测方法、装置、服务器及存储介质,该方法包括:提取待检测音频文件的音频指纹,根据待检测音频文件的音频指纹,确定与待检测音频文件对应的歌曲音频文件;从待检测音频文件中分离出人声音频;分别提取人声音频的音频指纹和歌曲音频文件的音频指纹;根据人声音频的音频指纹和歌曲音频文件的音频指纹,确定对待检测音频文件的原唱检测结果。采用本方法,综合考虑了待检测音频文件中的人声音频的音频指纹以及与待检测音频文件对应的歌曲音频文件的音频指纹,避免了仅仅考虑待检测音频文件中的音频指纹,导致确定出的原唱检测结果的准确率较低的缺陷,从而提高了音频文件的原唱检测准确率。

Patent Agency Ranking