一种音频分类方法、装置及存储介质

    公开(公告)号:CN112380382A

    公开(公告)日:2021-02-19

    申请号:CN202011324279.0

    申请日:2020-11-23

    Inventor: 张文文 李岩 姜涛

    Abstract: 本申请公开了一种音频分类方法、装置及存储介质,涉及音频处理领域,以挖掘出当前最新的,播放热度高的歌曲。该方法中,通过目标音频的音频指纹获取对应的音频检索资源,并将目标指纹分别与对应的音频检索资源进行指纹匹配,从而得到目标指纹的待分类音频集合。将目标音频与待分类音频集合中的各待分类音频进行分类,得到分类结果。这样,通过对目标音频的音频分类,可以得到目标音频分类后的音频,从而在较多的音频内容中,提高音频分类的准确性。

    音频文件的原唱检测方法、装置、服务器及存储介质

    公开(公告)号:CN111508506A

    公开(公告)日:2020-08-07

    申请号:CN202010259245.1

    申请日:2020-04-03

    Inventor: 张文文 李岩 姜涛

    Abstract: 本公开关于一种音频文件的原唱检测方法、装置、服务器及存储介质,该方法包括:提取待检测音频文件的音频指纹,根据待检测音频文件的音频指纹,确定与待检测音频文件对应的歌曲音频文件;从待检测音频文件中分离出人声音频;分别提取人声音频的音频指纹和歌曲音频文件的音频指纹;根据人声音频的音频指纹和歌曲音频文件的音频指纹,确定对待检测音频文件的原唱检测结果。采用本方法,综合考虑了待检测音频文件中的人声音频的音频指纹以及与待检测音频文件对应的歌曲音频文件的音频指纹,避免了仅仅考虑待检测音频文件中的音频指纹,导致确定出的原唱检测结果的准确率较低的缺陷,从而提高了音频文件的原唱检测准确率。

    副歌检测方法、装置、电子设备及存储介质

    公开(公告)号:CN110808065A

    公开(公告)日:2020-02-18

    申请号:CN201911031441.7

    申请日:2019-10-28

    Abstract: 本公开提供一种副歌检测方法、装置、电子设备及计算机可读存储介质,所述方法包括:从待检测音频文件中获取多个音频片段;对于每一音频片段,确定所述音频片段分别与其之后的每个音频片段的相似度;针对每一音频片段,计算相似度超过预设阈值的数量,确定该音频片段的重复次数;将重复次数最多的音频片段作为副歌;本公开实现准确获取副歌的过程。

    一种音频合成的方法、装置及设备

    公开(公告)号:CN110400559B

    公开(公告)日:2020-09-29

    申请号:CN201910579288.5

    申请日:2019-06-28

    Abstract: 本公开是关于一种音频合成的方法、装置及设备,用于提高制作合成音频文件的效率。该音频合成的方法包括:获取至少两个候选音频切片;获取所述至少两个候选音频切片中每个候选音频切片的第一子切片和第二子切片;其中,所述第一子切片为对应候选音频切片的从起始时刻开始的预设时间长度的切片,所述第二子切片为对应候选音频切片的结束时刻之前的所述预设时间长度的切片;根据所述每个候选音频切片的第一子切片和第二子切片,计算所述至少两个候选音频切片中来自不同音频文件的每两个候选音频切片之间的相似度;根据所述每两个候选音频切片之间的相似度将所述至少两个候选音频切片中的部分或全部拼接在一起,获取合成音频文件。

    音频数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN109829067A

    公开(公告)日:2019-05-31

    申请号:CN201910165235.9

    申请日:2019-03-05

    Inventor: 张文文 李岩 姜涛

    Abstract: 本公开是关于一种音频数据处理方法、装置、电子设备及存储介质,涉及多媒体技术领域,所述方法包括:对音频文件进行特征提取,得到音频文件的多个第一音频片段的第一特征;调用情感识别模型,将多个第一音频片段的第一特征输入情感识别模型中,输出多个第一音频片段的情感程度值;根据多个第一音频片段的情感程度值,将音频文件中总长度为目标长度且情感程度值的和值最大的至少一个连续的第二音频片段,作为音频文件的高潮片段。本公开实施例并非简单的检测音频文件中重复的部分,而是对音频文件的各个部分的情感进行分析,从而将情感表达的相对激烈的部分作为高潮片段,音频数据处理方法的准确率高。

    一种音频分类方法、装置及存储介质

    公开(公告)号:CN112380382B

    公开(公告)日:2024-03-12

    申请号:CN202011324279.0

    申请日:2020-11-23

    Inventor: 张文文 李岩 姜涛

    Abstract: 本申请公开了一种音频分类方法、装置及存储介质,涉及音频处理领域,以挖掘出当前最新的,播放热度高的歌曲。该方法中,通过目标音频的音频指纹获取对应的音频检索资源,并将目标指纹分别与对应的音频检索资源进行指纹匹配,从而得到目标指纹的待分类音频集合。将目标音频与待分类音频集合中的各待分类音频进行分类,得到分类结果。这样,通过对目标音频的音频分类,可以得到目标音频分类后的音频,从而在较多的音频内容中,提高音频分类的准确性。

    音频文件的原唱检测方法、装置、服务器及存储介质

    公开(公告)号:CN111508506B

    公开(公告)日:2024-03-01

    申请号:CN202010259245.1

    申请日:2020-04-03

    Inventor: 张文文 李岩 姜涛

    Abstract: 本公开关于一种音频文件的原唱检测方法、装置、服务器及存储介质,该方法包括:提取待检测音频文件的音频指纹,根据待检测音频文件的音频指纹,确定与待检测音频文件对应的歌曲音频文件;从待检测音频文件中分离出人声音频;分别提取人声音频的音频指纹和歌曲音频文件的音频指纹;根据人声音频的音频指纹和歌曲音频文件的音频指纹,确定对待检测音频文件的原唱检测结果。采用本方法,综合考虑了待检测音频文件中的人声音频的音频指纹以及与待检测音频文件对应的歌曲音频文件的音频指纹,避免了仅仅考虑待检测音频文件中的音频指纹,导致确定出的原唱检测结果的准确率较低的缺陷,从而提高了音频文件的原唱检测准确率。

    音频数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN109829067B

    公开(公告)日:2020-12-29

    申请号:CN201910165235.9

    申请日:2019-03-05

    Inventor: 张文文 李岩 姜涛

    Abstract: 本公开是关于一种音频数据处理方法、装置、电子设备及存储介质,涉及多媒体技术领域,所述方法包括:对音频文件进行特征提取,得到音频文件的多个第一音频片段的第一特征;调用情感识别模型,将多个第一音频片段的第一特征输入情感识别模型中,输出多个第一音频片段的情感程度值;根据多个第一音频片段的情感程度值,将音频文件中总长度为目标长度且情感程度值的和值最大的至少一个连续的第二音频片段,作为音频文件的高潮片段。本公开实施例并非简单的检测音频文件中重复的部分,而是对音频文件的各个部分的情感进行分析,从而将情感表达的相对激烈的部分作为高潮片段,音频数据处理方法的准确率高。

    音频识别方法、装置、设备及存储介质

    公开(公告)号:CN115116472A

    公开(公告)日:2022-09-27

    申请号:CN202110309254.1

    申请日:2021-03-23

    Inventor: 张文文

    Abstract: 本公开关于一种音频识别方法、装置、设备及存储介质,该方法通过对待识别音频的频谱特征进行特征提取,获得待识别音频的第一翻唱识别特征;获取音频库中各音频的第二翻唱识别特征,并所确定的待识别音频与音频库中各音频的相似度确定候选音频;基于待识别音频与每个候选音频的音符相关度,确定待识别音频的识别结果。从而能够对未知音频版本的音频进行全面识别,识别准确率高,同时也提高了音频识别的覆盖率以及用户对音频识别的体验。

    一种音频合成的方法、装置及设备

    公开(公告)号:CN110400559A

    公开(公告)日:2019-11-01

    申请号:CN201910579288.5

    申请日:2019-06-28

    Abstract: 本公开是关于一种音频合成的方法、装置及设备,用于提高制作合成音频文件的效率。该音频合成的方法包括:获取至少两个候选音频切片;获取所述至少两个候选音频切片中每个候选音频切片的第一子切片和第二子切片;其中,所述第一子切片为对应候选音频切片的从起始时刻开始的预设时间长度的切片,所述第二子切片为对应候选音频切片的结束时刻之前的所述预设时间长度的切片;根据所述每个候选音频切片的第一子切片和第二子切片,计算所述至少两个候选音频切片中来自不同音频文件的每两个候选音频切片之间的相似度;根据所述每两个候选音频切片之间的相似度将所述至少两个候选音频切片中的部分或全部拼接在一起,获取合成音频文件。

Patent Agency Ranking