一种音频指纹的提取方法、装置、电子设备及存储介质

    公开(公告)号:CN112037814B

    公开(公告)日:2024-01-30

    申请号:CN202010845686.X

    申请日:2020-08-20

    Inventor: 陈晓敏 姜涛

    Abstract: 本公开提供一种音频指纹的提取方法、装置、电子设备及存储介质,涉及声纹识别技术领域,用于提高音频指纹的鲁棒性。该方法包括:确定待处理的音频信号,并对待处理的音频信号进行频谱特征提取处理,获得目标频谱图;从目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,局部峰值点候选集包括目标频谱图上按照预设频段划分的各区域中的峰值点;从目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合;基于局部峰值点候选集和平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据目标局部峰值点集合确定待处理的音频信号的音频指纹,目标局部峰值点集合包括从局部峰值点候选集中剔除平坦区域的局部峰值点集合中的峰值点。

    一种音频指纹的提取方法、装置、电子设备及存储介质

    公开(公告)号:CN112037814A

    公开(公告)日:2020-12-04

    申请号:CN202010845686.X

    申请日:2020-08-20

    Inventor: 陈晓敏 姜涛

    Abstract: 本公开提供一种音频指纹的提取方法、装置、电子设备及存储介质,涉及声纹识别技术领域,用于提高音频指纹的鲁棒性。该方法包括:确定待处理的音频信号,并对待处理的音频信号进行频谱特征提取处理,获得目标频谱图;从目标频谱图中提取局部区域峰值点,获得局部峰值点候选集,局部峰值点候选集包括目标频谱图上按照预设频段划分的各区域中的峰值点;从目标频谱图的平坦区域中提取峰值点,获得平坦区域的局部峰值点集合;基于局部峰值点候选集和平坦区域的局部峰值点集合,得到目标局部峰值点集合,并根据目标局部峰值点集合确定待处理的音频信号的音频指纹,目标局部峰值点集合包括从局部峰值点候选集中剔除平坦区域的局部峰值点集合中的峰值点。

    视频配乐的获取方法、装置、电子设备及计算机可读介质

    公开(公告)号:CN114022822A

    公开(公告)日:2022-02-08

    申请号:CN202111347956.5

    申请日:2021-11-15

    Inventor: 陈晓敏 张冉

    Abstract: 本公开涉及一种视频配乐的获取方法、装置、电子设备及计算机可读介质,属于计算机技术领域。该方法包括:获取视频中的视频帧,并识别所述视频帧中的主体内容;根据所述视频帧中的主体内容确定所述视频中的关键帧,并根据所述关键帧的主体内容确定所述关键帧的主体内容属性;根据所述关键帧的所述主体内容和所述主体内容属性得到所述视频的语义特征向量;将所述视频的语义特征向量与预先建立的歌词向量检索池中的歌词语义特征向量进行匹配,并根据匹配结果得到所述视频的配乐候选集合。本公开通过视频的主体内容及主体内容属性匹配对应的视频配乐,可以提高所推荐的视频配乐与视频内容的匹配程度。

    视频配乐的获取方法、装置、电子设备及计算机可读介质

    公开(公告)号:CN114022822B

    公开(公告)日:2025-04-11

    申请号:CN202111347956.5

    申请日:2021-11-15

    Inventor: 陈晓敏 张冉

    Abstract: 本公开涉及一种视频配乐的获取方法、装置、电子设备及计算机可读介质,属于计算机技术领域。该方法包括:获取视频中的视频帧,并识别所述视频帧中的主体内容;根据所述视频帧中的主体内容确定所述视频中的关键帧,并根据所述关键帧的主体内容确定所述关键帧的主体内容属性;根据所述关键帧的所述主体内容和所述主体内容属性得到所述视频的语义特征向量;将所述视频的语义特征向量与预先建立的歌词向量检索池中的歌词语义特征向量进行匹配,并根据匹配结果得到所述视频的配乐候选集合。本公开通过视频的主体内容及主体内容属性匹配对应的视频配乐,可以提高所推荐的视频配乐与视频内容的匹配程度。

Patent Agency Ranking