-
公开(公告)号:CN109829515B
公开(公告)日:2020-08-28
申请号:CN201910171672.1
申请日:2019-03-07
Applicant: 北京市博汇科技股份有限公司
IPC: G06K9/62 , G06F16/683
Abstract: 本申请提供一种音频指纹匹配方法以及音频指纹匹配装置,该方法包括:获取第一音频段包含的至少两个音频帧中每个音频帧的频谱幅值;生成至少两个音频帧的平均谱能量峰值位置点图像;利用分类器对平均谱能量峰值位置点图像中的平均谱能量峰值位置点进行量化,并根据量化结果获取至少两个音频帧中每个音频帧的音频指纹;获取第一音频段中至少两个音频帧与第二音频段中至少两个音频帧对应音频帧的指纹距离的平均值;在平均值小于或者等于第一预设阈值的情况下,确定第一音频段与第二音频段相匹配;在平均值大于第一预设阈值的情况下,确定第一音频段与第二音频段不匹配。每帧音频指纹的信息长度较小,需要耗费的资源较少。
-
公开(公告)号:CN109829515A
公开(公告)日:2019-05-31
申请号:CN201910171672.1
申请日:2019-03-07
Applicant: 北京市博汇科技股份有限公司
IPC: G06K9/62 , G06F16/683
Abstract: 本申请提供一种音频指纹匹配方法以及音频指纹匹配装置,该方法包括:获取第一音频段包含的至少两个音频帧中每个音频帧的频谱幅值;生成至少两个音频帧的平均谱能量峰值位置点图像;利用分类器对平均谱能量峰值位置点图像中的平均谱能量峰值位置点进行量化,并根据量化结果获取至少两个音频帧中每个音频帧的音频指纹;获取第一音频段中至少两个音频帧与第二音频段中至少两个音频帧对应音频帧的指纹距离的平均值;在平均值小于或者等于第一预设阈值的情况下,确定第一音频段与第二音频段相匹配;在平均值大于第一预设阈值的情况下,确定第一音频段与第二音频段不匹配。每帧音频指纹的信息长度较小,需要耗费的资源较少。
-