-
公开(公告)号:CN109783683A
公开(公告)日:2019-05-21
申请号:CN201811484229.1
申请日:2018-12-06
Applicant: 华南理工大学
Abstract: 本发明公开了一种用于实时监控的音频聚类方法,包括步骤:(1)音频数据预处理分段:利用基频值特点把基频值不同的时间上相邻的两个音频段分离开;(2)基于特征点对齐的分段快速计算音频距离:对计算的音频样本的N阶特征点进行基于相似性度量的对齐后分段计算样本距离,快速得到两段音频的距离;(3)利用连通距离提高聚类的类内纯净度:对于每段音频,通过连通距离设定距离阈值来剔除噪点以提高类内纯净度,完成聚类。本发明通过切割细分增加了音频样本的事件独立性,通过快速对齐进行分段DTW计算降低时间复杂度同时增加对齐精确度,在聚类过程中控制每一类的类内纯净度,以便后续模型建立中提高训练样本的纯净度,提高模型的描述能力。
-
公开(公告)号:CN109783683B
公开(公告)日:2022-11-18
申请号:CN201811484229.1
申请日:2018-12-06
Applicant: 华南理工大学
Abstract: 本发明公开了一种用于实时监控的音频聚类方法,包括步骤:(1)音频数据预处理分段:利用基频值特点把基频值不同的时间上相邻的两个音频段分离开;(2)基于特征点对齐的分段快速计算音频距离:对计算的音频样本的N阶特征点进行基于相似性度量的对齐后分段计算样本距离,快速得到两段音频的距离;(3)利用连通距离提高聚类的类内纯净度:对于每段音频,通过连通距离设定距离阈值来剔除噪点以提高类内纯净度,完成聚类。本发明通过切割细分增加了音频样本的事件独立性,通过快速对齐进行分段DTW计算降低时间复杂度同时增加对齐精确度,在聚类过程中控制每一类的类内纯净度,以便后续模型建立中提高训练样本的纯净度,提高模型的描述能力。
-