-
公开(公告)号:CN120032614A
公开(公告)日:2025-05-23
申请号:CN202510498636.1
申请日:2025-04-21
Applicant: 西安交通大学
IPC: G10H1/00 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/0499 , G06N3/0895 , G06F18/213 , G06F18/25
Abstract: 本发明公开一种基于深度特征提取的旋律提取方法、系统及相关产品,属于音乐信息检索技术领域。本发明利用残差神经网络层、最大池化层和双向长短时记忆网络层提取第二频谱图的特征,得到特征向量#imgabs0#;利用卷积循环神经网络层提取第二频谱图的特征,得到特征向量#imgabs1#,将二者串联融合为特征向量#imgabs2#;最后通过半监督极限学习机网络模型提取得到待处理音频信号的旋律。本方法通过残差神经网络、双向长短时记忆网络与卷积循环神经网络的协同作用,分别提取第二频谱图的深层时序特征和局部频域特征,通过串联融合实现多模态特征互补,增强旋律特征的表征能力,解决传统SSELM模型依赖单一网络结构导致特征表达不足的问题,提高旋律提取的准确率。
-
公开(公告)号:CN120071875A
公开(公告)日:2025-05-30
申请号:CN202510421243.0
申请日:2025-04-07
Applicant: 西安交通大学
Abstract: 本发明属于音乐信息检索领域,具体涉及一种音频处理方法及相关装置。音频处理方法包括以下步骤:对音频文件进行预处理,转换为频谱图;采用预先构建的特征提取模型对频谱图进行特征提取,得到特征向量;采用预先构建的基于流Transformer编码器的神经网络模型对特征向量进行处理,得到节拍激活值和强拍激活值;基于节拍激活值和强拍激活值,采用概率模型推断得到节拍序列和强拍序列。解决了现有方法存在的无法准确跟踪节拍序列问题。
-