-
公开(公告)号:CN112419258A
公开(公告)日:2021-02-26
申请号:CN202011296063.8
申请日:2020-11-18
Applicant: 西北工业大学
Abstract: 本发明涉及一种基于时频分割及卷积神经网络的鲁棒环境声音识别方法,该方法首先提出将二次型时频分析算法伪Wigner‑Vile分布应用于环境声音信号的时频表征,通过其可以得到更加直观和合理的时频表征图像;在时频图像基础上,应用伪彩色变换将灰度时频图像转换为伪彩色时频图像,进一步提升了时频表征的鲁棒性;其次,设计了一种基于图像显著性的时频分割算法,利用其对时频图像的环境声音信号分布区域进行提取,从而实现对时频图像噪声的去除;最后,将深度学习应用于环境声音信号识别,构建了一个基于深度卷积神经网络的环境声音信号识别模型,将经过时频分割去噪的伪彩色时频图像输入该模型进行训练和识别,有效提高了识别算法的鲁棒性。
-
公开(公告)号:CN112419258B
公开(公告)日:2024-05-14
申请号:CN202011296063.8
申请日:2020-11-18
Applicant: 西北工业大学
Abstract: 本发明涉及一种基于时频分割及卷积神经网络的鲁棒环境声音识别方法,该方法首先提出将二次型时频分析算法伪Wigner‑Vile分布应用于环境声音信号的时频表征,通过其可以得到更加直观和合理的时频表征图像;在时频图像基础上,应用伪彩色变换将灰度时频图像转换为伪彩色时频图像,进一步提升了时频表征的鲁棒性;其次,设计了一种基于图像显著性的时频分割算法,利用其对时频图像的环境声音信号分布区域进行提取,从而实现对时频图像噪声的去除;最后,将深度学习应用于环境声音信号识别,构建了一个基于深度卷积神经网络的环境声音信号识别模型,将经过时频分割去噪的伪彩色时频图像输入该模型进行训练和识别,有效提高了识别算法的鲁棒性。
-
公开(公告)号:CN112652326B
公开(公告)日:2023-07-04
申请号:CN202011299987.3
申请日:2020-11-18
Applicant: 西北工业大学
IPC: G10L25/30 , G10L21/0216 , G10L21/0232 , G06F18/24 , G06F18/21 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种基于伪彩色时频图像及卷积网络的环境声音识别方法,该方法首先提出了一种基于模态中心频率差分的自适应变分模态分解方法,通过其对环境声音信号进行噪声去除与信号重建,并结合伪Wigner‑Vile算法生成时频图像,该时频表征算法能在降低噪声对时频图像污染的同时有效对非稳态信号进行表征;在时频图像基础上,应用伪彩色变换将灰度时频图像转换为伪彩色时频图像,进一步提升了时频表征的鲁棒特性;针对传统分类器鲁棒性较差的问题,构建了一个基于深度卷积神经网络的环境声音信号识别模型,将伪彩色时频图像输入该模型进行识别,有效提高了算法的识别精度和鲁棒性。
-
公开(公告)号:CN117893547A
公开(公告)日:2024-04-16
申请号:CN202311785068.0
申请日:2023-12-22
Applicant: 西北工业大学
IPC: G06T7/11 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本公开实施例是关于一种基于多个并行Transformer支路神经网络的医学影像分割方法。本公开利用卷积网络的固有多尺度特性,通过池化层或跨步卷积层逐步降低输出特征图的空间分辨率,以从不同阶段的子残差网络中提取多尺度局部特征图;然后构建Transformer支路网络以利用自注意力机制获取全局上下文信息。在卷积网络部分的多层级局部特征图上,搭建多个并行的Transformer支路网络,从而获得多尺度的全局特征图;最后利用长跳跃连接和大尺度线性上采样将多个并行支路中的局部特征图和全局特征图进行相加融合得到目标融合特征图。融合后的目标融合特征图含有多尺度局部和全局特征,从而有助于多尺度器官的精确分割。
-
公开(公告)号:CN112652326A
公开(公告)日:2021-04-13
申请号:CN202011299987.3
申请日:2020-11-18
Applicant: 西北工业大学
IPC: G10L25/30 , G10L21/0216 , G10L21/0232 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于伪彩色时频图像及卷积网络的环境声音识别方法,该方法首先提出了一种基于模态中心频率差分的自适应变分模态分解方法,通过其对环境声音信号进行噪声去除与信号重建,并结合伪Wigner‑Vile算法生成时频图像,该时频表征算法能在降低噪声对时频图像污染的同时有效对非稳态信号进行表征;在时频图像基础上,应用伪彩色变换将灰度时频图像转换为伪彩色时频图像,进一步提升了时频表征的鲁棒特性;针对传统分类器鲁棒性较差的问题,构建了一个基于深度卷积神经网络的环境声音信号识别模型,将伪彩色时频图像输入该模型进行识别,有效提高了算法的识别精度和鲁棒性。
-
公开(公告)号:CN108122003A
公开(公告)日:2018-06-05
申请号:CN201711369730.9
申请日:2017-12-19
Applicant: 西北工业大学
Abstract: 本发明涉及一种基于深度神经网络的弱小目标识别方法,是深度神经网络在计算机视觉方面的应用。本发明针对已有的神经网络对弱小目标识别精度不高、识别速度慢的问题,提出了一种新型深度神经网络结构,该结构注重对弱小目标特征的提取,通过增加图像数据深度、反复提取相同尺度特征等方法准确描述小尺度图像特征,从而实现了对弱小目标的准确识别。
-
公开(公告)号:CN117830632A
公开(公告)日:2024-04-05
申请号:CN202311806325.4
申请日:2023-12-26
Applicant: 西北工业大学
IPC: G06V10/26 , G06T7/00 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开实施例是关于一种基于高效自注意力机制混合神经网络的医学影像分割方法。本公开实施例利用编码网络提取具有不同感受野的多尺度局部特征图,然后利用长跳跃连接和解码网络中的特征融合模块将多层级的卷积特征融合到最高分辨率特征图中,为Transformer网络的推理提供了多层次的局部特征;另外,将矩阵交换律、映射共享和注意力图共享等操作相结合有效降低了常规自注意力模块的计算复杂度和模型训练内存占用;在最高分辨率的特征图上构建Transformer网络获取全局上下文特征,避免了细节特征的丢失,有效提高了对小尺寸物体的分割精度。
-
公开(公告)号:CN107577241A
公开(公告)日:2018-01-12
申请号:CN201710567800.5
申请日:2017-07-13
Applicant: 西北工业大学
Abstract: 本发明涉及一种基于避障系统的消防无人机航迹规划方法,在无人机的前后左右四个方向设有超声波测距传感器,当测量距离不小于安全距离,则输出原始控制信号,飞行器按计划正常飞行;当发现无人机某一方向出现障碍物,判断即将碰撞,飞控系统将根据测量距离采取收油门、向障碍物反方向倾侧飞行等动作避开障碍物。本发明中所设计的避障算法同传统的局部避障规划算法(人工势场法、栅格法)相比较具有兼容性好,执行效率高的优点;基于超声波避障系统,采用A*搜索算法能够有效的降低机载控制器的计算量,并且能够保证无人机在突发情况下能够快速避障,并及时规划出新的航迹。
-
公开(公告)号:CN108416770B
公开(公告)日:2021-06-11
申请号:CN201810185626.2
申请日:2018-03-07
Applicant: 西北工业大学
IPC: G06T7/00
Abstract: 本发明提供了一种基于视觉显著性的图像质量评价方法,涉及图像处理技术领域,本发明先计算相位一致性,再计算灰度梯度图及灰度梯度图之间的梯度相似度图,对梯度相似度图求分布均匀度,计算出质量分数,即为失真图像相对参考图像的质量评价得分。本发明的有益效果在于在图像质量评价中引入视觉显著性概念,通过分析干扰在图像中的分布均匀度描述干扰在图像中的视觉显著性,从而体现出图像中的干扰对人视觉的主观影响程度,以此来更加准确评价图像质量。
-
公开(公告)号:CN107577241B
公开(公告)日:2020-05-12
申请号:CN201710567800.5
申请日:2017-07-13
Applicant: 西北工业大学
Abstract: 本发明涉及一种基于避障系统的消防无人机航迹规划方法,在无人机的前后左右四个方向设有超声波测距传感器,当测量距离不小于安全距离,则输出原始控制信号,飞行器按计划正常飞行;当发现无人机某一方向出现障碍物,判断即将碰撞,飞控系统将根据测量距离采取收油门、向障碍物反方向倾侧飞行等动作避开障碍物。本发明中所设计的避障算法同传统的局部避障规划算法(人工势场法、栅格法)相比较具有兼容性好,执行效率高的优点;基于超声波避障系统,采用A*搜索算法能够有效的降低机载控制器的计算量,并且能够保证无人机在突发情况下能够快速避障,并及时规划出新的航迹。
-
-
-
-
-
-
-
-
-