-
公开(公告)号:CN113838107B
公开(公告)日:2023-12-22
申请号:CN202111117036.4
申请日:2021-09-23
Applicant: 哈尔滨工程大学
IPC: G06T7/33 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/75 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/0455 , G06N3/0475 , G06N3/094
Abstract: 本发明属于遥感图像配准技术领域,具体涉及一种基于稠密连接的异源图像自动配准方法。本发明先对SAR与光学图像进行转换,再使用结合注意力机制的卷积神经网络进行特征点的提取,接着将提取到的特征点进行特征编码并完成预匹配,通过使用高斯混合模型进行动态内联点选择,从而完成特征点的匹配,最后进行图像配准,得到最终结果。本发明通过使用循环生成式对抗网络,解决了异源图像因成像原理不同给配准带来的困难,同时使用改进后的稠密连接Densenet结构提取特征点,极大提高了精度,从而提升后续模型配准的性能。
-
公开(公告)号:CN116230012B
公开(公告)日:2023-08-08
申请号:CN202310177110.4
申请日:2023-02-28
Applicant: 哈尔滨工程大学
Abstract: 本发明提出了一种基于元数据对比学习预训练的两阶段异音检测方法,属于声音检测领域,解决了现有单阶段异音检测方法对声音信号与其对应元数据信息匹配关系发掘程度不高,难以区分不同元数据信息下声音信号差异的问题。本发明提供的两阶段异音检测方法包含元数据对比学习预训练和自监督微调两个阶段,元数据对比学习预训练阶段加强了相同元数据信息下的声音信号关联,放大了不同元数据信息下声音信号的距离,学习到了能够根据元数据信息区分不同声音信号的能力;自监督微调部分在元数据对比学习获得的预训练参数基础上,进行优化微调,进一步提升了对不同元数据信息下声音信号的区别能力,进而提升了异音检测方法的性能表现与稳定性。
-
公开(公告)号:CN114154538B
公开(公告)日:2022-09-02
申请号:CN202111421620.9
申请日:2021-11-26
Applicant: 哈尔滨工程大学
Abstract: 本发明属于工业声音异常检测技术领域,具体涉及一种基于相位编码和设备信息的工业声音异常检测系统。本发明能借助相位信息补足工业声音信号的精细度,获得高精度的声学特征,能够对高精度的声学特征进行建模,着重提升系统对于异常信息的敏感度,同时感知到不同工业设备之间的细微差异,规避了设备之间产生的声学干扰,并对建模结果进行高效率高精度的异常分数判定,具备优秀的工业声音异常检测性能。
-
公开(公告)号:CN114155835B
公开(公告)日:2022-07-08
申请号:CN202111475701.7
申请日:2021-12-06
Applicant: 哈尔滨工程大学
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/26 , G10L25/30 , G10L25/51 , G06F40/216 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种音频语意概述方法,具体为一种融合全局场景与局部事件信息的音频语意概述方法,首先对实际场景中产生的音频进行建模分析,随后从声学场景的宏观全局特性入手,并融合了对于场景内各音频事件的精细化感知,最终生成贴合人类自然语言逻辑的语意概述文本,本发明对于声学场景中局部声音事件的精细化感知为构建音频特征的语意信息与自然语言语意信息的映射提供了细粒度的信息感知方式,能够有效规避传统方法对于音频事件的误识别与内容忽略,有助于构建更高语意层次的人机交互过程;此外,本发明提供了全新的注意力计算机制,相比传统注意力机制降低了计算成本。
-
公开(公告)号:CN114155879A
公开(公告)日:2022-03-08
申请号:CN202111475597.1
申请日:2021-12-06
Applicant: 哈尔滨工程大学
Abstract: 本发明公开的属于异音检测方法技术领域,具体为一种利用时频融合补偿异常感知及稳定性的异音检测方法,借助从声学目标原始音频信号x∈R1*L获取的时域信息和频域信息形成感知互补;时频域融合特征输入深度神经网络,经过网络学习从而获得对于待检测声学目标的状态感知,针对现有异音检测方法所采用的Log‑Mel谱特征对一定声学目标缺乏感知能力的问题,本发明设计了从时域角度构建的可学习特征与Log‑Mel谱相融合,实现了时频域信息互补的双赢增益机制,本发明设计的时频域融合的可学习特征能够有效地提升异音检测系统的稳定性,解决现有工业异音检测方法稳定性不足,检测结果可信度低的问题。
-
公开(公告)号:CN113838107A
公开(公告)日:2021-12-24
申请号:CN202111117036.4
申请日:2021-09-23
Applicant: 哈尔滨工程大学
Abstract: 本发明属于遥感图像配准技术领域,具体涉及一种基于稠密连接的异源图像自动配准方法。本发明先对SAR与光学图像进行转换,再使用结合注意力机制的卷积神经网络进行特征点的提取,接着将提取到的特征点进行特征编码并完成预匹配,通过使用高斯混合模型进行动态内联点选择,从而完成特征点的匹配,最后进行图像配准,得到最终结果。本发明通过使用循环生成式对抗网络,解决了异源图像因成像原理不同给配准带来的困难,同时使用改进后的稠密连接Densenet结构提取特征点,极大提高了精度,从而提升后续模型配准的性能。
-
公开(公告)号:CN119295523A
公开(公告)日:2025-01-10
申请号:CN202411304516.5
申请日:2024-09-19
Applicant: 哈尔滨工程大学
Abstract: 一种基于双向状态空间模型的单目深度估计方法、设备与介质,涉及一种图像处理技术,解决了目前的自监督方法在长序列建模、训练速度、推理速度以及捕捉场景复杂细节方面均存在不足且模型在稀疏监督下的优化效果不好的问题。本发明单目深度估计方法包括如下步骤:构建编码器‑解码器结构,包括有连续膨胀卷积模块和双向状态空间模块,由编码器生成训练图像的中间特征,对长距离中间特征信息进行建模,由解码器生成输出特征;构建姿态估计模型,并利用解码器生成的输出特征与训练图像的深度估计进行联合重建,对学习目标建模,设计目标图像与重建图像的损失函数来优化网络;采用公开的KITTI数据集对所构建的模型进行训练得到权重模型,并对训练完成的模型对于单目图像深度估计的精度进行评估。本发明用于图像单目深度估计。
-
公开(公告)号:CN116230012A
公开(公告)日:2023-06-06
申请号:CN202310177110.4
申请日:2023-02-28
Applicant: 哈尔滨工程大学
Abstract: 本发明提出了一种基于元数据对比学习预训练的两阶段异音检测方法,属于声音检测领域,解决了现有单阶段异音检测方法对声音信号与其对应元数据信息匹配关系发掘程度不高,难以区分不同元数据信息下声音信号差异的问题。本发明提供的两阶段异音检测方法包含元数据对比学习预训练和自监督微调两个阶段,元数据对比学习预训练阶段加强了相同元数据信息下的声音信号关联,放大了不同元数据信息下声音信号的距离,学习到了能够根据元数据信息区分不同声音信号的能力;自监督微调部分在元数据对比学习获得的预训练参数基础上,进行优化微调,进一步提升了对不同元数据信息下声音信号的区别能力,进而提升了异音检测方法的性能表现与稳定性。
-
公开(公告)号:CN111028277B
公开(公告)日:2023-01-10
申请号:CN201911256966.0
申请日:2019-12-10
Applicant: 中国电子科技集团公司第五十四研究所 , 哈尔滨工程大学
IPC: G06T7/33
Abstract: 本发明公开了遥感图像配准技术领域的基于伪孪生卷积神经网络的SAR和光学遥感图像配准方法,先对特征图像块的采集和匹配,再进行异常点去除和最终配准,采用了最大化正样本和难负样本之间的特征距离的策略,并且定义了新的损失函数对网络进行训练,伪孪生网络的两个分支通过卷积运算连接,得到两个输入图像块之间的相似性得分;本发明通过提出了伪孪生卷积神经网络体系结构,使得伪孪生网络的左分支和右分支能够分别输入不同大小的光学和SAR遥感图像,能够解决在极高分辨率下光学和SAR遥感图像中识别相应图像块的任务。
-
公开(公告)号:CN114155879B
公开(公告)日:2022-07-01
申请号:CN202111475597.1
申请日:2021-12-06
Applicant: 哈尔滨工程大学
Abstract: 本发明公开的属于异音检测方法技术领域,具体为一种利用时频融合补偿异常感知及稳定性的异音检测方法,借助从声学目标原始音频信号x∈R1*L获取的时域信息和频域信息形成感知互补;时频域融合特征输入深度神经网络,经过网络学习从而获得对于待检测声学目标的状态感知,针对现有异音检测方法所采用的Log‑Mel谱特征对一定声学目标缺乏感知能力的问题,本发明设计了从时域角度构建的可学习特征与Log‑Mel谱相融合,实现了时频域信息互补的双赢增益机制,本发明设计的时频域融合的可学习特征能够有效地提升异音检测系统的稳定性,解决现有工业异音检测方法稳定性不足,检测结果可信度低的问题。
-
-
-
-
-
-
-
-
-