-
公开(公告)号:CN119006895A
公开(公告)日:2024-11-22
申请号:CN202411011148.5
申请日:2024-07-26
Applicant: 哈尔滨工程大学
IPC: G06V10/764 , G06V10/44 , G06V10/774 , G06V10/82 , G06V10/778 , G06N3/0464
Abstract: 本发明提出一种面向图像分类的个性化联邦学习方法,包括:步骤1:基于服务器初始化全局原型#imgabs0#步骤2:将初始化后的全局原型发送至客户端;步骤3:客户端初始化本地模型参数#imgabs1#将本地数据集随机划分,对全局原型进行更新,获取更新后的模型参数和本地原型;步骤4:客户端保留更新后的模型参数,并将更新后的本地原型上传至服务器;步骤5:服务器对所有客户端上传的本地原型进行聚合,生成新的全局原型;步骤6:重复步骤2‑6,将每次得到的全局原型发送至客户端进行更新,直至达到最大循环次数,输出最终的全局原型。本发明能够更好地缓解数据异质性对模型精度产生的影响,获得更高的分类准确率,大大降低客户端与服务器之间的通信成本。
-
公开(公告)号:CN118053450A
公开(公告)日:2024-05-17
申请号:CN202410266452.8
申请日:2024-03-08
Applicant: 哈尔滨工程大学
IPC: G10L25/51 , G10L25/27 , G10L19/022 , G10L19/18 , G10L15/18
Abstract: 本发明为一种利用元数据生成音频预测未知异常的异音检测方法,解决了目标机器异常音频样本对现有异音检测模型不可见导致异音检测模型无法选择超参数,异音检测系统性能受限的问题。本发明提供的异常样本预测策略借助音频特征和元数据信息特征对齐构建基于元数据信息的音频生成方法,进而预测未知的目标机器类型异常声音特性,为现有异常声音检测方法在First‑Shot场景下生成了可用于模型训练的目标机器预测声音样本,借助于预测声音样本,异音检测方法能在复杂的异常声音检测现实场景中确定最优模型,提升异音检测方法的性能和通用性。同时,本发明构建的统一的样本生成模型,缓解了现实场景中异常样本稀缺问题,有效降低了异音检测方法的工业化部署难度。
-
公开(公告)号:CN113838064B
公开(公告)日:2023-12-22
申请号:CN202111115253.X
申请日:2021-09-23
Applicant: 哈尔滨工程大学
IPC: G06V10/26 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/82 , G06V20/70 , G06T7/33 , G06N3/0464 , G06N3/047 , G06N3/0455 , G06N3/0475 , G06N3/094 , G06N3/048
Abstract: 本发明属于遥感图像处理技术领域,具体涉及一种基于分支GAN使用多时相遥感数据的云去除方法。本发明设计了一个深度卷积编码器‑解码器网络模型用于遥感图像云检测,以及一个分支GAN模型用于遥感图像的云去除,在保证云去除效果的同时,提升了重建像素的分辨率。本发明利用最大池化索引来进行输入图像特征图的非线性上采样,减少了端到端训练的参数量,提高了网络训练的时间;采用分支UNet结构来融合多时相遥感图像的特征信息,通过共享底层的语义信息,有效提高遥感图像云去除的精度。
-
公开(公告)号:CN117079668A
公开(公告)日:2023-11-17
申请号:CN202310902397.2
申请日:2023-07-21
Applicant: 哈尔滨工程大学
IPC: G10L25/30 , G06F18/213 , G06N3/0464 , G06N3/08 , G10L25/51 , G10L25/24
Abstract: 本发明属于异常声音检测技术领域,具体涉及一种利用元数据分层信息约束自监督分类的异音检测方法。本发明使用元数据分层信息结构约束神经网络对训练音频的低维特征和高维特征的学习,充分利用伴随音频文件的元数据,挖掘元数据属性对声学特征的影响,以使神经网络能学习到域偏移在音频特征上引起的变化,进而提高工业异音检测系统在域偏移条件下的性能。同时,本发明提出了一种以属性组为中心的异常分数计算方法,用于在域偏移条件下评估测试样本的异常分数,以判断测试音频是否正常。与现有技术相比,本发明的方法能够更精细地学习到音频特征,减轻域偏移在异常声音检测中带来的问题。
-
公开(公告)号:CN112562702B
公开(公告)日:2022-12-13
申请号:CN202011374653.8
申请日:2020-11-30
Applicant: 哈尔滨工程大学
IPC: G10L21/003 , G10L25/18 , G10L25/24
Abstract: 本发明提供一种基于循环帧序列的门控循环单元网络的语音超分辨率方法,包括如下步骤:(1)对原始语音信号进行预处理;(2)提出构建CFS‑GRU模型;(3)完成基于循环帧序列网络的语音超分辨率。本发明基于GRU搭建的循环结构模型,直接将语音信号序列作为输入,很大程度上减小了计算代价,并且相比于传统方法有着较好的超分辨率效果;相比于LSTM,GRU模型有着较少的模型参数,通过GRU搭建的CFS‑GRU模型能够更快的训练和收敛。使用SegSNRLoss作为损失函数训练的CFS‑GRU模型能够更快的收敛,并且能够使输出帧序列有着较高的信噪比,提高超分辨率语音信号的质量。
-
公开(公告)号:CN109871902B
公开(公告)日:2022-12-13
申请号:CN201910177075.X
申请日:2019-03-08
Applicant: 哈尔滨工程大学
IPC: G06V10/774 , G06V10/82 , G06N3/08
Abstract: 本发明属于雷达数据处理领域,具体涉及一种基于超分辨率对抗生成级联网络的SAR小样本识别方法。针对SAR目标图像分辨率低所导致的目标特征不明显,受环境影响较大,数据样本易混淆的问题,提出一个基于深度学习的超分辨率网络,对低分辨率的SAR的小样本图像进行放大。让分类网络能够提取到更多的特征。与传统超分辨率方法不同,利用GAN进行的图像超分辨率能够有效的提取到图像的特征,生成非过度平滑的逼真的高分辨率图像。针对SAR小样本图像具有的低分辨率,特征模糊,样本容易混淆的特点,针对SAR图像固有特点的GAN超分辨率模型。将实现一个4倍放大因子的超分模型,可以将原图像的像素数量放大到原来的16倍。这样可以提供给分类器更多的内容和特征。
-
公开(公告)号:CN109934282B
公开(公告)日:2022-05-31
申请号:CN201910176375.6
申请日:2019-03-08
Applicant: 哈尔滨工程大学
Abstract: 本发明属于合成孔径雷达小样本目标识别领域,具体涉及一种基于SAGAN样本扩充和辅助信息的SAR目标分类方法。本研究根据SAR的数据样本图像的特性,对Inception结构进行优化和改进,并添加适当的正则化条件,联合上述的GAN小样本生成和GAN小样本超分辨率的成果,对SAR小样本目标进行精确的识别。本发明提出了一种更适用于SAR遥感图像的网络,使得其能够学习不同种类目标区域的特征,从而生成新的较为逼真的目标区域图像,解决了SAR小样本的数据量少的问题。解决了针对合成孔径雷达SAR遥感图像中的目标区域,一种基于自注意力生成对抗网络样本扩充和辅助信息的SAR目标分类方法,本发明主要涉及生成式对抗网络来扩充SAR新样本数据,并基于Restnet50结构网络用以SAR小样本目标识别。
-
公开(公告)号:CN112562707A
公开(公告)日:2021-03-26
申请号:CN202011376572.1
申请日:2020-11-30
Applicant: 哈尔滨工程大学
IPC: G10L21/02 , G10L21/0208
Abstract: 本发明提供一种单信道目标语音增强方法,包括如下步骤:步骤一:语音信号的预处理与特征转换,引入时间潜在域信息,将时序波形信息通过深度学习框架拓展映射到对应潜在空间域的过程及其逆向变换;步骤二:基于生成信号权重的目标函数;步骤三:引入时序TCN网络模型;本发明网络能实现从混合源语音到目标语音信号的端到端处理,网络的增强性能优秀,能良好还原目标语音信号,同时提升了数据处理的并行处理能力,并能通过自身的数据增广丰富样本集,提升模型性能。
-
公开(公告)号:CN112562706A
公开(公告)日:2021-03-26
申请号:CN202011376556.2
申请日:2020-11-30
Applicant: 哈尔滨工程大学
IPC: G10L21/02 , G10L21/0208 , G10L25/03
Abstract: 本发明提供一种基于时间潜在域特定说话人信息的目标语音提取方法,包括时间潜在域特征转换模型、目标说话人特征信息指导器与增强提取模块;待处理的复杂声学环境语音信息经过时间潜在域特征转换模型的处理将映射到潜在空间的特征矩阵,此特征矩阵将分别进入目标说话人特征信息指导器与增强提取模块;在目标说话人特征信息指导器中,特征矩阵将被判定为与某一特定的目标说话人潜在特征具有相关性,或者不包含目标说话人特征。本发明能实现从复杂声学环境语音信号到特定目标语音信号的端到端处理,能高效提取出针对特定任务的目标说话人信息,而不受其他干扰信号的影响,保障了模型传递给后续任务的特定目标语音信号具备极高的语音质量与可感知性。
-
公开(公告)号:CN110060699A
公开(公告)日:2019-07-26
申请号:CN201910421602.7
申请日:2019-05-21
Applicant: 哈尔滨工程大学
IPC: G10L21/0272 , G10L21/0208
Abstract: 本发明提供的是一种基于深度稀疏展开的单信道语音分离方法。步骤一、将输入的混沌、纯净语音进行信号预处理,进行特征的提取;步骤二、结合稀疏NMF和深度展开对单信道语音语音分离问题进行模型建立;步骤三、将建立好的模型与提取的特征进行模型训练,得到基本系数;步骤四、再次输入混沌、纯净语音信号数据进行测试,经过傅里叶逆变换后,最终得到纯净语音。该方法将稀疏非负矩阵分离与深度展开方法相结合,对语音分离具有一定效果。
-
-
-
-
-
-
-
-
-