-
公开(公告)号:CN119763594A
公开(公告)日:2025-04-04
申请号:CN202411892206.X
申请日:2024-12-20
Applicant: 西北工业大学太仓长三角研究院 , 西北工业大学深圳研究院 , 西北工业大学 , 研祥智慧物联科技有限公司
IPC: G10L21/0208 , G10L21/0224 , G10L21/0232 , G10L25/30
Abstract: 本申请公开一种基于交叉Transformer的语音去噪方法、控制器及存储介质,语音去噪方法包括将噪音数据集进行格式转换处理得到分层式的训练数据集;构建交叉Transformer神经网络模型,将训练数据集输入至交叉Transformer网络进行特征提取处理,得到特征数据集;将训练数据集输入至短时傅里叶变换速算模块进行时频特征提取处理,得到时频域语音信号集;将特征数据集和时频域语音信号集输入至双域叠加模块进行平滑拼接处理,得到去噪语音集;以语音数据集作为输入、去噪语音集作为输出进行训练,得到经训练的交叉Transformer神经网络模型;将待处理语音信号输入至经训练的交叉Transformer神经网络模型,得到去噪语音信号。本申请提高去噪语音信号的准确性,优化去噪语音信号的质量。
-
公开(公告)号:CN119887553A
公开(公告)日:2025-04-25
申请号:CN202411892188.5
申请日:2024-12-20
Applicant: 西北工业大学太仓长三角研究院 , 西北工业大学深圳研究院 , 西北工业大学 , 研祥智慧物联科技有限公司
IPC: G06T5/60 , G06T5/70 , G06N3/0455 , G06N3/082
Abstract: 本公开实施例公开了一种基于扩散模型的图像生成方法,获取第一干净图像输入扩散模型的扩散过程,得到噪声图像,扩散模型包括Wavelet块并基于人脸五官特征构建扩散模型的损失函数,将噪声图像输入扩散模型的重建过程,对扩散模型进行训练,得到目标扩散模型,获取随机高斯噪声图像,将随机高斯噪声图像输入目标扩散模型的重建过程,得到生成的人脸图像。在扩散模型中引入Wavelet块,可以使用Wavelet块提取第一特征图的第一频率特征,也就是提取噪声图像的高频和低频信息,扩散模型根据高频和低频信息分离高斯噪声,能够有效分离高斯噪声,提高了生成的人脸图像的质量,且基于人脸五官特征构建损失函数,提升了生成的人脸图像的五官细节部分的质量。
-
公开(公告)号:CN117094888B
公开(公告)日:2024-06-28
申请号:CN202310957321.X
申请日:2023-07-31
Applicant: 西北工业大学深圳研究院 , 西北工业大学 , 研祥智慧物联科技有限公司
IPC: G06T3/4053 , G06T3/4046 , G06N3/0464 , G06N3/0475
Abstract: 本申请提供了一种图像超分辨方法、图像超分辨装置、电子设备及存储介质,通过将低分辨率图像输入至图像超分辨网络,图像超分辨网络包括生成器和判别器,生成器包括第一动态残差块和第二动态残差块,第一动态残差块和第二动态残差块之间存在第一预设时序信息,通过第一动态残差块对低分辨率图像进行特征提取,得到第一图像特征,将第一图像特征和第一预设时序信息进行特征融合,得到第二图像特征,通过第二动态残差块对第二图像特征进行特征提取,生成粗略的高分辨率图像,通过判别器对该粗略的高分辨率图像进行图像判别,若图像判别通过,则将该粗略的高分辨率图像作为图像超分辨网络输出的高分辨率图像,能够提高生成高分辨率图像的图像质量。
-
公开(公告)号:CN116977650A
公开(公告)日:2023-10-31
申请号:CN202310958579.1
申请日:2023-07-31
Applicant: 西北工业大学深圳研究院 , 西北工业大学 , 研祥智慧物联科技有限公司
Abstract: 本申请提供了一种图像去噪方法、图像去噪装置、电子设备及存储介质,属于图像处理技术领域,通过获取噪声图像,将噪声图像输入至预设的图像去噪网络,图像去噪网络包括树形模块和双目增强模块,通过树形模块对噪声图像进行多元特征提取,得到多元图像特征,通过双目增强模块,分别对多元图像特征进行特征提纯,得到图像细化特征,对多元图像特征进行局部特征增强,得到图像显著性特征,对图像细化特征和图像显著性特征进行特征融合,提高了图像去噪效果,并得到干净图像。
-
公开(公告)号:CN116543168A
公开(公告)日:2023-08-04
申请号:CN202310284080.7
申请日:2023-03-22
Applicant: 西北工业大学太仓长三角研究院 , 西北工业大学
IPC: G06V10/30 , G06V10/25 , G06V10/40 , G06V10/46 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种基于多维度图像信息融合的垃圾图像去噪方法,分别使用两个子网络对二维图像和三维图像进行互补信息提取,获取更多图像细节特征,引入动态自注意力模块削减二维图像噪声,其中动态卷积自适应地学习不同输入垃圾图像的动态噪声特征,并利用自注意力机制定位动态噪声特征中的显著性前景信息,抑制不重要背景信息;引入基于自适应稀疏机制的Transformer,对三维垃圾图像信息的远距离依赖关系进行建模,构建自适应稀疏机制。本发明克服卷积神经网络感受野局限性,降低Transformer自注意力运算量,通过二维与三维图像特征融合,能很好改善对垃圾图像去噪效果,提升后续垃圾分类、检测等任务的精确度。
-
公开(公告)号:CN119515683A
公开(公告)日:2025-02-25
申请号:CN202411478107.7
申请日:2024-10-22
Applicant: 西北工业大学太仓长三角研究院 , 西北工业大学深圳研究院
IPC: G06T3/4053 , G06T5/60 , G06N3/0464 , G06N3/0455 , G06N3/084
Abstract: 本申请实施例提供了一种基于扩散模型的视频超分辨方法、系统、设备及介质,其中,一种基于扩散模型的视频超分辨方法包括:构建训练样本集,其中,所述训练样本集包括低分辨率样本视频以及低分辨率样本视频对应的高分辨率样本视频;构建初始扩散模型,其中,所述初始扩散模型包括编码器模块、时间嵌入模块、Unet网络模块和解码器模块;利用所述训练样本集对所述初始扩散模型进行多轮迭代训练,以获得目标扩散模型;利用所述目标扩散模型对待处理的低分辨率视频进行视频超分辨处理,得到高分辨率视频。通过在初始扩散模型中引入时间嵌入模块,实现了抑制扩散模型中图像生成过程的随机性和不确定性,使模型能学习到不同时间步长的视频帧特征的效果。
-
公开(公告)号:CN116977650B
公开(公告)日:2024-11-12
申请号:CN202310958579.1
申请日:2023-07-31
Applicant: 西北工业大学深圳研究院 , 西北工业大学 , 研祥智慧物联科技有限公司
Abstract: 本申请提供了一种图像去噪方法、图像去噪装置、电子设备及存储介质,属于图像处理技术领域,通过获取噪声图像,将噪声图像输入至预设的图像去噪网络,图像去噪网络包括树形模块和双目增强模块,通过树形模块对噪声图像进行多元特征提取,得到多元图像特征,通过双目增强模块,分别对多元图像特征进行特征提纯,得到图像细化特征,对多元图像特征进行局部特征增强,得到图像显著性特征,对图像细化特征和图像显著性特征进行特征融合,提高了图像去噪效果,并得到干净图像。
-
公开(公告)号:CN117094888A
公开(公告)日:2023-11-21
申请号:CN202310957321.X
申请日:2023-07-31
Applicant: 西北工业大学深圳研究院 , 西北工业大学 , 研祥智慧物联科技有限公司
IPC: G06T3/40 , G06N3/0464 , G06N3/0475
Abstract: 本申请提供了一种图像超分辨方法、图像超分辨装置、电子设备及存储介质,通过将低分辨率图像输入至图像超分辨网络,图像超分辨网络包括生成器和判别器,生成器包括第一动态残差块和第二动态残差块,第一动态残差块和第二动态残差块之间存在第一预设时序信息,通过第一动态残差块对低分辨率图像进行特征提取,得到第一图像特征,将第一图像特征和第一预设时序信息进行特征融合,得到第二图像特征,通过第二动态残差块对第二图像特征进行特征提取,生成粗略的高分辨率图像,通过判别器对该粗略的高分辨率图像进行图像判别,若图像判别通过,则将该粗略的高分辨率图像作为图像超分辨网络输出的高分辨率图像,能够提高生成高分辨率图像的图像质量。
-
公开(公告)号:CN115936992A
公开(公告)日:2023-04-07
申请号:CN202211700428.8
申请日:2022-12-28
Applicant: 西北工业大学太仓长三角研究院 , 西北工业大学
IPC: G06T3/40
Abstract: 本发明公开了一种轻量级Transformer的垃圾图像超分辨方法及系统,轻量级Transformer块实现多尺度分层网络,获取不同程度的图像细节特征,提高图像的质量。并利用残差操作集成层次特征,提高浅层特征作用,获得更多的细节信息。先验知识转化块将先验信息加到不同尺度不同层获得的结构信息中,提高图像超分辨的鲁棒性。特征融合块根据生物技术中双目互补的思想,通过残差学习操作融合并行的先验知识转化块,提取互补的特征,提高预测图像的像素。最后通过一个卷积,重构高质量图像。本发明在改进垃圾图像超分辨效果的同时,降低了计算复杂度,实现了高效的轻量级超分辨网络,适用于垃圾图像的识别、分类等应用,在多种应用领域均有显著提升。
-
公开(公告)号:CN118072227B
公开(公告)日:2024-07-05
申请号:CN202410457964.2
申请日:2024-04-17
Applicant: 西北工业大学太仓长三角研究院 , 同济大学
Abstract: 本发明属于视频理解技术领域,具体涉及基于知识蒸馏的轨道交通列车测速方法。本发明的方法将Transformer融合yolo使用多场景数据集先在教师神经网络上进行训练,再用不同的单一场景数据集单独训练参数量较小的学生神经网络,来解决Transformer需要计算量大实时性差的问题。考虑到数据集特点,本发明的方法还将蛇形卷积融合到yolo网络模型中来提高性能。本发明使用教师神经网络训练学生神经网络能使模型取得更好的泛化能力,消耗更少的训练时间,也能使模型取得更快的推理速度。除了能够处理固定视角的列车定位与测速,本发明的方法也能处理移动视角下的列车定位与测速,且具有较好的实时性。
-
-
-
-
-
-
-
-
-