-
公开(公告)号:CN116994258A
公开(公告)日:2023-11-03
申请号:CN202310971667.5
申请日:2023-08-03
Applicant: 哈尔滨工业大学
IPC: G06V30/148 , G06V30/19 , G06F17/16
Abstract: 一种基于扩散模型的无训练指代图像分割方法,属于计算机视觉中的指代图像分割领域。本发明针对现有数据匮乏情况下,难以实现指代图像分割的问题。包括:获取要进行指代图像分割的原始图像和文本,对原始图像增加高斯噪声后,经生成器得到交叉注意力函数的全部计算结果矩阵;在交叉注意力函数的全部计算结果矩阵中确定与核心词语位置对应的所有目标矩阵;再利用双线性插值算法对目标矩阵进行扩张,再均值化得到指代关系矩阵;再采用SAM模型对原始图像进行分割,得到多个候选分割结果矩阵;计算每个候选分割结果矩阵与指代关系矩阵的相似度,选择相似度最高的候选分割结果矩阵作为指代图像分割结果。本发明实现了无训练指代图像分割。
-
公开(公告)号:CN116881848A
公开(公告)日:2023-10-13
申请号:CN202310887646.5
申请日:2023-07-19
Applicant: 哈尔滨工业大学
IPC: G06F18/25 , G06N3/0895
Abstract: 基于多模型权重迭代式融合的半监督物体检测方法,属于二维图像的物体检测领域。本发明针对现有半监督物体检测中学生‑教师双网络联合训练模型的方法会降低学生和教师模型之间差异性的问题。包括设置N组结构相同的学生‑教师双网络;对每组学生‑教师双网络设置不同的训练超参数,并训练Tp个迭代周期;将N组训练后的学生‑教师双网络中,N个学生网络的模型权重进行平均,得到权重平均值;更新N个学生网络的模型权重并进行下一轮训练,直到学生‑教师双网络达到收敛状态;将收敛后N组学生‑教师双网络中的一组学生‑教师双网络作为检测器用于二维图像的物体检测。本发明用于实现半监督物体检测。
-
公开(公告)号:CN116071265B
公开(公告)日:2023-08-08
申请号:CN202310144160.2
申请日:2023-02-21
Applicant: 哈尔滨工业大学
IPC: G06T5/00 , G06T7/00 , G06V10/22 , G06V10/80 , G06V10/40 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/09
Abstract: 基于空间自适应自监督学习的图像去噪方法,属于图像复原技术领域。解决了现有自监督图像去噪方法存在对空间相关噪声去噪效果差的问题。本发明包括:步骤一、对噪声图像y进行区域特征提取,获得平坦区域监督图像和纹理区域监督图像步骤二、利用区域判别模块对平坦区域监督图像中每个像素点所在空间位置坐标(,j)处的平坦度自适应系数α(i,j)进行识别,从而确定的平坦度自适应系数矩阵α;步骤三、利用y、以及α对去噪模块进行训练,进行模型参数迭代更新,获得训练后的去噪模块;步骤四、利用训练后的去噪模块对待去噪图像进行去噪。本发明主要用于对相机采集的真实图像进行去噪。
-
公开(公告)号:CN114663307B
公开(公告)日:2023-07-04
申请号:CN202210283318.X
申请日:2022-03-22
Applicant: 哈尔滨工业大学
IPC: G06T5/00 , G06N3/0464 , G06N3/082
Abstract: 基于不确定性网络的集成图像去噪系统,属于图像复原技术领域。本发明针对现有图像去噪方法泛化性弱和不能直接利用已有去噪算法模型造成浪费的问题。包括C个训练好的已知去噪模型、不确定性得分估计网络、SoftMax权重计算器和求和单元;C个训练好的已知去噪模型用于分别对噪声图像进行去噪操作获得去噪后图像;不确定性得分估计网络用于分别对每一幅去噪后图像与噪声图像进行评估,获得C个不确定性方差分布图和C个去噪分数分布图;SoftMax权重计算器用于将C个去噪分数分布图逐像素转化为对应的预测权重分布图;求和单元用于将每一个预测权重分布图与对应去噪后图像相乘的结果进行相加,获得最终去噪图像。本发明实现了对不同去噪结果的逐像素融合。
-
公开(公告)号:CN113554569B
公开(公告)日:2022-03-08
申请号:CN202110891768.2
申请日:2021-08-04
Applicant: 哈尔滨工业大学
Abstract: 一种基于双记忆字典的人脸图像复原系统,属于人脸图像复原技术领域。本发明针对现有通用人脸图像复原方法对身份的细节特征复原能力差的问题。包括,采用通用字典生成模块获得不同尺度的通用特征字典;特定字典生成模块获得不同尺度的特定特征字典;人脸特征提取模块获得不同尺度的退化人脸各部位特征,以及退化人脸各部位特征的查询值;字典特征迁移模块获得遍历后字典特征;字典特征迁移模块中还设置置信度预测模块获得退化人脸各部位的自适应融合特征;退化图像复原模块获得重建结果特征;并将重建结果特征按照人脸关键点替换到待复原退化人脸图像中,获得复原后人脸图像。本发明用于退化人脸图像的高质量复原。
-
公开(公告)号:CN111640073B
公开(公告)日:2021-06-01
申请号:CN202010413635.X
申请日:2020-05-15
Applicant: 哈尔滨工业大学
Abstract: 一种图像盲去噪系统,属于图像去噪技术领域。本发明针对现有图像去噪方法依赖噪声与清晰图像对进行模型的训练,可行性差的问题。其自监督学习模块包括:基于空洞卷积的盲点网络和图像相关的噪声水平估计网络,用于对噪声样本图像集中的噪声样本图像通过自监督损失优化,并基于贝叶斯预测得到初步盲去噪图像,得到第一数据集;图像相关的噪声水平估计网络还对清晰样本图像集中的清晰样本图像进行处理,生成对应噪声图像,得到清晰样本图像与对应噪声图像对组成的第二数据集;知识蒸馏模块用于在全监督模式下采用第一数据集和第二数据集训练基于多级小波的卷积神经去噪网络,得到去噪模型。本发明基于非成对图像实现盲去噪。
-
公开(公告)号:CN111738956A
公开(公告)日:2020-10-02
申请号:CN202010589835.0
申请日:2020-06-24
Applicant: 哈尔滨工业大学
Abstract: 一种基于特征调制的图像去噪系统,涉及图像处理领域。解决了现有技术中将噪声水平图和噪声图像简单联结后对噪声图像进行去噪的方式,忽略了噪声水平图在后续层的影响,导致噪声图像去噪效果差的问题。本发明考虑用噪声水平图对原始噪声图像去噪进行多层引导,先对原始噪声图像和噪声水平图进行特征提取,获得提取完成的特征图,再对相应的特征图进行多尺度的多级调制,从而获得残差图像特征图,通过残差图像特征图用于实现对原始噪声图像的去噪,整个去噪过程挖掘了原始噪声图像和噪声水平图之间的复杂关系,并对噪声图像特征提取图不断的进行多尺度调制,使得去噪的效果更好。本发明主要用于对噪声图像进行去噪。
-
公开(公告)号:CN107481295B
公开(公告)日:2020-06-30
申请号:CN201710691448.6
申请日:2017-08-14
Applicant: 哈尔滨工业大学
IPC: G06T9/00
Abstract: 基于动态字节长度分配的卷积神经网络的图像压缩系统,属于图像压缩技术领域。所述图像压缩系统:字节长度分配图网络将卷积码编码器的中间特征,即字节长度特征,作为其输入,建立基于待压缩图像内容的字节长度分配图,并根据该字节长度分配图建立字节长度分配图模板。二值器将卷积码编码器输出的初步编码特征图转换为编码二值特征图,即离散编码。在进入卷积熵编码器之前,所述离散编码先与字节长度分配图模板进行点乘裁剪。因此,对于本发明所述的图像压缩系统,其待熵编码的离散编码随待压缩图像的局部信息内容的变化而变化,与待压缩图像的配合度更高,具有更好的压缩效果。本发明所述的图像压缩系统适用于对图像进行压缩和解压。
-
公开(公告)号:CN108537754A
公开(公告)日:2018-09-14
申请号:CN201810329602.X
申请日:2018-04-12
Applicant: 哈尔滨工业大学
Abstract: 基于形变引导图的人脸图像复原系统,属于图像复原领域,解决了现有基于卷积神经网络的人脸图像复原系统无法对低质量人脸图像进行有效增强的问题。人脸图像复原系统:引导图变形网络和人脸图像重建网络均基于卷积神经网络实现。引导图变形网络将待复原人脸图和引导图作为输入,将得到的光流向量作为使引导图变形的绝对坐标,并通过双线性插值的方式使引导图变形,得到形变引导图。引导图和待复原人脸图为同一人的人脸图,引导图为高清正脸图。形变引导图中的人脸与待复原人脸图中的人脸的姿态和表情相同。人脸图像重建网络将待复原人脸图和形变引导图作为其输入,并输出复原人脸图。本发明所述的人脸图像复原系统适用于对低质量人脸图像进行增强。
-
公开(公告)号:CN102283626B
公开(公告)日:2013-02-27
申请号:CN201110261463.X
申请日:2010-05-21
Applicant: 哈尔滨工业大学
Abstract: 包含结构光三维成像系统的医用内窥镜,它涉及一种医用内窥镜,它解决了在扩张鼻内腔脑外科手术中,由于常规立体观测技术受空间限制而不能直接应用于医用内窥镜的问题。本发明的医用内窥镜,它包括工作镜管,所述工作镜管包括成像通道和照明通道,所述照明通道内置照明光纤,它还包括计算处理模块,所述计算处理模块的信号输入端连接成像通道的电信号输出端;它还包括结构光通道,所述结构光通道置于照明通道内,照明光纤的末端输出的光束由结构光通道接收,该光束经过结构光通道后产生结构光,且所述结构光由结构光通道输出至照明通道外。本发明克服了已有技术的不足,可用于扩张鼻内腔脑外科手术中。
-
-
-
-
-
-
-
-
-