-
公开(公告)号:CN119762891A
公开(公告)日:2025-04-04
申请号:CN202411973769.1
申请日:2024-12-30
Applicant: 哈尔滨工业大学
IPC: G06V10/764 , G06V10/25 , G06V10/44 , G06N5/022 , G06N3/0499 , G06N3/09
Abstract: 基于多模态大模型的工业图像异常检测方法,属于工业异常检测领域,本发明为解决多模态大模型进行工业异常检测时存在可扩展性和适应性差、在图像中识别微小异常能力弱的问题。本发明包括步骤1、基于工业异常检测数据集构建知识理解训练任务,步骤2、利用专家引导的图像采样模块预测异常图并提取N个感兴趣区域,将N个感兴趣区域连同输入的原图一起输入视觉编码器中,以提取视觉特征,并输出大语言模型能识别的视觉编码;步骤3、构建视觉语言对齐的工业异常检测指令集;步骤4、利用知识理解训练任务和工业异常检测指令集对多模态大模型进行微调;步骤5、利用训练好的多模态大模型对工业产品进行异常检测。
-
公开(公告)号:CN114663285B
公开(公告)日:2023-06-09
申请号:CN202210339390.X
申请日:2022-04-01
Applicant: 哈尔滨工业大学
Abstract: 一种基于卷积神经网络的老电影超分辨系统,属于数字图像处理与深度学习领域。本发明针对现有老电影修复中,只能单一的进行超分处理或斑块处理,修复效果差的问题。包括:平滑模块,用于对相邻前k帧图像、当前帧图像和相邻后k帧图像进行特征提取,获得所有帧输入图像的中低频全局退化特征;特征提取模块用于进行特征提取,得到每帧输入图像的提取后特征;PCD模块对每组图像进行对齐操作;时间注意力模块用于获得当前帧图像的融合后高频特征;重建模块用于获得当前帧图像的重建后特征;最后通过相加单元获得当前帧图像的高清修复图像。本发明在实现超分的同时,改善了老电影存在的斑块问题。
-
公开(公告)号:CN111738956A
公开(公告)日:2020-10-02
申请号:CN202010589835.0
申请日:2020-06-24
Applicant: 哈尔滨工业大学
Abstract: 一种基于特征调制的图像去噪系统,涉及图像处理领域。解决了现有技术中将噪声水平图和噪声图像简单联结后对噪声图像进行去噪的方式,忽略了噪声水平图在后续层的影响,导致噪声图像去噪效果差的问题。本发明考虑用噪声水平图对原始噪声图像去噪进行多层引导,先对原始噪声图像和噪声水平图进行特征提取,获得提取完成的特征图,再对相应的特征图进行多尺度的多级调制,从而获得残差图像特征图,通过残差图像特征图用于实现对原始噪声图像的去噪,整个去噪过程挖掘了原始噪声图像和噪声水平图之间的复杂关系,并对噪声图像特征提取图不断的进行多尺度调制,使得去噪的效果更好。本发明主要用于对噪声图像进行去噪。
-
公开(公告)号:CN101214140A
公开(公告)日:2008-07-09
申请号:CN200710144966.2
申请日:2007-12-29
Applicant: 哈尔滨工业大学
IPC: A61B5/00
Abstract: 本发明涉及一种便携式近红外舌下静脉图像采集仪,它包括近红外舌下静脉图像采集仪主体及显示器,近红外舌下静脉图像采集仪主体由长方形近红外发射装置和红外摄像机构成,近红外发射装置和红外摄像机设置在长方体箱体内并连接变压器,液晶显示器固定于长方体箱体上盖上,红外摄像机的输出端与液晶显示器相连接,输入端与变压器相连接,液晶显示器的输入信号端与红外摄像机相连接,电源端与变压器相连接。该仪器体积小,质量轻,对人体无毒副作用,能够清晰地采集到病人的舌下静脉图像,使应用计算机处理舌下静脉图像、获取可用于疾病诊断的信息成为可能。
-
公开(公告)号:CN117788311A
公开(公告)日:2024-03-29
申请号:CN202311823155.0
申请日:2023-12-27
Applicant: 哈尔滨工业大学
IPC: G06T5/50 , G06T5/90 , G06T5/77 , G06N3/0895 , G06T5/60
Abstract: 一种基于包围摄影的自监督自适应的图像复原和增强方法,属于底层视觉重建技术领域。本发明针对现有图像重建模型只能完成单一重建任务并对真实数据重建能力差的问题。包括获取仿真数据集和真实数据集;构建由编码器、光流对齐模块、融合模块和重建模块构成的时间调制循环网络,对时间调制循环网络在仿真数据集上进行预训练,在真实数据集上进行微调训练;T帧多曝光RAW图像进行归一化和伽马变换得到变换图像,再经编码器进行特征提取得到编码特征,再利用光流对齐模块进行对齐得到对齐后特征;再经融合模块和重建模块重建得到重建生成图像;计算时域自监督损失、时域负损失和指数移动平均正则化损失,更新网络参数。本发明用于图像复原和增强。
-
公开(公告)号:CN116798092A
公开(公告)日:2023-09-22
申请号:CN202310591810.8
申请日:2023-05-24
Applicant: 哈尔滨工业大学
IPC: G06V40/16 , G06V10/774 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 构建个性化皮影头茬属性编辑生成器的方法,涉及计算机图像生成领域。解决了现有基于深度学习的人脸到皮影头茬的翻译方法,难以平衡生成图像保持原图中人脸可辨识特征的同时,兼顾拥有皮影头茬的结构要求的问题。本发明方法先构建皮影头茬样本集和人脸侧脸样本集,再对其样本集中样本进行预处理获得一组训练样本,通过一组训练样本对侧脸中间特征编码器EC、语义风格编码器ES和风格融合生成器G进行训练,且训练过程中通过计算总损失对上述三者进行参数更新,完成图像生成器的训练。本发明主要应用在由人脸图像到皮影头茬图像的翻译中。
-
公开(公告)号:CN114663285A
公开(公告)日:2022-06-24
申请号:CN202210339390.X
申请日:2022-04-01
Applicant: 哈尔滨工业大学
Abstract: 一种基于卷积神经网络的老电影超分辨系统,属于数字图像处理与深度学习领域。本发明针对现有老电影修复中,只能单一的进行超分处理或斑块处理,修复效果差的问题。包括:平滑模块,用于对相邻前k帧图像、当前帧图像和相邻后k帧图像进行特征提取,获得所有帧输入图像的中低频全局退化特征;特征提取模块用于进行特征提取,得到每帧输入图像的提取后特征;PCD模块对每组图像进行对齐操作;时间注意力模块用于获得当前帧图像的融合后高频特征;重建模块用于获得当前帧图像的重建后特征;最后通过相加单元获得当前帧图像的高清修复图像。本发明在实现超分的同时,改善了老电影存在的斑块问题。
-
公开(公告)号:CN104657103A
公开(公告)日:2015-05-27
申请号:CN201510114786.4
申请日:2015-03-16
Applicant: 哈尔滨工业大学
Abstract: 基于深度摄像机的手持CAVE投影系统,属于CAVE投影陈展技术领域。本发明是为了解决现有CAVE投影系统进行陈展演示,需要专业的设备和场地,成本高并且使用不便的问题。它的多个深度传感器用于测量获得用户所在空间墙壁的三维信息;同时,距离用户最近的一台深度传感器还用于测量手持投影仪与用户所在空间墙壁之间的距离、角度关系;计算机用于根据用户所在空间墙壁的三维信息获得欲投影画面;并实时根据相应的欲投影画面生成对应于所述照射范围的投影画面;手持投影仪用于将计算机生成的投影画面投射在用户所在空间墙壁上,随着用户在空间范围内的走动或者手臂动作的改变,实现探索式、沉浸式实景漫游。本发明用于实现陈展演示。
-
公开(公告)号:CN104408775A
公开(公告)日:2015-03-11
申请号:CN201410798524.X
申请日:2014-12-19
Applicant: 哈尔滨工业大学
IPC: G06T19/00
Abstract: 基于深度感知的三维皮影戏制作方法,属于数字皮影戏制作技术领域。本发明是为了解决现有皮影戏传承方式不能真实反映皮影表演的虚实变换,并不能适应性的匹配皮影花纹的问题。它首先将待制作皮影人物整体图像作为三维模型制作模块的前视图,以作为皮影人物三维模型的参照;再制作皮影人物全部身体部件平面模型;对所述平面模型进行表面颜色的贴图;将待制作皮影人物全部身体部件平面模型按序缀接,形成皮影人物三维模型;将皮影人物三维模型与所有骨骼建立绑定;将皮影人物三维模型的所有骨骼与相应人体骨骼关节的三维坐标信息建立映射关系;再用人体骨骼运动序列控制皮影人物三维模型的骨骼运动。本发明用于三维皮影戏制作。
-
公开(公告)号:CN118570118A
公开(公告)日:2024-08-30
申请号:CN202410461982.8
申请日:2024-04-17
Applicant: 哈尔滨工业大学
Abstract: 基于自适应扩散模型的无监督异常检测方法,属于工业图像异常检测领域。解决了传统无监督异常检测算法存在使用传统训练方式训练扩散模型使得图像重建效果差;且图像重建过程无法自适应添加噪声,导致图像异常检测准确率低的问题。本发明使用正常图像与合成异常图像来训练扩散模型,监督模型优化,增强模型重建能力;使用训练之后的扩散模型对输入待检测图像进行逐步的自适应去噪重建,去噪过程中确定最优去噪步数,针对不同的异常自适应添加不同步数的噪声;最后对重建前后图像进行特征空间对比,得到空间对比异常图及异常分数。本发明主要用于对图像进行异常检测。
-
-
-
-
-
-
-
-
-