-
公开(公告)号:CN119091256B
公开(公告)日:2025-02-11
申请号:CN202411570536.7
申请日:2024-11-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/774 , G06V10/764 , G06V10/40 , G06V20/69 , G06V10/82 , G06N3/08 , G06N3/0499
Abstract: 本发明实施例公开了一种样本数据扩充方法、装置、电子设备及存储介质,涉及数字成像和深度学习技术领域,其中,所述方法包括:获取样本数据集的数字显微成像和标注作为训练集,设计初始数据扩充模型,根据初始数据扩充模型得到输出图像,初始数据扩充模型包括特征提取模型,特征生成模型和特征判别模型,使用特征判别模型对输入图像和输出图像进行对比得到损失值,根据损失值优化特征生成模型,使用训练集对初始数据扩充模型进行迭代优化直至达到设定条件,得到训练好的数据扩充模型,使用数据扩充模型对样本数据集进行扩充。本发明解决了现有技术只能在小样本数据集上进行模型训练,容易出现过拟合,泛化能力较差,难以取得良好效果的问题。
-
公开(公告)号:CN119296400A
公开(公告)日:2025-01-10
申请号:CN202411130743.0
申请日:2024-08-16
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了基于VR头显设备的多场景半同步虚拟教室方法,包括:读取虚拟教室初始界面,并建立教师端与学生端之间的课件连接,进入预设虚拟教室场景;建立所述教师端与所有学生端之间的通信连接,并根据选择的座位锚点调整对应学生端的座位及视角;获取所述教师端中的授课文件,并根据预设数据库的函数对所述授课文件进行转换,并将转换后的授课文件显示在所述预设虚拟教室场景的指定位置;获取所述教师端或当前学生端的语音信息,并对获取的语音信息进行转换,将转换的语音信息传输到其他端,实现虚拟教室的语音互动。本发明实现了教室场景多样化、教学语音互动、授课PPT课件展示以及座位视角切换的虚拟教室教学场景下的个性化需求。
-
公开(公告)号:CN118350417A
公开(公告)日:2024-07-16
申请号:CN202410780844.6
申请日:2024-06-18
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/0455 , G06N3/082 , G06N3/084
Abstract: 本发明公开了一种目标检测模型的优化方法、装置、电子设备及存储介质,应用于DINO模型,涉及人工智能技术领域,所述目标检测模型的优化方法包括以下步骤:S10,LST结构改进:在通过历史任务训练好的原DINO模型上新增旁支网络,以获得新DINO模型;S20,初步预热:固定原DINO模型的网络参数,并利用历史任务对旁支网络的参数进行训练;S30,持续学习增量训练:采用ER技术对新DINO模型进行持续学习训练,且训练过程中采用遗忘性优先采样策略进行历史任务样本选取;S40,推理测试。本发明的有益效果:既能缓解模型的灾难性遗忘,又能快速适应新任务。
-
公开(公告)号:CN118042133B
公开(公告)日:2024-06-28
申请号:CN202410436958.9
申请日:2024-04-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04N19/124 , H04N19/174 , H04N19/132 , G06T9/00
Abstract: 本发明公开一种基于切片表达的全景图像编码方法、解码方法及相关装置,涉及全景图像编解码领域,方法包括以下步骤:对获取的待编码全景图像进行超级切片图像转换,得到超级切片图像集合作为全景图像的切片化表达形式,利用切片编码器对超级切片图像集合进行特征提取,得到超级切片编码,进一步生成超级切片编码量化结果和先验编码量化结果,据此确定高斯分布概率模型,并利用该模型生成超级切片编码量化结果的比特流和先验编码量化结果的比特流;而在解码阶段,对超级切片编码量化结果的比特流进行解码,并将解码结果经过反量化以及切片解码后,得到全景重构图像,提高了全景图像表达的稳定性,实现了高性能的全景图像编解码。
-
公开(公告)号:CN118015287A
公开(公告)日:2024-05-10
申请号:CN202410419473.9
申请日:2024-04-09
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/26 , G06V10/776
Abstract: 本发明提供一种基于域纠正适应器的跨域小样本分割方法,涉及图像处理技术领域。方法包括:获取待分割图像,将待分割图像输入至已训练的特征提取层,得到待处理特征图;将待处理特征图输入至已训练的域纠正器,获取域纠正器输出的纠正特征图,域纠正器用于纠正待处理特征图的域与基准域的域差异;将纠正特征图输入至已训练的分割模块,获取分割模块输出的图像分割结果;其中,域纠正器与域扰乱器共同基于多组训练数据训练得到,每组训练数据包括样本待分割图像以及样本待分割图像对应的分割结果标签,样本待分割图像的域为基准域,域扰乱器用于对图像添加域扰动以实现对不同域的模拟。本发明可以提高对跨域的图像的分割准确度。
-
公开(公告)号:CN117974483A
公开(公告)日:2024-05-03
申请号:CN202311646494.6
申请日:2023-12-04
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于知识蒸馏的图像去噪方法、系统及存储介质,包括步骤一:建立自适应蒸馏框架,通过自适应蒸馏框架,从教师网络提炼出有用的信息;步骤二:经过特征映射模块进一步精炼,最后传递给学生网络。本发明的有益效果是:本发明提出了一种自适应蒸馏框架,该框架能自动调节蒸馏点的蒸馏力度,甚至去除某些蒸馏点,形成更优的蒸馏点位置,提升学生网络的收敛速度和性能。
-
公开(公告)号:CN116844190A
公开(公告)日:2023-10-03
申请号:CN202310774371.4
申请日:2023-06-27
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请提供了一种身份识别方法、身份识别装置、电子设备及存储介质,应用于增强现实设备,属于图像处理技术领域,通过获取第一手部图像,对第一手部图像进行手部关键点检测,得到第一关键点位置特征,根据第一关键点位置特征从第一手部图像提取第一感兴趣区域,对第一感兴趣区域进行掌纹特征提取,得到第一掌纹特征,对预设模板进行掌纹特征提取,得到第二掌纹特征,计算第一掌纹特征和第二掌纹特征之间的相似度数据,根据相似度数据和预设相似度阈值进行身份识别,以登录增强现实设备,在降低身份识别成本代价的同时,实现了安全快捷的身份识别,从而提高了登录的效率和安全性。
-
公开(公告)号:CN116399314B
公开(公告)日:2023-07-28
申请号:CN202310650448.7
申请日:2023-06-02
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 中冶建筑研究总院(深圳)有限公司 , 中冶建筑研究总院有限公司
Abstract: 本发明提供了一种用于摄影测量的标定装置及其测量方法,涉及摄影测量技术领域,所述标定装置主要包括标定球;所述标定球表面均布有若干等边图形;所述等边图形的颜色与所述标定球的本色不同。本方案通过使用标定球及其测量方法,可以实现单相机测量时的快速标定、测量以及数据拼接,消除了平面标定时信息少、畸变大、操作复杂等问题,并且可以获取三维物体的深度信息,便于进行三维标定,还可以提高图像特征及多视图几何约束的求解精度,从而有效修正三维重建模型的精度。
-
公开(公告)号:CN120014175A
公开(公告)日:2025-05-16
申请号:CN202510174489.2
申请日:2025-02-18
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T17/00 , G06N3/045 , G06N3/0475 , G06N3/094 , G06T7/10
Abstract: 本发明公开了一种X光图像三维重建方法、系统及电子设备,方法包括基于生成对抗网络构建X光图像三维重建网络Seg‑XCT并训练,Seg‑XCT包括生成器、鉴别器以及投影空间变压器;生成器根据输入的双视角X光图像,输出重建CT;投影空间变压器根据输入的重建CT与真实CT,分别生成多角度重建CT投影成像和多角度真实CT投影成像,并从多角度计算重建CT投影成像和真实CT投影成像的投影损失;鉴别器将双视角X光图像作为先验条件,根据输入的重建CT和真实CT,计算重建CT与真实患者CT之间的重建损失;利用训练完成的X光图像三维重建网络Seg‑XCT实现X光图像三维重建。本发明方法提升了重建图像的真实性和准确性。
-
公开(公告)号:CN119832262A
公开(公告)日:2025-04-15
申请号:CN202411698873.4
申请日:2024-11-26
Applicant: 哈尔滨工业大学(威海) , 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/42 , G06V10/44 , G06V10/26 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种对Deepfake伪造图像高效检测方法,涉及图像检测技术领域,具体在于解决背景技术中存在的肉眼不能分辨的Deepfake伪造图像或视频的问题,通过获取图像数据;使用CRE技术随机擦除标准化处理的图像中的一部分像素;使用ViT模型通过自注意力机制捕捉伪造图像的全局上下文信息;使用卷积神经网络CNN对图像进行卷积操作,提取伪造图像的局部细节信息;使用交叉注意力CVC网络,将全局特征表示和局部特征表示进行交叉融合,得到全面表征图像;将全面表征图像输入到分类器中,进行真伪检测和伪造部位的识别,实现精准、快速的对肉眼不能分辨的Deepfake伪造图像或视频进行识别的效果。
-
-
-
-
-
-
-
-
-