-
公开(公告)号:CN114463737B
公开(公告)日:2025-05-02
申请号:CN202210107083.9
申请日:2022-01-28
Applicant: 复旦大学
Abstract: 本发明涉及一种基于3D建模中隐式表示的3D目标检测方法和系统,方法包括采集点云数据并进行预处理,得到预处理点云数据;根据得到的预处理点云数据,在点云维度和体素维度上分别提取出对应的特征,并将这两种特征结合并转换为鸟瞰图特征;对鸟瞰特征图上的每个像素点进行坐标和特征偏移,筛选并采样出最大概率的候选中心点;使用隐式函数对以候选中心点为单位的周围局部三维空间内包含的所有点赋值,并根据赋予的结果生成目标边界框;通过将生成的目标边界框内的特征进行结合对边界框进行优化。与现有技术相比,本发明具有速度快、精确度高、鲁棒性好等优点,适用于三维场景下的目标检测和分割等应用。
-
公开(公告)号:CN117934875A
公开(公告)日:2024-04-26
申请号:CN202410104177.X
申请日:2024-01-24
Applicant: 复旦大学
IPC: G06V10/74 , G06T7/80 , G06T7/50 , G06V10/82 , G06V10/80 , G06V10/764 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种基于视觉Transformer的多视觉立体匹配系统及方法,该系统包括特征抽取模块和代价矩阵模块,特征抽取模块用于提取图像特征、抽取跨视图信息;代价矩阵模块通过单应变化将源图片特征变化到参考图片的坐标系下,并且进行特征融合,利用CVT以及3D楔形位置编码FPE和自适应注意力缩放AAS,以得到深度估计结果。与现有技术相比,本发明分别设计MVS流程中特征编码器和成本体积正则化对应的注意力机制,通过SVA将跨视图信息无缝地整合到预训练的DINOv2特征中。此外,在代价矩阵模块中设计FPE和AAS,以增强CVT对高分辨率图像的泛化能力,有效提高图像重建质量。
-
公开(公告)号:CN113673635B
公开(公告)日:2023-09-01
申请号:CN202010411459.6
申请日:2020-05-15
Applicant: 复旦大学
IPC: G06V10/82 , G06V30/18 , G06V30/19 , G06V30/226 , G06V30/30 , G06N3/0455 , G06N3/0895
Abstract: 本发明提供了一种基于自监督学习任务的手绘草图理解深度学习方法,其特征在于,包括如下步骤:步骤S1,基于不同的手绘草图中点的数据的分类对其中部分数据进行抹除,进一步将抹除部分数据后的手绘草图的数据用于自监督学习;步骤S2,将手绘草图的数据序列化后嵌入编码;步骤S3,将基于双向编码表示和自注意力机制的深度学习网络作为深度特征提取模块,并利用该深度特征提取模块提取手绘草图对应的点数据的深度特征;步骤S4,利用提取的深度特征预测被抹除的部分数据的坐标数据和状态数据;步骤S5,使用损失函数分别对坐标数据的预测与状态数据的预测任务进行训练从而获得训练好的网络模型。
-
公开(公告)号:CN113034390B
公开(公告)日:2022-10-18
申请号:CN202110286255.9
申请日:2021-03-17
Applicant: 复旦大学
Abstract: 本发明涉及一种基于小波先验注意力的图像修复方法及系统,包括以下步骤:获取多张原始图像;基于原始图像构筑遮掩图像;分别对各个遮掩图像进行Haar小波变换,得到遮掩图像在不同分辨率下的高频小波信息,以及分辨率为遮掩图像的1/2的训练图像;建立图像修复网络,基于原始图像、训练图像和遮掩图像的高频小波信息进行图像修复网络的训练,得到图像修复模型;使用图像修复模型进行图像修复。与现有技术相比,本发明利用原始图像、遮掩图像和遮掩图像的高频小波信息进行图像修复网络的训练,提供了图像修复中一些关键的结构信息和高频信息,同时引入了注意力偏移模块,提升了图像修复模型的效率,得到的图像修复模型能更好的还原结构信息。
-
公开(公告)号:CN113283340B
公开(公告)日:2022-06-14
申请号:CN202110570258.5
申请日:2021-05-25
Applicant: 复旦大学
Inventor: 付彦伟
Abstract: 本发明涉及一种基于眼表特征的疫苗接种情况检测方法、装置及系统,其中检测方法包括:步骤1:获取待检测的人脸图像;步骤2:对人脸图像进行预处理,获得眼部区域特征图像;步骤3:使用眼部特征提取模型获取眼部特征;步骤4:通过分类模型步骤3获取的眼部特征进行分类,获得疫苗接种情况预测结果。检测方法分别内嵌在装置和系统中实现疫苗接种检测功能。与现有技术相比,本发明具有有效实现疫苗接种情况的检测、摆脱专业人员依赖、持久优化等优点。
-
公开(公告)号:CN114399708A
公开(公告)日:2022-04-26
申请号:CN202111660869.5
申请日:2021-12-30
Applicant: 复旦大学
Abstract: 本发明公开了一种视频动作迁移深度学习系统和方法,包括分别与系统控制部连接的人物视频数据预处理部、视频特征量化部、视频特征重组部、动作迁移视频生成部,人物视频数据预处理部对源图像、参考图像进行预处理,提取源图像中源关键点信息和参考图像中参考关键点信息;视频特征量化部分别提取源图像、参考图像的深度特征,进行特征量化,获得源图像量化特征、参考图像量化特征;视频特征重组部根据源关键点、源图像量化特征、参考图像量化特征,预测出目标图像的量化特征;动作迁移视频生成部根据目标图像的量化特征,输出目标图像,系统控制部存储程序并进行控制。本系统用于实现动作迁移,保证目标图像的清晰度及分辨率。
-
公开(公告)号:CN114286103A
公开(公告)日:2022-04-05
申请号:CN202111597535.8
申请日:2021-12-24
Applicant: 复旦大学
IPC: H04N19/189 , H04N19/91 , H04N19/597
Abstract: 本发明提供一种基于深度学习的保留密度的点云压缩方法,用于在点云压缩过程中保留原始点云的密度从而生成高质量的重建点云,其特征在于,包括如下步骤:步骤S1,对预先获取的点云数据进行预处理从而得到训练样本;步骤S2,构建用于提取点云数据的几何信息与密度信息的编码器,并基于编码器获取点云特征;步骤S3,采用熵编码器对点云特征进行压缩;步骤S4,构建用于对点云特征进行上采样的解码器;步骤S5,构建损失函数;步骤S6,基于训练样本对由编码器、熵编码器以及解码器组成的点云压缩模型采用损失函数进行训练;步骤S7,将点云数据输入至训练好的点云压缩模型从而实现保留原始点云密度的点云压缩。
-
公开(公告)号:CN112967218B
公开(公告)日:2022-03-18
申请号:CN202110274795.5
申请日:2021-03-15
Applicant: 复旦大学
Abstract: 本发明提供了一种基于线框和边缘结构的多尺度图像修复系统,用于针对包含建筑或家具的室内外场景下的待处理图像进行结构信息补全,并完成图像修复或对象移除任务,其特征在于,包括:线框与边缘抽取模块利用预定的线框抽取方法对待处理图像进行线框抽取得到线框图像,并利用预定的边缘抽取方法对待处理图像进行边缘抽取得到边缘图像;结构修复模块基于待处理图像、线框图像以及边缘图像,通过预先训练好的结构修复模型进行结构修复,从而得到修复好的待处理图像作为结构修复图像;图像处理模块基于结构修复图像完成图像修复任务或对象移除任务。本发明的图像修复系统针对人造的场景(如室内家具、室外建筑)有更好的图像修复性能。
-
公开(公告)号:CN114187223A
公开(公告)日:2022-03-15
申请号:CN202010862461.5
申请日:2020-08-25
Applicant: 复旦大学
Abstract: 本发明属于医疗影像和计算机图像识别交叉领域,提供了一种基于眼表特征的新冠肺炎疾病患者风险筛查深度学习系统,用于通过拍摄得到的人脸图片中的眼部区域来进行患者的新冠肺炎疾病风险筛查,包括:人脸图像预处理部,用于对人脸图片进行预处理并得到眼部区域图片;眼部图像特征提取部,用于通过训练后的眼部图像特征提取模型提取眼部区域图片的基础特征;分类部,用于根据基础特征进行图片级的患病类别预测并得到图片级分类结果,以及用于根据图片级分类结果进行病患级分类得到新冠肺炎病患级预测结果。
-
公开(公告)号:CN113496521A
公开(公告)日:2021-10-12
申请号:CN202010267560.9
申请日:2020-04-08
Applicant: 复旦大学
Abstract: 本发明提供一种利用多张彩色图片生成深度图像与相机外参的方法及装置,用于对多张不同视角的待处理二维彩色图片进行处理从而生成与各个视角相应的深度值图像结果与相机外部参数结果,其特征在于,包括如下步骤:步骤S1,对预先获取的三维场景数据集进行预处理从而得到训练数据;步骤S2,生成初始深度值图像和初始相机外部参数估计;步骤S3,构建图像特征提取网络;步骤S4,构建三维卷积神经网络;步骤S5,构建损失函数;步骤S6,基于损失函数对由图像特征提取网络以及三维卷积神经网络组成的场景三维信息生成模型进行训练;步骤S7,将多张待处理二维彩色图片与对应的相机内部参数输入场景三维信息生成模型从而生成深度值图像与相机外部参数。
-
-
-
-
-
-
-
-
-