-
公开(公告)号:CN113034420A
公开(公告)日:2021-06-25
申请号:CN201911234650.1
申请日:2019-12-05
Applicant: 复旦大学 , 复卿(上海)智能科技有限公司
Abstract: 本发明提供一种频率空间域特征的工业产品表面缺陷分割方法及系统,其特征在于,采用预先训练完成的缺陷分割模型对预处理过的待测工业产品表面图片进行处理,得到预测的缺陷分割图片从而完成对工业产品表面缺陷的像素级精确分割,缺陷分割模型的训练过程包括如下步骤:步骤S1,获取预先标注的工业产品表面缺陷数据集作为初始训练集;步骤S2,对初始训练集进行预处理形成待使用训练集;步骤S3,构建拥有两个子网络的缺陷分割模型,缺陷分割模型包含一个主网络以及一个辅网络;步骤S4,构建损失函数;步骤S5,基于待使用训练集以及损失函数对缺陷分割模型进行训练。
-
公开(公告)号:CN112967218A
公开(公告)日:2021-06-15
申请号:CN202110274795.5
申请日:2021-03-15
Applicant: 复旦大学
Abstract: 本发明提供了一种基于线框和边缘结构的多尺度图像修复系统,用于针对包含建筑或家具的室内外场景下的待处理图像进行结构信息补全,并完成图像修复或对象移除任务,其特征在于,包括:线框与边缘抽取模块利用预定的线框抽取方法对待处理图像进行线框抽取得到线框图像,并利用预定的边缘抽取方法对待处理图像进行边缘抽取得到边缘图像;结构修复模块基于待处理图像、线框图像以及边缘图像,通过预先训练好的结构修复模型进行结构修复,从而得到修复好的待处理图像作为结构修复图像;图像处理模块基于结构修复图像完成图像修复任务或对象移除任务。本发明的图像修复系统针对人造的场景(如室内家具、室外建筑)有更好的图像修复性能。
-
公开(公告)号:CN107527318B
公开(公告)日:2021-06-04
申请号:CN201710582794.0
申请日:2017-07-17
Applicant: 复旦大学
Abstract: 本发明属于计算机图像处理技术领域,具体为一种基于生成对抗式网络模型的发型更换方法。自动更换发型在分类和图像编辑领域都有很多实际应用,本发明诉诸于这一要求,首先提供一个新的大型发型数据集,HAIRSTYLE30k,包含64种不同类型的30K图像组成的发型,同时,提供一个自动生成和修改发型的模型H‑GAN,来实现自动更换发型。本发明在基础的生成对抗式网络模型上做了改进,可以高效地学习新数据集,不仅在基础数据集上表现良好,在新数据集上也有很好的可泛化性。
-
公开(公告)号:CN111488760A
公开(公告)日:2020-08-04
申请号:CN201910073611.1
申请日:2019-01-25
Applicant: 复旦大学
Abstract: 本发明涉及一种基于深度多示例学习的少样本行人重识别方法,包括三个阶段:网络预训练阶段、数据集扩充阶段、网络微调阶段。行人重识别特征提取子网络预训练之后,利用行人关键点特征区域交换算法进行数据扩充;利用扩充的数据集对行人重识别特征提取子网络和特征聚合子网络进行微调;迭代重复数据集扩充和网络微调,直到特征提取子网络和特征聚合子网络收敛。一旦训练完成,即实现了利用少样本将原始域上的行人重识别模型迁移扩展至目标域上。本发明在给定目标域少量学习样本的前提上,能有效地将行人重识别模型迁移扩展到目标域监控网络中,具有精确度高、鲁棒性好、扩展性佳、可迁移的优点。
-
公开(公告)号:CN110188668A
公开(公告)日:2019-08-30
申请号:CN201910453199.6
申请日:2019-05-28
Applicant: 复旦大学
Abstract: 本发明属于计算机技术领域,具体涉及面向小样本视频动作分类的方法。本发明针对现有小样本视频动作分类的设定存在训练集与测试集类别交叉的问题,提出基于智能人体的小样本视频识别新模式,利用3D智能虚拟人体与虚拟环境交互的方式生成相同动作的大量虚拟视频,为深度神经网络提供训练样本;此外,还提出基于视频段替换的数据增强方法,通过用语义相近的视频片段替换原视频中某个片段的方法扩充有限的数据集。实验表明该方法对于小样本视频动作识别能起到很大的促进作用,且具有较好的鲁棒性与较强的算法可移植性。
-
公开(公告)号:CN108537136A
公开(公告)日:2018-09-14
申请号:CN201810224187.1
申请日:2018-03-19
Applicant: 复旦大学
CPC classification number: G06K9/00785 , G06K9/00362 , G06K9/629 , G06N3/08
Abstract: 本发明属于计算机图象识别技术领域,具体为基于姿态归一化图像生成的行人重识别方法。本发明的具体步骤包括:行人平均姿态和属性特征的预测;姿态归一化图像生成模型的构建、训练和测试,生成8张不同姿态的行人图像;行人重识别特征提取网络的构建、训练和测试,得到行人重识别特征;最后行人重识别特征融合,获得待检测行人目标以及所有候选行人目标的特征。本发明方法具有速度快、精确度高、鲁棒性好、泛化能力佳、可扩展性强等优点,非常适用于视频行人监控、视频行人信息检索等实际应用。
-
公开(公告)号:CN107527318A
公开(公告)日:2017-12-29
申请号:CN201710582794.0
申请日:2017-07-17
Applicant: 复旦大学
CPC classification number: G06T3/0012 , G06K9/00228 , G06N3/084
Abstract: 本发明属于计算机图像处理技术领域,具体为一种基于生成对抗式网络模型的发型更换方法。自动更换发型在分类和图像编辑领域都有很多实际应用,本发明诉诸于这一要求,首先提供一个新的大型发型数据集,HAIRSTYLE30k,包含64种不同类型的30K图像组成的发型,同时,提供一个自动生成和修改发型的模型H-GAN,来实现自动更换发型。本发明在基础的生成对抗式网络模型上做了改进,可以高效地学习新数据集,不仅在基础数据集上表现良好,在新数据集上也有很好的可泛化性。
-
公开(公告)号:CN114373127B
公开(公告)日:2025-04-29
申请号:CN202111609585.3
申请日:2021-12-24
Applicant: 复旦大学
IPC: G06V20/10 , G06V10/40 , G06V10/77 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及一种基于手绘草图的目标物可抓取点检测方法及系统,其中抓取点检测方法包括:获取标注好抓取框的自然场景图片集以及和场景中物体对应的手绘草图样本集,并对样本进行预处理;将草图和目标物体可抓取框进行配对,构建训练集;构建基于草图内容为引导的可抓取框检测网络;训练基于草图内容为引导的可抓取框检测网络;使用训练好的可抓取框检测网络定位自然场景图片中与草图内容相符的物体所对应的可抓取框。与现有技术相比,本发明具有有效实现基于草图引导机器人完成抓取目标物任务、网络收敛快、泛化能力强等优点。
-
公开(公告)号:CN114266307B
公开(公告)日:2024-08-09
申请号:CN202111569080.9
申请日:2021-12-21
Applicant: 复旦大学
Abstract: 本发明提供一种基于非零均值漂移参数并行识别噪声样本的方法,利用含有非零均值漂移参数的线性回归模型对训练数据集中样本的特征矩阵以及标签矩阵进行拟合,并求解对应的非零均值漂移参数的解路径,并基于解路径选取识别出噪声样本,因此,本发明的方法能够在含噪学习中并行识别出多个噪声样本,并将噪声样本剔除出训练数据集,降低训练数据集中的噪声样本的比例,从而达到帮助模型训练,提升模型的性能的效果。本发明的方法由于同时基于特征空间以及标签空间,因此,相较于仅基于特征空间或仅基于标签空间的现有识别方法,识别准确度更高。此外,本发明的方法还具有较好的鲁棒性和算法泛用性。
-
公开(公告)号:CN116551697A
公开(公告)日:2023-08-08
申请号:CN202310717463.9
申请日:2023-06-16
Applicant: 复旦大学
Abstract: 本发明涉及一种基于弱监督液体感知的机器人视觉闭环倾倒方法及装置,该方法包括以下步骤:半自动化收集带图像级标签的倒水场景图像;构建弱监督液体感知模型,以生成类别激活图;利用训练后的弱监督液体感知模型生成的类别激活图,提取二维液体区域;进行源容器和目标容器的位姿和尺寸估计;基于二维液体区域、以及位姿和尺寸估计,重建三维液体轨迹;根据目标容器的位姿和三维液体轨迹形成反馈,操控机器人调整源容器位置将水流倒入目标容器,实现视觉闭环控制。与现有技术相比,本发明可精准控制液体在倾倒过程中不洒出目标容器。
-
-
-
-
-
-
-
-
-