-
公开(公告)号:CN112560618A
公开(公告)日:2021-03-26
申请号:CN202011419698.2
申请日:2020-12-06
Applicant: 复旦大学
Abstract: 本发明属于计算机图像处理技术领域,具体为一种基于骨架和视频特征融合的行为分类方法。本发明方法包括:对已有的人类行为视频数据进行预处理,通过人体检测模型和OpenPose分别获取对应的人体检测框和人体骨架数据,作为深度学习模型的训练数据;其中视频数据和人体检测框数据作为前景与背景特征融合网络的输入,骨架特征作为个体与群体特征融合网络的输入;两个网络的输出结果进行平均为最终分类结果;接着对训练集进行监督式学习,得到泛化的深度学习模型;然后,对识别的视频进行和模型训练时一样的预处理,然后作为输入,放进预先训练好深度学习模型里,就能得到行为分类的结果。
-
公开(公告)号:CN111125396A
公开(公告)日:2020-05-08
申请号:CN201911245796.6
申请日:2019-12-07
Applicant: 复旦大学
IPC: G06F16/532 , G06F16/583 , G06F16/55 , G06N3/04 , G06N3/08
Abstract: 本发明属于图像检索技术领域,具体为一种单模型多分支结构的图像检索方法。本发明采用单模型集成多学习分支结构,特征提取器为多层卷积神经网络结构,学习分支为多卷积层与多隐藏层结构;单个特征提取器与多学习分支共享特征参数,其中,单个特征提取器保证统一的特征表达,结合学习分支的差异化训练方法,实现图像特征属性的映射;多分支结构拼接各个学习器的输出向量以获得最后描述图像的高维向量;最后这个特征向量相似度排序,根据相似度排序,即检索到同类别图像。本发明模型训练时间短,计算效率高。
-
公开(公告)号:CN106022337B
公开(公告)日:2019-10-15
申请号:CN201610344722.8
申请日:2016-05-22
Applicant: 复旦大学
Abstract: 本发明属于机器视觉图像处理技术领域,具体为一种基于连续边缘特征的平面目标检测方法。本发明方法包括:提取连续边缘特征、建立目标轮廓模型、基于Hough变换思想提取候选目标、对候选目标进行筛选并实现精确定位等步骤。尤其适用于在工业场景下,快速建立未知平面目标的模型并实现目标检测。本发明无需对于特定目标调整方法,可适用于各种平面目标(以及表面为平面的目标),一定程度上解决了目前视觉系统泛用能力较弱的问题。同时本发明具有较高的检测精度、高效的处理速率以及一定的抗噪能力。
-
公开(公告)号:CN109558877A
公开(公告)日:2019-04-02
申请号:CN201811220587.1
申请日:2018-10-19
Applicant: 复旦大学
Abstract: 本发明属于视频分析技术领域,具体为一种基于KCF的海上目标跟踪算法。本发明算法包括:(1)图像预处理:主要是对图像的去噪和去雾,获取质量较好的海面图像;(2)目标检测:海天线提取,通过改进的DPM算法获取目标位置;(3)目标跟踪:通过改进的KCF算法,对目标进行轨迹预测,实现有遮挡场景下的多目标跟踪。本发明综合不同图像处理方法性能差异,形成一套能够同时满足时间和准确率要求的算法,可在有限的计算资源下,保证较高的准确率,并实时的进行分析,极大的提高了遮挡场景下的目标跟踪成功率。
-
公开(公告)号:CN107193279A
公开(公告)日:2017-09-22
申请号:CN201710320077.0
申请日:2017-05-09
Applicant: 复旦大学
IPC: G05D1/02
CPC classification number: G05D1/0251 , G05D1/0276
Abstract: 本发明公开了一种基于单目视觉和IMU信息的机器人定位与地图构建系统。本发明利用纯视觉导航信息对IMU偏差模型、绝对尺度以及重力加速度方向等进行估计;在视觉导航中,使用高效的ORB特征提取算法,对图像帧提取丰富的ORB特征;利用基于预积分的IMU动力学模型建立相机的运动模型,对相机位置进行实时初步估计;在初步估计的基础上对两个图像帧之间的ORB特征进行更为精确的估计,再利用多目几何知识,实现对空间地图点三维重构;在融合IMU信息的视觉信息匹配的基础之上,采用基于因子图的后端优化算法,实时对地图位置进行精确和实时的估计。本发明能够对机器人运动和周围环境信息进行精确的估计。
-
公开(公告)号:CN106022337A
公开(公告)日:2016-10-12
申请号:CN201610344722.8
申请日:2016-05-22
Applicant: 复旦大学
Abstract: 本发明属于机器视觉图像处理技术领域,具体为一种基于连续边缘特征的平面目标检测方法。本发明方法包括:提取连续边缘特征、建立目标轮廓模型、基于Hough变换思想提取候选目标、对候选目标进行筛选并实现精确定位等步骤。尤其适用于在工业场景下,快速建立未知平面目标的模型并实现目标检测。本发明无需对于特定目标调整方法,可适用于各种平面目标(以及表面为平面的目标),一定程度上解决了目前视觉系统泛用能力较弱的问题。同时本发明具有较高的检测精度、高效的处理速率以及一定的抗噪能力。
-
公开(公告)号:CN105787966A
公开(公告)日:2016-07-20
申请号:CN201610157571.5
申请日:2016-03-21
Applicant: 复旦大学
IPC: G06T7/40
Abstract: 本发明属于计算机图像处理技术领域,具体涉及一种计算机图像的美学评估方法。本发明是一种基于对象区域构图特征的图像美学评估方法,其步骤为:利用BING方法检测图像对象,对BING方法得到的候选框进行聚类并优化,从而得到图像对象区域;然后针对图像对象区域利用构图特征进行美学评估,其中,对画面构图相关特征进行了整合和改进,提高了美学评估的性能。本发明方法能够对计算机图像进行有效的美学评估。
-
公开(公告)号:CN101894125A
公开(公告)日:2010-11-24
申请号:CN201010175127.9
申请日:2010-05-13
Applicant: 复旦大学
IPC: G06F17/30
Abstract: 本发明属于计算机视频处理技术领域,具体为一种视频分类方法。本发明选取卡通、商业广告、电影、新闻和体育比赛作为分类对象,在总结和分析了现有分类算法的基础上,决定从视频的底层特征(如颜色,纹理,形状)中选取分类效果最好的颜色作为分类特征,并基于颜色特征对各种分类算法作了比较,分析和总结,提出了基于时间和颜色特征融合的分类方法,由于每种特征对某类视频分类效果有偏好,称之为此类视频的专家特征;进一步利用专家系统使这些特征合作来提高分类的准确率,同时也提高了效率。
-
公开(公告)号:CN114298978B
公开(公告)日:2025-02-11
申请号:CN202111493641.1
申请日:2021-12-08
Applicant: 复旦大学
IPC: G06T7/00 , G06N3/0464 , G06N3/09
Abstract: 本发明属于计算机图像处理技术领域,具体为基于近红外摄像与深度学习的人手腕脉口位置精准定位方法。本发明的基本步骤为:首先通过近红外相机对多人进行手部图像采样,由专业医生进行脉口位置的标记,作为深度学习脉口定位网络模型的训练数据;然后构建深度学习网络模型,网络模型包括特征提取网络和回归网络,特征提取网络对训练集进行腕部轮廓纹理颜色等特征提取,将提取到的腕部特征通过回归网络进行脉口位置预测,得到泛化能力较强的深度学习脉口定位网络模型;最后将拍摄到的手部图像作为预先训练好的深度学习脉口定位网络模型的输入,预测得到手腕脉口在图像上的位置。本发明方法能以较高的精度找到人手腕的脉口位置,为机器人进行中医脉诊提供实时的视觉定位。
-
公开(公告)号:CN111125396B
公开(公告)日:2023-06-30
申请号:CN201911245796.6
申请日:2019-12-07
Applicant: 复旦大学
IPC: G06F16/532 , G06F16/583 , G06F16/55 , G06N3/0464 , G06N3/08
Abstract: 本发明属于图像检索技术领域,具体为一种单模型多分支结构的图像检索方法。本发明采用单模型集成多学习分支结构,特征提取器为多层卷积神经网络结构,学习分支为多卷积层与多隐藏层结构;单个特征提取器与多学习分支共享特征参数,其中,单个特征提取器保证统一的特征表达,结合学习分支的差异化训练方法,实现图像特征属性的映射;多分支结构拼接各个学习器的输出向量以获得最后描述图像的高维向量;最后这个特征向量相似度排序,根据相似度排序,即检索到同类别图像。本发明模型训练时间短,计算效率高。
-
-
-
-
-
-
-
-
-