-
公开(公告)号:CN1300747C
公开(公告)日:2007-02-14
申请号:CN200410052642.2
申请日:2004-07-08
Applicant: 上海大学
Abstract: 本发明涉及一种基于区域多重选择的视频运动对象分割提取方法。其步骤如下:(1)当前帧输入,对当前帧进行区域划分,得到基于区域的空间图;(2)前帧或后帧输入,进行跳帧窗口差分运动信息计算,计算出当前象素的运动信息;(3)依据帧间运动信息进行区域初始分类选择,区域内运动象素点较多的确定为对象区域,运动点非常少的为背景区域,而介于其中间的区域为候选区域;(4)对候选区域,建立时空区域能量模型,进一步确定候选区域的归属;(5)对所得到的对象区域,进行梯度补充、马尔可夫模型及区域标记后处理,得到完整的对象掩模,通过映射,获得运动的视频对象。本发明提供的方法具有分割速度快、精度高的特点,适用于MPEG-4的面向对象和交互性的视频、基于MPEG-7的视频数据库检索和具有视频对象提取功能的智能监控系统等。
-
-
公开(公告)号:CN118096601A
公开(公告)日:2024-05-28
申请号:CN202410285664.0
申请日:2024-03-13
Applicant: 上海大学
IPC: G06T5/77 , G06T5/60 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本公开提供一种基于小波变换与多尺度残差的图像修复方法及系统,其中,基于小波变换与多尺度残差的图像修复方法包括:获取图像数据集和掩码数据集,对图像数据集和掩码数据集进行预处理,确定受损图像和受损图像对应的掩码;将受损图像和受损图像对应的掩码输入预设的图像修复网络,对预设的图像修复网络进行模型训练,确定经过模型训练的图像修复网络;采用预设的损失函数对经过模型训练的图像修复网络进行优化处理,确定图像修复网络模型;将当前受损图像输入图像修复网络模型,确定当前受损图像的修复图像。通过本公开,实现对受损图像的修复并使得修复图像在纹理细节和感知细节贴合原始未受损图像,提高修复图像的图像质量。
-
公开(公告)号:CN116485975A
公开(公告)日:2023-07-25
申请号:CN202310443937.5
申请日:2023-04-23
Applicant: 上海大学 , 上海文广科技(集团)有限公司
Abstract: 本发明提供一种融合参数化人体模型的人体点云补全方法及系统,包括:生成人体点云数据集;基于所述人体点云数据集进行人体点云位置预测;基于所述人体点云位置进行人体点云颜色预测。本发明利用点云迁移网络对异构点云的融合优势,利用SMPL人体模型对全局点云的估计能力,实现对单视点人体整体感知提升,在量化指标与可视化指标均有较大提升。
-
公开(公告)号:CN111461196B
公开(公告)日:2023-07-21
申请号:CN202010229998.8
申请日:2020-03-27
Applicant: 上海大学 , 上海文广科技(集团)有限公司
Abstract: 本发明提供一种基于结构特征的快速鲁棒图像识别跟踪方法和装置,所述方法采用GMS特征匹配算法,对查询图像与训练匹配图像进行特征点匹配对筛选;若存在正确的特征点匹配对,将查询图像与训练匹配图像中感兴趣区域等分成小的网格,为每个网格确定关键点;将关键点建模作为图的节点,构建图模型,将特征匹配与图匹配的权重参数相融合;用随机游走算法完成对图的近似匹配,完成图像识别跟踪。本发明可有效加速匹配识别方法,在较少的特征点匹配对情况下,提供更准确的识别跟踪性能。
-
公开(公告)号:CN116366863A
公开(公告)日:2023-06-30
申请号:CN202310207420.6
申请日:2023-03-07
Applicant: 上海大学 , 上海文广科技(集团)有限公司
IPC: H04N19/42 , H04N19/44 , H04N19/91 , H04N19/124 , H04N19/146 , H04N19/147 , H04N19/19
Abstract: 本发明提供了一种人眼视觉和机器视觉协同的图像特征压缩和解压缩方法,在编码端,生成具有任务先验信息的重要性掩码图并加入到图像特征提取器的局部通道中后,获得紧凑基础特征;将紧凑基础特征中具有任务先验信息的局部通道特征进行多尺度融合,获得紧凑辅助特征;基于紧凑基础特征和紧凑辅助特征,获得压缩传输的码流,完成图像特征压缩。在解码端,将紧凑量化基础特征进行重构解码,获得面向人眼视觉的重构图像;将紧凑量化基础特征与紧凑量化辅助特征进行融合,得到面向视觉任务的紧凑量化双流特征;将紧凑量化双流特征与视觉任务所需特征进行对齐训练,获得紧凑量化双流转换特征,完成任务解码。本发明在实际应用中更具灵活性。
-
公开(公告)号:CN112559810B
公开(公告)日:2022-04-08
申请号:CN202011533344.0
申请日:2020-12-23
Applicant: 上海大学
IPC: G06F16/901 , G06F16/903 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种利用多层特征融合生产哈希码的方法及装置,包括:建立图文对的相似度矩阵;通过不同残差块的输出来获取不同层的特征,将所述不同层的特征转换为通道数和尺寸一致的特征图,然后进行融合,最后通过全局池化和全连接并离散化得到图像对应的哈希码;用多尺度融合模块为每个文本生成对应的多尺度BOW模型,然后通过卷积层获得不同尺度的特征并进行融合,最后通过全连接层得到文本对应的哈希码;设计损失函数;训练模型;利用训练得到的模型,将样本输入其中获得对应的哈希码。通过本发明,生成的哈希码辨别性更强,用于跨模态检索时可以有效地提高检索的平均准确率。
-
公开(公告)号:CN114222133A
公开(公告)日:2022-03-22
申请号:CN202111504491.X
申请日:2021-12-10
Applicant: 上海大学
IPC: H04N19/503 , H04N19/70 , H04N19/179 , G06V10/764 , G06V10/774 , G06K9/62
Abstract: 本发明提供一种基于分类的内容自适应VCC帧内编码快速划分方法,包括:将待压缩视频分成若干个不同场景;对于每个不同的场景,所述场景内首帧用于模型的训练,场景内其他帧用训练好的模型进行预测;通过预测,将不能执行的划分方式移出候选模式队列;本发明结合支持向量机与场景切换检测算法,实现了在线训练、预测的分类算法,提供了稳定的加速性能和低码率损失,对训练样本的需求极小。
-
公开(公告)号:CN109905778B
公开(公告)日:2021-12-03
申请号:CN201910003111.0
申请日:2019-01-03
Applicant: 上海大学
IPC: H04N21/845 , H04N21/8549
Abstract: 本发明公开了一种基于组稀疏编码的单个非结构化视频的可扩展缩略的方法。对每个非结构化视频,将视频均匀切分为一小组片段,进行向量化表示。选取前n个片段为初始视频摘要,并通过组稀疏编码进行重构,获得初始字典和重构系数。用当前字典对下一片段进行重构并计算重构误差。若重构误差大于设定阈值,当前片段加入摘要。依次处理每个片段直到结束获得最终的字典和重构系数。根据稀疏重建系数,建立可扩展缩略。本发明以最小化视频片段单独稀疏性的同时最大化视频片段整体可分性为优化目标,对传统视频缩略方法进行有效扩展,建立了单个非结构化视频的缩略构建框架。可扩展缩略满足了不同用户的要求,增强了用户对关键内容的视觉体验。
-
公开(公告)号:CN113592716A
公开(公告)日:2021-11-02
申请号:CN202110906481.2
申请日:2021-08-09
Applicant: 上海大学
Abstract: 本发明公开了一种光场图像空间域超分辨率方法、系统、终端及存储介质,包括:将视点图像按照角度位置分为多组,对应设置多个视点图像对齐方案;将不同角度位置的视点图像,以其自身作为待超分辨率的中心视点图像,利用基于频域图像金字塔分解的视差提取方法,对其周围不同预设对齐范围内的待对齐视点图像进行视差对齐,对齐至中心视点图像位置;将待训练视点图像先剪裁后下采样再对齐,然后进行训练,得到光场图像超分辨率模型;将对齐后的待测试视点图像输入到光场图像超分辨率模型中,预测得到空间域超分辨率后的视点图像。本发明,将基于相位的视点图像视差对齐与基于深度学习的光场图像超分辨率方法相结合,得到了质量更高的超分辨率结果。
-
-
-
-
-
-
-
-
-