-
公开(公告)号:CN105979406B
公开(公告)日:2019-01-18
申请号:CN201610268490.2
申请日:2016-04-27
Applicant: 上海交通大学
IPC: H04N21/8549
Abstract: 一种基于代表性特征的视频摘要提取方法及其系统,包括:事件提取模块、事件聚类模块、代表性事件选取模块和事件快照模块,通过事件提取模块对视频中的每一帧图像进行前景块提取和筛选,得到视频中所有的前景块序列,将每个前景块序列作为视频的一个事件;然后通过事件聚类模块对事件进行聚类,并通过代表性事件选取模块根据代表性特征值对各事件类选取代表性的事件;最后通过事件快照模块对每个代表性事件制作快照得到视频的摘要;本发明设计合理,可以快速有效提取视频中的信息。
-
-
公开(公告)号:CN106339690A
公开(公告)日:2017-01-18
申请号:CN201610771414.3
申请日:2016-08-30
Applicant: 上海交通大学 , 上海方奥通信技术有限公司
Abstract: 一种基于噪声消除及辅助判断线的视频目标流量检测方法及系统,通过循环地对视频图像中的感兴趣区域中进行目标检测,并对其进行跟踪和刷新;然后在感兴趣区域外部设置安全区域进行人流量统计;最后循环判断当前所有被跟踪目标是否为误检测的目标,如是则删除误检测的目标。本发明实时性好,在复杂场景下能保证一定的准确率。
-
公开(公告)号:CN105719279A
公开(公告)日:2016-06-29
申请号:CN201610025121.0
申请日:2016-01-15
Applicant: 上海交通大学 , 浙江慧谷信息技术有限公司
IPC: G06T7/00
CPC classification number: G06T2207/30012
Abstract: 一种基于椭圆柱估计的人体模型手臂及手臂骨架的分割提取方法,通过从人体模型的点集中采集两侧肩膀、脊柱中部和脊柱底部的位置坐标并生成类椭圆柱体点集作为躯干模型,并从躯干模型的两侧得到手臂点集,通过投影后得到的平面图中得到三维手臂骨架点集,最后通过从三维手臂骨架点集中与肩膀骨架点和手腕骨架点之间的距离判断得到肩膀骨架点集、手腕骨架点集和手肘骨架点集,从而组成完整人体手臂骨架点集。
-
公开(公告)号:CN105678779A
公开(公告)日:2016-06-15
申请号:CN201610024401.X
申请日:2016-01-15
Applicant: 上海交通大学
IPC: G06T7/00
CPC classification number: G06T2207/10004 , G06T2207/30196
Abstract: 一种基于椭圆匹配的人体朝向角度实时检测方法,首先通过从参考图像中得到参考前景区域的非对称椭圆模型的参数,然后在任意朝向角度下采集得到肩膀横截面点集,并基于非对称椭圆模型生成非对称椭圆模型点集,最后通过匹配相邻两帧之间的肩膀横截面点集和不对称椭圆模型点集,得到人体朝向角度;根据本方法可实现实时且精确至1°的人体朝向检测。
-
公开(公告)号:CN105046230A
公开(公告)日:2015-11-11
申请号:CN201510446547.9
申请日:2015-07-27
Applicant: 上海交通大学
IPC: G06K9/00
CPC classification number: G06K9/00228 , G06K9/00248 , G06K9/00281
Abstract: 一种图像处理领域的基于图像的人眼角检测的方法及系统,通过使用固定模板对眼睛大致区域图和眼角区域图像进行滤波和自定义阈值的方法进行二值化,然后另外提取眼睛大致区域图中的类眼角点图和眼白图,利用类眼角点图中最右侧点的坐标信息为边界,滤除第二步得到的眼睛大致区域二值图中对应该边界右侧的连通区,获得一次修正的眼睛大致区域二值图,再将其与所述眼白图进行并集操作,获得二次修正后的眼睛大致区域二值图;然后计算眼角区域二值图内最大两个连通区与眼睛大致区域二值图的关系,从而得到两个连通区在眼睛大致区域二值图中对应的连通区,再计算这两个连通区与二次修正后眼睛大致区域二值图连通区关系,判断是否需要重新定位眼睛大致区域和眼角区域;最后对眼角区域二值图进行修剪并输出眼角点信息。通过本发明能够有效实现眼角检测。
-
公开(公告)号:CN102289795B
公开(公告)日:2013-05-22
申请号:CN201110215674.X
申请日:2011-07-29
Applicant: 上海交通大学
Abstract: 本发明提供一种基于融合思想的视频时空联合增强方法,首先通过学习的方法得到理想图像的特征信息,再利用融合的思想,结合分段拟合、最优化等方法,将原本针对不同方面增强的多个映射函数融合为一个全局映射函数,从而对原视频序列在空域和时域两方面同时进行增强。通过调查打分的试验方式得到,本发明对视频序列的增强效果要优于现有的增强方法。
-
公开(公告)号:CN114818848B
公开(公告)日:2025-02-07
申请号:CN202210216953.6
申请日:2022-03-07
Applicant: 上海交通大学
IPC: G06V10/774 , G06V10/82 , G06V10/25 , G06N3/0442 , G06N3/0455 , G06N3/092
Abstract: 一种基于图像块组合的高分辨率图像目标检测加速方法,在离线阶段从高分辨率图像中提取出图像块序列后,将①图像块序列作为状态、②图像块排列方式为动作、③合成的子图的目标检测准确率作为奖励,使用强化学习的方法训练策略网络;在在线阶段通过训练后的策略网络,根据输入的图像块序列得到对应的组合策略,并基于该组合策略合成子图,将目标检测得到结果后通过映射回原图实现加速检测。本发明减少了目标检测算法的运行次数,在加快算法运行速度的同时保证目标检测的准确率保持在较高水平。
-
公开(公告)号:CN119360268A
公开(公告)日:2025-01-24
申请号:CN202411375613.3
申请日:2024-09-29
Applicant: 联想(北京)有限公司 , 上海交通大学
IPC: G06V20/40 , G06V10/62 , G06V10/75 , G06V10/86 , G06V10/82 , G06N3/045 , G06N3/042 , G06N5/025 , G06N5/04
Abstract: 本申请公开一种问题处理方法、模型生成方法及相关装置,属于人工智能技术领域,所公开的问题处理方法包括:基于视频问答模型获得目标视频和针对所述目标视频的待处理问题;基于所述待处理问题对所述目标视频进行时域定位,根据定位得到的第一目标视频段为所述待处理问题生成目标答案;输出对所述待处理问题的处理结果,所述处理结果包括所述目标答案和所述第一目标视频段对应的时域信息;其中,所述视频问答模型为通过视频问答网络对满足对偶关系的不同问答对中的问题信息分别进行基于时域定位的视频问答处理,并基于所述不同问答对分别对应的所述视频问答处理之间的一致性损失调整所述视频问答网络的参数所得的模型。
-
公开(公告)号:CN118586471A
公开(公告)日:2024-09-03
申请号:CN202410704702.1
申请日:2024-06-03
Abstract: 一种基于上下文模型的Instant‑NGP模型压缩方法,通过构造并训练针对三维和二维混合的哈希表征定制化的上下文模型,用于对哈希表中的参数数值进行概率估计后,将估计得到的参数数值中产生哈希冲突的所有索引结点的信息进行融合,再通过算术编码技术实现熵编码,实现模型压缩的目的。本发明引入了上下文模型对哈希表征中的二值化的参数值进行估计以降低其信息熵,最后使用算术编码技术实现压缩的目的。
-
-
-
-
-
-
-
-
-