一种智能视频监控中行人的检测方法

    公开(公告)号:CN103106414A

    公开(公告)日:2013-05-15

    申请号:CN201210566809.1

    申请日:2012-12-24

    Abstract: 一种智能视频监控中行人的检测方法,涉及计算机视觉、模式识别和图像处理等领域。提供可快速定位视频中的人体目标,方便后续智能视频分析的一种智能视频监控中行人的检测方法。1)利用图像采集设备建立行人数据库,并对该数据集进行标注,数据采集通过视频采集设备获取,标注信息包括行人的大小和位置信息;2)采用支持向量机训练行人检测器模型,模型训练好之后,将参数存放在智能监控系统的存储单元中;3)提取输入图片的行人特征描述子;4)利用支持向量机对图片中的每个行人检测窗口进行分类,分类的结果送到视频输出单元中;5)对检测的窗口进行融合,获取最终的行人检测结果。

    一种视频监控中的人体行为识别方法

    公开(公告)号:CN103106394A

    公开(公告)日:2013-05-15

    申请号:CN201210566810.4

    申请日:2012-12-24

    CPC classification number: G06K9/00335

    Abstract: 一种视频监控中的人体行为识别方法,涉及计算机视觉领域。提供能够对视频中连续不同的行为进行识别的一种视频监控中的人体行为识别方法。包括检测和表示局部时空特征、计算局部时空特征与类别相关性、计算视频帧与类别相关性、检测和识别人体行为。基于该人体行为识别方法的人体行为监控系统包括视频采集单元、存储单元、特征抽取单元、相关性分析单元、行为识别单元、视频输出单元和预警单元。能够对视频中连续不同的行为进行识别。

    基于骨骼数据的视频动作分类方法、装置、设备及介质

    公开(公告)号:CN117935364A

    公开(公告)日:2024-04-26

    申请号:CN202410124120.6

    申请日:2024-01-30

    Applicant: 厦门大学

    Inventor: 陈涵艺 苏松志

    Abstract: 本发明提供了一种基于骨骼数据的视频动作分类方法、装置、设备及介质,先获取待分类的视频信息,并基于双流放大模块对所述待分类的视频信息进行采样分解,以生成RGB信息流和骨骼信息流,接着,调用时序感知网络对所述RGB信息流进行特征提取,以生成所述待分类的视频信息的色彩特征;同时,对所述骨骼信息流进行转化成为三维数据,并调用图卷积网络对进行时序交叉后的所述三维数据进行处理,以生成所述待分类的视频信息的骨骼特征;最后,对所述色彩特征和所述骨骼特征进行融合,并根据所述融合结果生成视频信息的动作分类结果。解决了现有技术中通过色彩信息进行分类会受光照影响而出现分类失误的问题。

    一种面向在线考试答卷文档图像的一致性检测方法和存储设备

    公开(公告)号:CN112818797B

    公开(公告)日:2024-03-01

    申请号:CN202110102061.9

    申请日:2021-01-26

    Applicant: 厦门大学

    Abstract: 本发明涉及图像处理技术领域,特别涉及一种面向在线考试答卷文档图像的一致性检测方法和存储设备。所述一种面向在线考试答卷文档图像的一致性检测方法,包括步骤:获取第一图像和第二图像;定位两图像的奇异点位置,并根据奇异点位置对两个图像进行像素级对齐;截取第一图像的第一目标块,截取所述第二图像的第二目标块;比对第一目标块与第二目标块是否一致,若一致,则判定所述第一图像和所述第二图像一致。以上步骤中利用奇异点来实现第一图像和第二图像的像素级对齐,并且用来比对的目标块的奇异点数均不小于预设个数,确保了用于比对的目标块上信息的丰富性,确保了图像比对结果的准确性。(56)对比文件Geng Li-chuan;Su Song-zhi etal..Perspective invariant binary featuredescriptor based image matchingalgorithm《.Journal on Communications》.2015,第36卷(第4期),正文全文.赵琪 等.基于奇异点区域方向场的指纹检索《.微计算机信息》.2010,正文第1页右列第2段,第3页第2节.

    一种业务流程异常节点溯源方法

    公开(公告)号:CN112800282B

    公开(公告)日:2022-11-08

    申请号:CN202110054367.1

    申请日:2021-01-15

    Applicant: 厦门大学

    Abstract: 一种业务流程异常节点溯源方法,涉及流程图的构建与查找。包括以下步骤:1)通过数据仿真构建包含属性图信息的业务流程图;业务流程图中包括节点、节点属性、节点关系,属性图包含节点属性的转换关系;2)根据业务流程图和属性图中节点的属性数据流动关系,结合深度优先遍历搜索算法,基于属性图约束对业务流程图进行剪枝优化,将与异常节点路径上不相关的支路去除,给出起始溯源的具体属性,沿着该属性的方向逆向查找异常点,完成业务流程异常节点溯源。加快网络对异常节点的搜索速度,提升搜索效率,可实现高效异常逆向溯源搜索,为流程推进提供有力保障具有实际意义。

    一种遥感图像下的飞机检测方法及存储介质

    公开(公告)号:CN110991305A

    公开(公告)日:2020-04-10

    申请号:CN201911183503.6

    申请日:2019-11-27

    Applicant: 厦门大学

    Abstract: 本发明涉及一种遥感图像下的飞机检测方法及存储介质,所述方法包括以下步骤:根据输入待检测遥感图像,构造图像金字塔;将图像金字塔的每一层依次作为第一阶段神经网络的输入,得到每一层对应的输出结果;对于每一层对应的输出结果,将其区域置信度低于第一预设阈值的区域全部忽略,然后对剩下的区域进行执行非极大值抑制;将所有层的输出结果进行合并后,执行非极大值抑制,得到第一阶段输出结果;将第一阶段输出结果作为第二阶段神经网络的输入,得到第二阶段输出结果;将第二阶段输出结果中的区域置信度小于第二预设阈值的区域忽略,对剩下的区域进行非极大值抑制,得到最终输出结果。达到与深层神经网络相同的检测精度,将检测速度提升2-3倍。

    一种基于球面对齐估计的全景图像拼接方法及存储设备

    公开(公告)号:CN109829851A

    公开(公告)日:2019-05-31

    申请号:CN201910042518.4

    申请日:2019-01-17

    Applicant: 厦门大学

    Inventor: 邓海林 苏松志

    Abstract: 本发明涉及图像处理技术领域,特别涉及一种基于球面对齐估计的全景图像拼接方法及存储设备。所述一种基于球面对齐估计的全景图像拼接方法,包括步骤:获取输入图像,并将所述输入图像映射至统一的立方体网格展开图像面上;通过局部加权,计算每一个球面网格顶点的局部旋转矩阵,根据所述局部旋转矩阵得到局部对齐后的球面网格位置;对局部对齐后的球面网格位置通过纹理映射得到局部对齐后的映射图像。该拼接方法,可以在保证全景图像球面一致性的前提下,即使相机之间存在一定的视差,亦可极大程度的减少全景图像拼接中的拼接错位问题。

    基于图像块轨迹的动态场景下视觉里程计鲁棒性提高方法

    公开(公告)号:CN118071788A

    公开(公告)日:2024-05-24

    申请号:CN202410209048.7

    申请日:2024-02-26

    Applicant: 厦门大学

    Inventor: 庄力建 苏松志

    Abstract: 本发明一种基于图像块轨迹的动态场景下视觉里程计鲁棒性提高方法,涉及视觉的运动估计技术领域,首先对于每个图像It随机采样M个宽度为p的图像块组成图像块集合#imgabs0#基于所有图像块和帧组成的图像块‑图获得图像块的轨迹τk;然后基于轨迹τk估计每个块的运动标签Mk;最后将带有运动标签Mk的块轨迹τk更新相机姿态Gt。本发明在图像中采样若干图像块,不对整张图像做稠密的光流估计,而是仅估计图像块的光流信息,降低了推理速度;用轨迹的形式来存储多帧的信息,通过分析帧间图像块的轨迹,能够更准确地预测图像块的运动状态,并对动态图像块的降权处理,提升了动态环境下视觉里程计的性能。

    一种动态新视角图像的合成方法、装置、设备及存储介质

    公开(公告)号:CN117974864A

    公开(公告)日:2024-05-03

    申请号:CN202410186360.9

    申请日:2024-02-20

    Applicant: 厦门大学

    Inventor: 陈文亮 苏松志

    Abstract: 本发明提供了一种动态新视角图像的合成方法、装置、设备及存储介质,通过先获取多视图视频,对多视图视频进行前景与背景分割,生成分割后的图像。处理分割后的图像,生成M个视角的相机位姿和N个时间帧运动物体的点云坐标,并生成运动物体的外包矩形框。以每一张训练图像的相机中心为出发点,朝每个像素发射射线,穿过外包矩形框的近平面和远平面,在每条射线上采样预设数量的采样点。将采样点的4D坐标分解为多个3D坐标,对每个3D坐标编码为哈希特征,通过MLP对哈希特征进行预测,生成采样点的密度。提取分割后的图像的小波高频系数,结合小波高频系数对当前渲染图像进行特征提取生成特征图。将采样点映射到相邻图像和对应的特征图,采用双线性插值的方式生成最终图像特征,通过MLP对最终图像特征进行预测,生成采样点的RGB颜色。采用体渲染的方式对采样点的RGB颜色和密度进行渲染,生成新视角的图像。解决了在捕捉复杂动态场景的外观细节方面不足、以及一致性渲染的准确性低的问题。

    面向目标物分类的模型自增强方法、介质和设备

    公开(公告)号:CN116977731A

    公开(公告)日:2023-10-31

    申请号:CN202310948846.7

    申请日:2023-07-31

    Applicant: 厦门大学

    Inventor: 苏松志 王婉

    Abstract: 本发明公开了面向目标物分类的模型自增强方法、介质和设备,所述方法包括:采用MLC算法对原始数据集进行训练,得到初始分类模型,原始数据集包括多张带有标签的第一样本图像;获取包含多张未带有标签的第二样本图像的第二训练集,将第二训练集输入至初始分类模型中进行计算,得到各个第二样本图像对应的初始分类标签信息;采用元损失校正算法训练噪声转移矩阵,对各个第二样本图像对应的初始分类标签信息进行校正,得到校正后的最终分类标签信息;根据最终分类标签信息对各个第二训练集中的第二样本图像进行打标,输出第三训练集。本申请通过元损失校正算法自动校正初始分类模型输出的第二样本图像的伪标签,提高了自动打标的准确性。

Patent Agency Ranking