-
公开(公告)号:CN114820739B
公开(公告)日:2022-10-11
申请号:CN202210765686.8
申请日:2022-07-01
Applicant: 浙江工商大学 , 浙江宇视科技有限公司
IPC: G06T7/33 , G06T3/40 , G06T5/10 , G06V10/764 , G06V10/774
Abstract: 本发明公开了一种面向多光谱相机的图像快速配准方法及装置。首先,选定某个光谱波段图像作为参考图像,其余波段图像为待配准图像,对参考图像与待配准图像的鲁棒梯度特征图进行网格分块;然后,选取非平滑网格,用相位相关算法计算非平滑网格的偏移量,用网格偏移量与参数化坐标变换关系构建方程组,求解整幅图像的配准参数初值;最后,将配准参数初值送入到基于归一化总梯度的配准参数优化器中,对配准参数进行细调优化,将细调后的参数应用到待配准图像上,实现两幅不同波段图像之间的精细化快速配准。与同类配准方法相比,本发明方法具有更高的配准精度、更快的配准速度。
-
公开(公告)号:CN114037945B
公开(公告)日:2024-09-06
申请号:CN202111506944.2
申请日:2021-12-10
Applicant: 浙江工商大学
IPC: G06F16/78 , G06F16/783 , G06F16/732 , G06V20/40 , G06V10/82 , G06V10/80 , G06N3/0442 , G06N3/045
Abstract: 本发明公开了一种基于多粒度特征交互的跨模态检索方法,用于实现视频和文本之间的相互检索任务。本发明使用全局视觉语义特征指导局部视觉语义特征来获取更加细粒度的局部信息,随后让全局视觉语义特征和经过增强的局部视觉语义特征进行相互学习融合得到视频级别的特征。将经过学习得到的视频级别特征与文本特征映射到同一个嵌入空间中,在嵌入空间中进行跨模态匹配,从而实现文本和视频之间的跨模态检索。本发明是一种基于神经网络的跨模态检索方法,在性能和复杂度上达到了较优平衡。
-
公开(公告)号:CN113920164B
公开(公告)日:2024-05-24
申请号:CN202111252678.5
申请日:2021-10-27
Applicant: 浙江工商大学
IPC: G06T7/246 , G06V10/764 , G06V10/82 , G06V40/20 , G06N3/045 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种剧场环境下基于近红外防伪油墨的演员身份重识别方法。该方法通过近红外相机获取彩色相机中不可见的近红外防伪油墨标记,然后将图像送入训练好的检测器与分类器中,最终实现对舞台上表观相似演员跟踪时的身份重识别。本方法用仅近红外相机可见的近红外防伪油墨标记替代已有的演员表观信息或传感器作为区分演员身份的关键特征,具有以下优势:极大程度减少了舞台复杂光照对演员跟踪过程中身份识别稳定性的干扰,以及通过引入特有近红外防伪油墨标记信息解决了演员表观相似所带来的跟踪困难问题。与基于传感器的身份识别方法相比,该方法成本低,操作性强,在舞台演出中具有普遍的适用性。
-
公开(公告)号:CN113674412A
公开(公告)日:2021-11-19
申请号:CN202110924699.0
申请日:2021-08-12
Applicant: 浙江工商大学
Abstract: 本发明提供一种基于位姿融合优化的室内地图构建方法、系统及存储介质,所述方法包括:根据KINECT和IMU获取的实时数据解算机器人的位姿数据;根据IMU的线加速度数据和里程计数据判断机器人的当前运动状态;若机器人处于静止状态,则采用扩展卡尔曼滤波算法对所述位姿数据进行融合处理,若机器人处于运动状态,则采用动态加权方法对所述位姿数据进行融合处理;根据融合处理结果构建室内地图。该方法具有更高的位姿估计精度、更高的二维地图建模精度以及更优的建模效果,能够应用于贫特征、高动态、弱光影的场景中。
-
公开(公告)号:CN111882586A
公开(公告)日:2020-11-03
申请号:CN202010583994.X
申请日:2020-06-23
Applicant: 浙江工商大学
Abstract: 本发明公开了一种面向剧场环境的多演员目标跟踪方法。该方法首先构建并训练目标分类器,以对具有相似特征的演员进行分类;然后将视频帧送入目标检测器中,得到各个演员的检测框;将检测框送入训练好的目标分类器中进行演员ID预测;最后联合目标分类器预测得到的演员ID与轨迹关联算法形成多演员的跟踪轨迹。本发明在数据关联与轨迹初始化上加入目标类别预测,一定程度上解决了演员ID变化问题;在目标分类器上引入了三元组损失和交叉熵损失相结合的损失函数,增加了分类器对演员表观特征的辨识度;在预处理阶段引入了模板匹配和距离度量的方法,一定程度上解决了剧场、舞台等复杂光照环境对演员识别跟踪的影响,提高了检测、跟踪算法的准确率。
-
公开(公告)号:CN119323590B
公开(公告)日:2025-04-01
申请号:CN202411875786.1
申请日:2024-12-19
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于图像模糊度的实时物体静止检测方法及系统,包括对视频流中的当前帧彩色图像转换为灰度图像和定长的灰度图像序列实时更新;灰度图像模糊度计算和模糊度序列实时更新;使用增量更新法实时更新平均图像并计算平均图像的模糊度;将平均图像的模糊度与模糊度序列中最大模糊度的比值作为相对静止系数,并与设定阈值比较,判断场景的运动状态。本发明通过融合连续多帧信息得到相对静止系数,可以实时、准确地,且稳定性良好,能有效抵抗噪声、光照变化的干扰。
-
公开(公告)号:CN119323590A
公开(公告)日:2025-01-17
申请号:CN202411875786.1
申请日:2024-12-19
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于图像模糊度的实时物体静止检测方法及系统,包括对视频流中的当前帧彩色图像转换为灰度图像和定长的灰度图像序列实时更新;灰度图像模糊度计算和模糊度序列实时更新;使用增量更新法实时更新平均图像并计算平均图像的模糊度;将平均图像的模糊度与模糊度序列中最大模糊度的比值作为相对静止系数,并与设定阈值比较,判断场景的运动状态。本发明通过融合连续多帧信息得到相对静止系数,可以实时、准确地,且稳定性良好,能有效抵抗噪声、光照变化的干扰。
-
公开(公告)号:CN114048818B
公开(公告)日:2024-12-17
申请号:CN202111358049.0
申请日:2021-11-16
Applicant: 浙江工商大学
IPC: G06V10/764 , G06V10/774
Abstract: 本发明公开了一种基于加速Transformer模型的视频分类方法,该方法包括:首先对原始视频进行预处理得到一个视频特征序列,在序列的位首添加分类token向量;将特征长序列输入到加速Transformer模型中,最后将输出的分类token转换为待分类视频的分类结果。由于视频数据是一个超长序列,使用原始Transformer模型将耗费巨大的计算成本,因此本发明设计了一种加速Transformer模型,使用泰勒一阶展开公式对Softmax函数进行展开,得到一个逼近于Softmax的线性函数,运用此线性函数进行输入元素之间的注意力权值计算,利用矩阵乘法的结合律将Transformer时间及空间复杂度降低至线性复杂度,从而很大程度上解决了Transformer输入序列长度的限制问题以及训练速度缓慢问题,使得Transformer模型更适用于视频分类任务。
-
公开(公告)号:CN114820739A
公开(公告)日:2022-07-29
申请号:CN202210765686.8
申请日:2022-07-01
Applicant: 浙江工商大学 , 浙江宇视科技有限公司
IPC: G06T7/33 , G06T3/40 , G06T5/10 , G06V10/764 , G06V10/774
Abstract: 本发明公开了一种面向多光谱相机的图像快速配准方法及装置。首先,选定某个光谱波段图像作为参考图像,其余波段图像为待配准图像,对参考图像与待配准图像的鲁棒梯度特征图进行网格分块;然后,选取非平滑网格,用相位相关算法计算非平滑网格的偏移量,用网格偏移量与参数化坐标变换关系构建方程组,求解整幅图像的配准参数初值;最后,将配准参数初值送入到基于归一化总梯度的配准参数优化器中,对配准参数进行细调优化,将细调后的参数应用到待配准图像上,实现两幅不同波段图像之间的精细化快速配准。与同类配准方法相比,本发明方法具有更高的配准精度、更快的配准速度。
-
公开(公告)号:CN114037945A
公开(公告)日:2022-02-11
申请号:CN202111506944.2
申请日:2021-12-10
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于多粒度特征交互的跨模态检索方法,用于实现视频和文本之间的相互检索任务。本发明使用全局视觉语义特征指导局部视觉语义特征来获取更加细粒度的局部信息,随后让全局视觉语义特征和经过增强的局部视觉语义特征进行相互学习融合得到视频级别的特征。将经过学习得到的视频级别特征与文本特征映射到同一个嵌入空间中,在嵌入空间中进行跨模态匹配,从而实现文本和视频之间的跨模态检索。本发明是一种基于神经网络的跨模态检索方法,在性能和复杂度上达到了较优平衡。
-
-
-
-
-
-
-
-
-