基于属性特征向量和可逆生成模型的零样本图像识别方法

    公开(公告)号:CN111612047A

    公开(公告)日:2020-09-01

    申请号:CN202010355551.5

    申请日:2020-04-29

    Abstract: 本发明公开了一种基于属性特征向量和可逆生成模型的零样本图像识别方法。本发明包括以下步骤:步骤S1:使用已知类别的图像数据集训练可逆生成模型;步骤S2:使用经过训练的可逆生成模型生成未知类别的图像数据;步骤S3:根据生成的未知类别的图像数据训练SVM分类器;步骤S4:使用经过训练的SVM分类器对输入图像进行预测和识别。本发明采用一种全新的可逆生成模型解决零样本图像识别问题,借助多个仿射耦合变换将真实数据分布直接映射到多元高斯分布,训练过程简单且可逆,优化目标明确,避免了其他生成模型存在的训练不稳定性,维度重构损失和优化目标复杂等问题。

    基于稀疏区域提取的目标检测方法及系统

    公开(公告)号:CN119625288B

    公开(公告)日:2025-05-16

    申请号:CN202510155496.8

    申请日:2025-02-12

    Abstract: 本发明公开了一种基于稀疏区域提取的目标检测方法及系统。本发明首先提取待检测图像特征并进行融合增强,得到不同分辨率的增强特征;然后针对高分辨率特征,通过稀疏区域提取模块筛选出特征窗口;接着基于特征窗口生成第一先验框,并通过第一目标检测头模块预测其类别和偏移量;同时针对其余增强特征生成第二先验框,并通过第二目标检测头模块进行预测;最后将所有先验框按偏移量偏移后加入候选锚框集合,通过非极大值抑制得到最终的目标检测框。本发明对高分辨率特征进行了稀疏区域提取,筛选了重点的部分区域进行小尺寸目标的检测,而其余的低分辨率特征则进行正常的全局目标检测,从而在提高小尺寸目标检测准确性的同时提升了检测效率。

    一种基于双目远心镜头的玻璃平面测速方法

    公开(公告)号:CN117110642A

    公开(公告)日:2023-11-24

    申请号:CN202311077473.7

    申请日:2023-08-25

    Abstract: 本发明公开了一种基于双目远心镜头的玻璃平面测速方法,包括如下步骤:S1、在玻璃表面移动的方向上放置本装置,使得镜头垂直于玻璃的侧面;S2、调整镜头距离玻璃侧面的距离;S3、初始化两个相机,设定好对应的采集参数。S4、启动本装置,使得玻璃下边缘依次从上方的镜头和下方的镜头中出现。上方的镜头实时检测玻璃是否进入视野中,若进入视野中则按照固定的时间间隔,上下两个相机分别拍摄两张照片。S5、对拍摄得到的2张照片进行处理和计算,得到玻璃下边缘在图片中的位置,计算两张照片的准确时间间隔。S6、计算得到玻璃的移动距离和时间,得到玻璃移动速度。本发明具有更高的测量精度,且对环境要求更低,能维持长时间的高精度测量。

    一种基于Transformer和错位对齐策略的小样本动作识别方法

    公开(公告)号:CN116503945A

    公开(公告)日:2023-07-28

    申请号:CN202310471308.3

    申请日:2023-04-27

    Abstract: 本发明公开了一种基于Transformer和错位对齐策略的小样本动作识别方法,包括:获取查询集视频和支持集视频;获得对应的第一图像集和第二图像集;对图像集进行采样并裁剪,裁剪后的第一图像集形成第一图像序列,每个裁剪后的第二图像集形成一个第二图像序列,将第一图像序列和一个第二图像序列视为一组;建立动作识别模型,动作识别模型包括依次连接的改进ResNet网络模型、时空特征编码器和多粒度特征对齐模块,并获取每组第一图像序列和第二图像序列对应的多粒度动作概率;采用分类器获取全部多粒度动作概率中概率最高的动作类别作为对应待识别动作类别视频的动作识别结果。该方法能够提升小样本动作视频分类的准确度和效率。

    一种基于Transformer和错位对齐策略的小样本动作识别方法

    公开(公告)号:CN116503945B

    公开(公告)日:2025-04-08

    申请号:CN202310471308.3

    申请日:2023-04-27

    Abstract: 本发明公开了一种基于Transformer和错位对齐策略的小样本动作识别方法,包括:获取查询集视频和支持集视频;获得对应的第一图像集和第二图像集;对图像集进行采样并裁剪,裁剪后的第一图像集形成第一图像序列,每个裁剪后的第二图像集形成一个第二图像序列,将第一图像序列和一个第二图像序列视为一组;建立动作识别模型,动作识别模型包括依次连接的改进ResNet网络模型、时空特征编码器和多粒度特征对齐模块,并获取每组第一图像序列和第二图像序列对应的多粒度动作概率;采用分类器获取全部多粒度动作概率中概率最高的动作类别作为对应待识别动作类别视频的动作识别结果。该方法能够提升小样本动作视频分类的准确度和效率。

Patent Agency Ranking