基于Transformer的视频多注意力机制的时序动作检测方法

    公开(公告)号:CN117037039A

    公开(公告)日:2023-11-10

    申请号:CN202311045216.5

    申请日:2023-08-18

    Abstract: 本发明公开了一种基于Transformer的视频多注意力机制的时序动作检测方法,包括如下步骤:S1、获取待检测的视频图像,将视频帧经过预训练的视频模型提取初始视频特征;S2、将所述视频特征输入到一个浅层卷积网络进行投影得到视频片段特征嵌入;S3、将所有特征嵌入输入到局部自注意力的Transformer模块输出其局部样式特征;S4、将所述的局部样式特征输入到全局自注意力的Transformer模块对长期依赖进行建模;S5、最终每个Transformer层的输出构建为特征金字塔结构;S6、将特征金字塔的每一层输入到检测头中,检测头中包括回归头和分类头,分别输出最终动作的时序边界和类别。该方法能够提升动作检测的准确率,同时效率比传统的Transformer模型更高。

    一种基于矩形信息的单目视觉平面测距方法

    公开(公告)号:CN116678370A

    公开(公告)日:2023-09-01

    申请号:CN202310663492.1

    申请日:2023-06-06

    Abstract: 本发明公开了一种基于矩形信息的单目视觉平面测距方法,包括如下步骤:在玻璃移动所在的待测平面上放置一已知的矩形物体,通过拍摄相机获得图片,并取得拍摄相机的参数;取得已知矩形四个顶点在图片上的坐标以及矩形的实际对角长;根据获取的矩形顶点坐标、对角长以及拍摄相机的参数,得到预设参数并保存;读取玻璃上第一待测点在图片上的坐标,并根据得到的预设参数得到第一待测点对应的向量;读取玻璃上第二待测点在图片上的坐标,并根据得到的预设参数得到第二待测点对应的向量,可得到两个待测点之间的真实距离。该方法相比传统的单目视觉计算方案具有更少的计算量,解决透明物体难测的问题,同时保证足够的精度。

    基于深度学习和混沌的椭圆曲线图像加解密系统及方法

    公开(公告)号:CN116582241A

    公开(公告)日:2023-08-11

    申请号:CN202310321412.4

    申请日:2023-03-29

    Abstract: 本发明涉及椭圆曲线图像加解密系统及方法,系统中,第一反射镜与第一分束器相连,第一分束器与主激光器、第二分束器相连,第二分束器连接第一至四从激光器,该四从激光器分别接第三至六分束器,第三至六分束器分别接第二至五反射镜及第一至四光电检测器,第一至四光电检测器分别接第一至四电混沌序列生成器;第一、二电混沌序列生成器连接至混沌置乱与椭圆曲线加密器,加密器连接异或加密器,随机数产生器连接深度学习优化器,异或加密器连接电光转换器;哈希序列生成器与偏置电流控制器连接,控制器与主激光器连接;第三、四电混沌序列生成器与椭圆曲线解密器相连,解密器与异或解密器连接,解密器通过第五光电检测器与电光转换器相连。

Patent Agency Ranking