基于Transformer的视频多标签动作识别方法

    公开(公告)号:CN113688871B

    公开(公告)日:2022-07-01

    申请号:CN202110844557.3

    申请日:2021-07-26

    Abstract: 本发明公开了一种基于Transformer的视频多标签动作识别方法,具体为:对提取的长视频的特征序列进行降维处理得到新的特征序列F,将特征序列F与预设第一权重矩阵W相乘得到特征序列V,将V中每个元素对应的视频帧的时序位置进行编码,得到编码矩阵P;将V和P输入至Transformer编码器得到序列V′,根据V′提取长视频中关键动作的开始帧和结束帧;将预设的序列与P分别作为Transformer解码器的输入;将V′中将开始帧和结束帧以及位于两者之间的元素输入至Transformer解码器Muti‑head Attention层。本发明考虑了标签与标签之间的联系,从而提高了多标签分类的精度。

    基于残差域深度学习特征的图像拷贝检测方法

    公开(公告)号:CN112926598B

    公开(公告)日:2021-12-07

    申请号:CN202110249157.8

    申请日:2021-03-08

    Abstract: 本发明公开了一种基于残差域深度学习特征的图像拷贝检测方法,具体为:提取原始图像和待检测图像的SIFT特征;将两幅图像的SIFT特征进行匹配得到SIFT匹配对;然后将错误的SIFT匹配对过滤,保留其中3对SIFT匹配对,再计算出两幅图像之间的仿射变换矩阵;使用仿射变换矩阵对原始图像进行仿射变换;然后分别计算出变换后原始图像上的重叠区域以及待检测图像上的重叠区域,将两个重叠区域逐像素做差值运算,得到残差图像;将残差图像送入基于多层特征融合的CNN中,从而判断出两幅图像是否为拷贝关系。本发明在保持检测效率的同时,显著地提高了检测精度,且对于视觉上高度相似的拷贝图像和相似图像具有很强的区分能力。

    一种基于时空视觉词组和分层匹配的视频拷贝检测方法

    公开(公告)号:CN112182287B

    公开(公告)日:2021-06-08

    申请号:CN202010945969.1

    申请日:2020-09-10

    Abstract: 本发明公开了一种基于时空视觉词组和分层匹配的视频拷贝检测方法,包括以下步骤:1)视频帧采样;2)SURF特征提取;3)空间视觉词生成;4)时间视觉词生成;5)时空视觉词组生成;6)多级倒排索引结构构建;7)特征分层匹配与特征相似度融合计算;通过以上步骤得到查询视频和库视频之间的相似度,从而判定库视频是否为查询视频的拷贝版本。本发明首先生成时空视觉词组,然后将生成的时空视觉词组构建多级倒排索引以便于特征匹配,在线检测阶段使用了特征分层匹配与相似度融合计算策略,本发明的视频拷贝检测方法,在保证拷贝检测效率的同时,大大提高了检测的准确度。

    一种基于神经网络的鲁棒数字水印嵌入、提取方法

    公开(公告)号:CN114119330A

    公开(公告)日:2022-03-01

    申请号:CN202111306170.9

    申请日:2021-11-05

    Abstract: 本发明公开了一种基于神经网络的鲁棒数字水印嵌入、提取方法,具体为:步骤1:将水印图像输入至水印嵌入网络中的水印图像处理网络,将载体图像输入至水印嵌入网络中的载体图像处理网络,步骤2:对水印图像处理网络中第i层网络层的输出wi的大小进行调整;步骤3:将wi与载体图像处理网络中第i层网络层的输出ci级联,将级联后的结果输入至载体图像处理网络中第i+1层;步骤4:对载体图像处理网络最后一层的输出进行卷积操作,得到含密图像c*;将含密图像c*输入至提取网络,得到带有水印的图像w*。本发明不仅不可见性较好,而且能够有效抵抗多种常见的水印攻击,具有较好的鲁棒性。

    基于Transformer的视频多标签动作识别方法

    公开(公告)号:CN113688871A

    公开(公告)日:2021-11-23

    申请号:CN202110844557.3

    申请日:2021-07-26

    Abstract: 本发明公开了一种基于Transformer的视频多标签动作识别方法,具体为:对提取的长视频的特征序列进行降维处理得到新的特征序列F,将特征序列F与预设第一权重矩阵W相乘得到特征序列V,将V中每个元素对应的视频帧的时序位置进行编码,得到编码矩阵P;将V和P输入至Transformer编码器得到序列V′,根据V′提取长视频中关键动作的开始帧和结束帧;将预设的序列与P分别作为Transformer解码器的输入;将V′中将开始帧和结束帧以及位于两者之间的元素输入至Transformer解码器Muti‑head Attention层。本发明考虑了标签与标签之间的联系,从而提高了多标签分类的精度。

    基于残差域深度学习特征的图像拷贝检测方法

    公开(公告)号:CN112926598A

    公开(公告)日:2021-06-08

    申请号:CN202110249157.8

    申请日:2021-03-08

    Abstract: 本发明公开了一种基于残差域深度学习特征的图像拷贝检测方法,具体为:提取原始图像和待检测图像的SIFT特征;将两幅图像的SIFT特征进行匹配得到SIFT匹配对;然后将错误的SIFT匹配对过滤,保留其中3对SIFT匹配对,再计算出两幅图像之间的仿射变换矩阵;使用仿射变换矩阵对原始图像进行仿射变换;然后分别计算出变换后原始图像上的重叠区域以及待检测图像上的重叠区域,将两个重叠区域逐像素做差值运算,得到残差图像;将残差图像送入基于多层特征融合的CNN中,从而判断出两幅图像是否为拷贝关系。本发明在保持检测效率的同时,显著地提高了检测精度,且对于视觉上高度相似的拷贝图像和相似图像具有很强的区分能力。

    基于混编技术的阈值法过冷水区域识别方法

    公开(公告)号:CN110058208A

    公开(公告)日:2019-07-26

    申请号:CN201910326708.9

    申请日:2019-04-23

    Abstract: 本发明公开一种基于混编技术的阈值法过冷水区域识别方法,包括1)通过Matlab读取探空仪数据,再选取其中温度为-40℃~0℃的区域,并将其定义为过冷水可能存在区域;2)通过Matlab读取激光雷达数据,在步骤1中过冷水可能存在区域内选取满足激光雷达后向散射系数大于5×10-51/(m·sr)的区域,并将其定义为过冷水层区域;3)通过Matlab读取毫米波雷达,在步骤2过冷水层区域内选取同时满足毫米波雷达谱宽大于0.4m/s以及线性退极化比LDR小于-15dBZ的区域,并将其定义为过冷水区域。本发明的识别方法,过程简洁易懂,适用于无大的湍流以及风切变时的情况;本发明采用的混编技术提高识别效率,其友好的交互界面为用户提供了更好的使用体验。

    一种基于神经网络的鲁棒数字水印嵌入、提取方法

    公开(公告)号:CN114119330B

    公开(公告)日:2024-07-23

    申请号:CN202111306170.9

    申请日:2021-11-05

    Abstract: 本发明公开了一种基于神经网络的鲁棒数字水印嵌入、提取方法,具体为:步骤1:将水印图像输入至水印嵌入网络中的水印图像处理网络,将载体图像输入至水印嵌入网络中的载体图像处理网络,步骤2:对水印图像处理网络中第i层网络层的输出wi的大小进行调整;步骤3:将wi与载体图像处理网络中第i层网络层的输出ci级联,将级联后的结果输入至载体图像处理网络中第i+1层;步骤4:对载体图像处理网络最后一层的输出进行卷积操作,得到含密图像c*;将含密图像c*输入至提取网络,得到带有水印的图像w*。本发明不仅不可见性较好,而且能够有效抵抗多种常见的水印攻击,具有较好的鲁棒性。

    一种基于轮廓自动生成的构造式信息隐藏方法

    公开(公告)号:CN113610878A

    公开(公告)日:2021-11-05

    申请号:CN202110800700.9

    申请日:2021-07-15

    Abstract: 本发明公开了一种基于轮廓自动生成的构造式信息隐藏方法,具体为:将长度为L的秘密信息的二值序列S切分成n段长度均为l的二值序列;步骤2:构建目标轮廓图像;步骤3:构建轮廓‑图像可逆变换模型;步骤4:将目标轮廓图像输入至训练好的轮廓‑图像可逆变换模型中,生成模型根据目标轮廓图像生成含密图像,所述提取模型用于提取含密图像的轮廓,以实现将秘密信息的二值序列隐藏在提取模型提取的轮廓中。本发明生成含密图像质量较高,视觉效果更好。

Patent Agency Ranking