-
公开(公告)号:CN115761895A
公开(公告)日:2023-03-07
申请号:CN202211513258.2
申请日:2022-11-29
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于帧序列顺序感知编码的视频动作分割与识别方法,其中,分割方法包括:提取给定视频的特征向量,并对特征向量进行编码,获得给定视频的运动特征;基于给定视频的运动特征,进行编码矩阵学习,获得给定视频的编码矩阵;基于给定视频的编码矩阵,构建亲和度图;基于亲和度图,完成给定视频的动作分割,得到给定视频的动作片段。识别方法包括基于上述的分割方法,将待识别视频分割为若干动作片段;将每个动作片段的特征输入至预训练的分类器中;根据每个动作片段所属类别的概率,分配动作标签。本发明不仅能够充分编码视频的运动特征和帧序列顺序信息,并且能够克服视频中噪声的影响准确分割动作片段并识别其类别。
-
公开(公告)号:CN116456037A
公开(公告)日:2023-07-18
申请号:CN202310715988.9
申请日:2023-06-16
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于扩散模型的生成式图像隐写方法,涉及信息安全技术领域,主要分为载密图片生成和秘密信息提取两部分,载密图片生成的过程为:1、秘密信息加密;2、划分秘密信息子块;3、将每个秘密信息子块映射到隐空间,生成隐向量;4、将隐向量输入到扩散模型中生成载密图片。秘密信息提取的过程为:1、读取载密图片数据并输入到提取网络中以恢复出隐向量;2、提取隐向量中的秘密信息;3、将秘密信息映射成二进制比特流;4、解密得到秘密信息。从而使得本发明在保证高隐写容量的同时,也保证了隐写图片的生成质量和更高的秘密信息提取率。
-
公开(公告)号:CN113688871B
公开(公告)日:2022-07-01
申请号:CN202110844557.3
申请日:2021-07-26
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于Transformer的视频多标签动作识别方法,具体为:对提取的长视频的特征序列进行降维处理得到新的特征序列F,将特征序列F与预设第一权重矩阵W相乘得到特征序列V,将V中每个元素对应的视频帧的时序位置进行编码,得到编码矩阵P;将V和P输入至Transformer编码器得到序列V′,根据V′提取长视频中关键动作的开始帧和结束帧;将预设的序列与P分别作为Transformer解码器的输入;将V′中将开始帧和结束帧以及位于两者之间的元素输入至Transformer解码器Muti‑head Attention层。本发明考虑了标签与标签之间的联系,从而提高了多标签分类的精度。
-
公开(公告)号:CN116456037B
公开(公告)日:2023-08-22
申请号:CN202310715988.9
申请日:2023-06-16
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于扩散模型的生成式图像隐写方法,涉及信息安全技术领域,主要分为载密图片生成和秘密信息提取两部分,载密图片生成的过程为:1、秘密信息加密;2、划分秘密信息子块;3、将每个秘密信息子块映射到隐空间,生成隐向量;4、将隐向量输入到扩散模型中生成载密图片。秘密信息提取的过程为:1、读取载密图片数据并输入到提取网络中以恢复出隐向量;2、提取隐向量中的秘密信息;3、将秘密信息映射成二进制比特流;4、解密得到秘密信息。从而使得本发明在保证高隐写容量的同时,也保证了隐写图片的生成质量和更高的秘密信息提取率。
-
公开(公告)号:CN113688871A
公开(公告)日:2021-11-23
申请号:CN202110844557.3
申请日:2021-07-26
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于Transformer的视频多标签动作识别方法,具体为:对提取的长视频的特征序列进行降维处理得到新的特征序列F,将特征序列F与预设第一权重矩阵W相乘得到特征序列V,将V中每个元素对应的视频帧的时序位置进行编码,得到编码矩阵P;将V和P输入至Transformer编码器得到序列V′,根据V′提取长视频中关键动作的开始帧和结束帧;将预设的序列与P分别作为Transformer解码器的输入;将V′中将开始帧和结束帧以及位于两者之间的元素输入至Transformer解码器Muti‑head Attention层。本发明考虑了标签与标签之间的联系,从而提高了多标签分类的精度。
-
-
-
-