基于Transformer和去噪扩散模型的鲁棒水印方法

    公开(公告)号:CN115660931A

    公开(公告)日:2023-01-31

    申请号:CN202211357598.0

    申请日:2022-11-01

    Abstract: 本发明公开了基于Transformer和去噪扩散模型的鲁棒水印方法,包括以下步骤:将载体图像与原始水印输入由Transformer组成的水印编码器中,生成嵌入水印的编码图像;将编码图像分三路输入无噪声层、已知噪声层和基于去噪扩散模型的未知噪声层,生成噪声图像;将噪声图像输入由Transformer组成的水印解码器中,得到提取水印;计算损失函数,并采用随机梯度下降方法更新水印编码器和水印解码器的参数;重复以上步骤,直到满足设定的训练次数,水印编码器和水印解码器训练完毕,保留水印编码器和水印解码器分别用于水印的嵌入和提取。

    一种基于文件分割的信息隐藏方法及系统

    公开(公告)号:CN115134142A

    公开(公告)日:2022-09-30

    申请号:CN202210740832.1

    申请日:2022-06-28

    Abstract: 本发明公开了一种基于文件分割的信息隐藏方法及系统,属于数字取证技术领域,包括:获取映射序列、载体文件和秘密信息;根据映射序列的长度将载体文件平均分割,得到文件片段;对文件片段每次扫描预设数量的字节得到字节码,将字节码排列组成文件片段矩阵;对文件片段矩阵中的字节码进行概率统计得到各字节码出现的概率;根据字节码及其出现的概率计算文件信息序列;对映射序列进行预处理使其长度达到秘密信息的长度,得到判定序列,根据判定序列将秘密信息和文件信息序列进行比对生成对比序列,完成信息隐藏;降低寻找载体文件的难度,提高实用性。

    模拟出血模型的虚拟切割方法

    公开(公告)号:CN108597612B

    公开(公告)日:2022-09-23

    申请号:CN201810358659.2

    申请日:2018-04-19

    Abstract: 本发明公开模拟出血模型的虚拟切割方法,该方法能够在不降低变形精度的情况下,通过改进后的网格模型,同时考虑紧度的影响和血小板对出血的影响,加入了张力、粘滞力加速度的计算方法,使出血模拟更加真实。本发明还通过选取不同的核函数加强了出血的实际行为和实时性,提高了粒子相关性质的计算效率。

    一种自适应的非整数步长分数阶微分图像纹理增强方法

    公开(公告)号:CN108564548B

    公开(公告)日:2022-06-24

    申请号:CN201810353017.3

    申请日:2018-04-19

    Abstract: 本发明提供了一种自适应的非整数步长分数阶微分图像纹理增强方法。所述自适应的非整数步长分数阶微分图像纹理增强方法包括如下步骤:一、根据需要将待处理的数字图像分成多个子图像,对每一所述子图像求解灰度共生矩阵,并获得每一所述子图像的图像纹理性质;二、根据每一所述子图像的纹理性质确定所述分数阶微分图像纹理增强算法的步长值采用分数阶微分图像纹理增强算法对每一所述子图像进行增强处理。本发明的有益效果是:所述自适应的非整数步长分数阶微分图像纹理增强方法根据图像局部区域的纹理复杂度确定步长的非整数分数阶微分实现图像增强。

    结合多级特征依赖与多尺度上下文特征的抑郁识别方法

    公开(公告)号:CN114494770A

    公开(公告)日:2022-05-13

    申请号:CN202210035384.5

    申请日:2022-01-12

    Abstract: 本发明公开了一种结合多级特征依赖与多尺度上下文特征的抑郁识别方法,包括:搭建并改进ResNet101,获得C2、C3、C4及C5四个代表不同级别语义信息和细节信息的情感表征;将多级情感表征输入到多层双向门控网络,提取多级特征间的依赖关系;将多级情感表征发送到多尺度自适应上下文模块,提取相应的多尺度上下文特征,通过跨级融合得到各级的多尺度情感表示O3、O4和O5;将C5级情感表征导入卷积注意力模块,获得带有显著情感区域的情感表示D;通过特征融合得到多线索情感特征E,通过分类网络进行抑郁识别。本发明同时结合级内关联与级间关联来获取更深层更全面的情感,并且对噪声具有鲁棒性。

    一种融合几何结构特征图的手语识别方法、系统、装置及存储介质

    公开(公告)号:CN114373221A

    公开(公告)日:2022-04-19

    申请号:CN202111474169.7

    申请日:2021-12-03

    Abstract: 本发明公开了一种融合几何结构特征图的手语识别方法、系统、装置及存储介质,属于手语识别技术领域;包括:获取手语视频,将其帧数和像素大小统一调整;将统一调整后的手语视频输入预建立的预先进行过训练的三维卷积神经网络,提取手语特征;将手语特征输入预建立的预先进行过训练的深度卷积生成对抗网络,生成手语特征图;将手语特征图的像素大小统一调整,根据手语特征图G通道和B通道的手部轨迹信息进行预分类,得到预分类类别;将统一调整后的手语特征图输入预建立的VGG16网络,输出特征向量,特征向量中值最高的元素在预分类类别对应的手语词汇库中对应的手语词汇为识别结果;提高手语识别的准确度和整体分类识别效率。

    一种基于深度学习的道路上方文字交通标志识别方法及装置

    公开(公告)号:CN110348396B

    公开(公告)日:2022-02-11

    申请号:CN201910635202.6

    申请日:2019-07-15

    Abstract: 本发明公开了一种基于深度学习的道路上方文字交通标志识别方法及装置,所述方法包括如下步骤:先采集道路上方文字交通标志,并对图像进行预处理;然后基于源域已训练好的网络参数迁移到Faster‑R‑CNN网络上作为文字交通标志检测网络的初始网络参数,基于目标域样本对网络参数进行微调获得最终的网络参数;对RGB颜色空间的交通标志图像进行HSV颜色空间转换,并将转换后的HSV颜色空间图像也作为Faster‑R‑CNN网络的输入;最后利用EAST文本文字检测网络模型和ELM分类器的识别模型对检测到的道路上方文字交通标志进行识别分类,并输出检测结果。实现了在自然场景下提取出交通标志中的有效信息。

    一种基于二维图像重建三维网格模型的方法及装置

    公开(公告)号:CN113808006A

    公开(公告)日:2021-12-17

    申请号:CN202111019790.4

    申请日:2021-09-01

    Abstract: 本发明公开了一种基于二维图像重建三维网格模型的方法及装置,所述方法包括:输入二维图像到ResNet50中,通过ResNet50的Stage1,Stage2和Stage3提取图像二维信息,对这些信息进行特征连接;通过相机参数计算输入图像平面的2D投影,然后通过双线性插值法得到感知特征;通过隐式曲面算法生成初始椭球,从输入二维图像中汇集图像特征,结合图像特征和感知特征进行网格变形;通过上采样细化网格模型;利用损失函数促使系统生成粗略的三维模型;进行二次变换、三次变换生成较精细三维模型和精细的三维模型。本发明通过初始椭球进行三次变换,能够学习网格的多尺度和上下文信息,生成更加精细的三维模型。

    一种单图像引导的三维表面重建方法及装置

    公开(公告)号:CN113610711A

    公开(公告)日:2021-11-05

    申请号:CN202110879676.2

    申请日:2021-08-02

    Abstract: 本发明公开了一种单图像引导的三维表面重建方法及装置,首先,建立一个预定义的顶点分布均匀的椭球体网格;其次,采用轻量级网络AlexNet的主体架构提取输入图像特征:将AlexNet后三个卷积池化层生成的特征图像拼接,采用双线性插值法,寻找到原图像投影点在各个特征图像上的特征点;提取特征点邻近四个像素的图像特征向量并串联;然后,构建基于三维图卷积神经网络的网格变形模块,将预定义的椭球体网格变形为与二维图像对应的三维模型;最后,增加网格顶点数量,优化表面细节,并通过最小化三维损失函数调整参数矩阵,生成三维网格模型。本发明生成了高精度的三维网格表面模型,能够预测出更丰富的三维表面细节。

    基于噪声分类与MLS的点云数据泊松曲面重建方法

    公开(公告)号:CN108520550B

    公开(公告)日:2021-09-24

    申请号:CN201810314822.5

    申请日:2018-04-10

    Abstract: 本发明公开了一种基于噪声分类与MLS的点云数据泊松曲面重建方法,其对噪声点分类处理,并引入到点云数据等值面的向量场估计中进行相应光顺处理,形成新的样本点,利用移动最小二乘法(moving least squares,MLS)精确计算与修正点云数据法向量,再进行表面重建,形成细节丰富的三维曲面,在视觉上较好逼近实际模型。该方法能在不降低原重建精度情况下,通过更准确法向信息辅助,有效实现光顺处理和孔洞修复,曲面重建质量提升,在一定程度上解决了传统三维重建技术中非封闭曲面问题。

Patent Agency Ranking