-
公开(公告)号:CN118052706A
公开(公告)日:2024-05-17
申请号:CN202410397562.8
申请日:2024-04-03
Applicant: 成都信息工程大学
IPC: G06T3/04 , G06V10/80 , G06V10/774 , G06V10/82 , G06V10/764
Abstract: 发明提出融合交互注意力机制的任意风格迁移方法和装置,构建的迁移网络主要包括:基于Transformer编码器和可逆神经网络的联合特征编码模块、融合通道和空间的交互注意力的风格转换模块和空间感知插值模块,首先利用联合特征编码器中的Transformer编码器提取内容图像和风格图像的全局特征,利用可逆神经网络提取内容图像和风格图像的细节特征,然后将内容图像和风格图像的全局和细节的特征分别送进通道和空间的交互注意力中进行融合,得到全局风格化的特征和细节风格化特征;最后,使用空间感知插值模块进行自适应插值融合。本发明方法捕捉序列数据中的长距离依赖关系和局部模式,具有较强的泛化能力,融合空间和通道细节信息,更好地维持了图像原本的结构。
-
公开(公告)号:CN110633734B
公开(公告)日:2022-08-19
申请号:CN201910776915.4
申请日:2019-08-22
Applicant: 成都信息工程大学
IPC: G06K9/62 , G06V10/764 , G06V10/774 , G06V10/762
Abstract: 本发明公开了一种基于图论相关理论进行异常检测的方法,包括该方法具体包括以下步骤:第一步,将原始数据集进行聚类操作,将数据集分割成不同的簇;第二步,计算出原始数据集的均值密度,将原数据集均值密度作为阈值与簇密度比较对数据集进行精简;第三步,对数据集进行特征提取和空间距离计算并对结果进行数据化操作第四步,将有效检测的数据簇的所有数据点按计算出来的权重值分配构建无向连通图;第五步,采用弗洛伊德算法查找相应簇的最短路径。在对于数据集的预处理上,本发明采取了二次精简数据集的办法,以不同的基准信息来对数据集进行降维操作,可以有效地减少大量无用数据集,极大程度的减少了异常检测过程的时间复杂度和空间复杂度。
-
公开(公告)号:CN109409508B
公开(公告)日:2022-03-15
申请号:CN201811310962.1
申请日:2018-11-06
Applicant: 成都信息工程大学
Abstract: 本发明属于图像重建技术领域,公开了一种基于生成对抗网络使用感知损失解决模型崩塌的方法,利用随机向量z生成与实际数据分布相似的图像,在训练的过程中采用感知损失将z和真实数据映射到特征空间中来提取更高层次的特征,并结合对抗损失来鼓励生成网络产生与实际图像相似的图像样本;最后,使得鉴别器不能判断这是一个虚假图像。本发明针对已有网络采用较小的数据集解决了模型崩塌问题,VGG‑GAN在两个小场景数据集上进行评价;实验结果表明,用VGG‑GAN方法生成的图像质量优于现有方法。
-
公开(公告)号:CN109063710A
公开(公告)日:2018-12-21
申请号:CN201810907208.X
申请日:2018-08-09
Applicant: 成都信息工程大学
CPC classification number: G06K9/342 , G06K2209/05 , G06N3/0454
Abstract: 本发明涉及图像分割领域中的鼻咽部肿瘤图像分割技术,具体的说是一种基于多尺度特征金字塔的3D CNN鼻咽癌分割方法。针对训练样本,需要由有经验的放射科肿瘤医师对若干鼻咽癌病例进行标注,使用整个三维MRI图像建立数据集,并对数据集进行一定的预处理,然后用网络对训练数据集进行训练,取得高精度的分割模型。对于新的病例,可以用该分割模型分割其MRI图像。相对传统的方法,除了训练阶段需要人工标注外,其余部分均可实现自动处理,大大降低对于有经验医师的需求,且与五种主流网络对比能取得较高的精度。
-
公开(公告)号:CN119785193B
公开(公告)日:2025-05-20
申请号:CN202510282109.7
申请日:2025-03-11
Applicant: 成都信息工程大学
IPC: G06V20/00 , G06V10/774 , G06V40/16 , G06V10/80 , G06V10/10 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了提出一种基于空频特征集成和动态边缘优化的深度伪造检测方法,通过空间‑频率特征集成模块和真实性感知边界损失函数显著提升了伪造内容的检测准确性和鲁棒性。本发明有效地结合了图像的空间域和频率域特征,使得模型能够更全面地识别伪造图像中的细微差别。此外,真实性感知边界损失函数通过动态调整边界,成功应对了类别不平衡问题,尤其在真实图像样本稀缺的情况下,显著提高了分类性能。本发明在多个具有挑战性的数据集上进行的实验验证了方法的有效性。
-
公开(公告)号:CN112686822B
公开(公告)日:2021-09-07
申请号:CN202011607204.3
申请日:2020-12-30
Applicant: 成都信息工程大学
Abstract: 本发明涉及一种基于堆叠生成对抗网络的图像补全方法,网络结构主要由三个堆叠的生成器网络层组成。首先将蒙版图像裁剪成多个图像块,以便网络就可以提取出不同图像块的特征;然后,本发明将补全的多图像块结果放入下一层的生成器中,以进一步补全图像;最后,将不同块的补全结果应用于一整块掩模图像上,得到最终的补全输出。从粗到细的补全作业,充分利用卷积神经网络提取的高层语义信息。并且通过图像块鉴别器来区分生成图像图像和原始图像的真假。实验结果表明,本发明方法能够对具有不规则掩模的图像生成高质量的补全结果,补全的结果更逼近原始图像。
-
公开(公告)号:CN112365464B
公开(公告)日:2021-08-10
申请号:CN202011242653.2
申请日:2020-11-09
Applicant: 成都信息工程大学
Abstract: 本发明公开了一种基于GAN的医学图像病变区域弱监督定位方法。该方法具体包括以下步骤:收集数据并制作数据集,将每一次CT扫描的成像文件重采样成固定分辨率并保存为NPY格式并保存对应的标签信息;构建基于卷积神经网络的分类器,使用上述的数据集对分类器进行预训练,学习高级语义特征;构建基于生成对抗网络的框架,使用生成器学习正常人与病人的检查结果的影像学差异,使用判别器和预训练的分类器来强化生成器的学习效果并使生成器能够捕捉到病人的病变区域;本发明可以自动学习病人与正常人之间的差别,实现了无需对病变区域进行标注而能有效的对病变的区域进行定位,提供辅助诊断信息。
-
公开(公告)号:CN112365464A
公开(公告)日:2021-02-12
申请号:CN202011242653.2
申请日:2020-11-09
Applicant: 成都信息工程大学
Abstract: 本发明公开了一种基于GAN的医学图像病变区域弱监督定位方法。该方法具体包括以下步骤:收集数据并制作数据集,将每一次CT扫描的成像文件重采样成固定分辨率并保存为NPY格式并保存对应的标签信息;构建基于卷积神经网络的分类器,使用上述的数据集对分类器进行预训练,学习高级语义特征;构建基于生成对抗网络的框架,使用生成器学习正常人与病人的检查结果的影像学差异,使用判别器和预训练的分类器来强化生成器的学习效果并使生成器能够捕捉到病人的病变区域;本发明可以自动学习病人与正常人之间的差别,实现了无需对病变区域进行标注而能有效的对病变的区域进行定位,提供辅助诊断信息。
-
公开(公告)号:CN108962267B
公开(公告)日:2019-11-15
申请号:CN201810742980.0
申请日:2018-07-09
Applicant: 成都信息工程大学
IPC: G10L19/018
Abstract: 本发明涉及一种基于哈希特征的加密语音内容认证方法,其包括:输入原始语音后,通过Logistic映射和流密码RC4对原始语音进行加密以生成加密语音,对加密语音进行分帧并对每帧加密语音执行整数小波变换和离散余弦变换,通过比较低频DCT系数的均值和方差来计算哈希特征,利用差分扩展将哈希特征作为水印嵌入到IWT的细节系数的高位比特中;然后对IWT近似系数和含哈希特征的细节系数执行逆IWT变换来获得含水印的加密语音,从含水印的加密语音中提取哈希特征与重构的哈希特征进行对比来对加密语音进行内容认证。本发明提高了云计算中的语音内容认证的鲁棒性,可以准确定位篡改语音帧,在实际应用中适用范围更广。
-
公开(公告)号:CN110427928A
公开(公告)日:2019-11-08
申请号:CN201910652768.X
申请日:2019-07-19
Applicant: 成都信息工程大学
Abstract: 本发明公开了一种基于深卷积神经网络的自然场景图像文本检测方法,该方法具体包括以下步骤:制作数据集,将所有图片按照VOC格式制作成数据集,文件夹Annotation用于存放xml文件,每一个xml文件对应一张图像,并且每个xml文件中存放的是标记的各个目标的位置和类别信息。将自然图像通过ResNet网络从底层像素点获取更多的高级特征,然后利用BLSTM层提取字符序列的上下文特征,找到检测文本的边界框,有效地提高了文本检测的效果。本发明的有益效果:本发明使用自动学习,结合上下文特征替换人工定义的特征;本发明避免字符分割问题,实现端到端的无约束字符检测。提高了检测效率和精度,实现了对自然场景图像的文本检测。
-
-
-
-
-
-
-
-
-