融合交互注意力机制的任意风格迁移方法和装置

    公开(公告)号:CN118052706A

    公开(公告)日:2024-05-17

    申请号:CN202410397562.8

    申请日:2024-04-03

    Abstract: 发明提出融合交互注意力机制的任意风格迁移方法和装置,构建的迁移网络主要包括:基于Transformer编码器和可逆神经网络的联合特征编码模块、融合通道和空间的交互注意力的风格转换模块和空间感知插值模块,首先利用联合特征编码器中的Transformer编码器提取内容图像和风格图像的全局特征,利用可逆神经网络提取内容图像和风格图像的细节特征,然后将内容图像和风格图像的全局和细节的特征分别送进通道和空间的交互注意力中进行融合,得到全局风格化的特征和细节风格化特征;最后,使用空间感知插值模块进行自适应插值融合。本发明方法捕捉序列数据中的长距离依赖关系和局部模式,具有较强的泛化能力,融合空间和通道细节信息,更好地维持了图像原本的结构。

    一种基于图论相关理论进行异常检测的方法

    公开(公告)号:CN110633734B

    公开(公告)日:2022-08-19

    申请号:CN201910776915.4

    申请日:2019-08-22

    Abstract: 本发明公开了一种基于图论相关理论进行异常检测的方法,包括该方法具体包括以下步骤:第一步,将原始数据集进行聚类操作,将数据集分割成不同的簇;第二步,计算出原始数据集的均值密度,将原数据集均值密度作为阈值与簇密度比较对数据集进行精简;第三步,对数据集进行特征提取和空间距离计算并对结果进行数据化操作第四步,将有效检测的数据簇的所有数据点按计算出来的权重值分配构建无向连通图;第五步,采用弗洛伊德算法查找相应簇的最短路径。在对于数据集的预处理上,本发明采取了二次精简数据集的办法,以不同的基准信息来对数据集进行降维操作,可以有效地减少大量无用数据集,极大程度的减少了异常检测过程的时间复杂度和空间复杂度。

    一种基于堆叠生成对抗网络的图像补全方法

    公开(公告)号:CN112686822B

    公开(公告)日:2021-09-07

    申请号:CN202011607204.3

    申请日:2020-12-30

    Abstract: 本发明涉及一种基于堆叠生成对抗网络的图像补全方法,网络结构主要由三个堆叠的生成器网络层组成。首先将蒙版图像裁剪成多个图像块,以便网络就可以提取出不同图像块的特征;然后,本发明将补全的多图像块结果放入下一层的生成器中,以进一步补全图像;最后,将不同块的补全结果应用于一整块掩模图像上,得到最终的补全输出。从粗到细的补全作业,充分利用卷积神经网络提取的高层语义信息。并且通过图像块鉴别器来区分生成图像图像和原始图像的真假。实验结果表明,本发明方法能够对具有不规则掩模的图像生成高质量的补全结果,补全的结果更逼近原始图像。

    一种基于GAN的医学图像病变区域弱监督定位方法

    公开(公告)号:CN112365464B

    公开(公告)日:2021-08-10

    申请号:CN202011242653.2

    申请日:2020-11-09

    Abstract: 本发明公开了一种基于GAN的医学图像病变区域弱监督定位方法。该方法具体包括以下步骤:收集数据并制作数据集,将每一次CT扫描的成像文件重采样成固定分辨率并保存为NPY格式并保存对应的标签信息;构建基于卷积神经网络的分类器,使用上述的数据集对分类器进行预训练,学习高级语义特征;构建基于生成对抗网络的框架,使用生成器学习正常人与病人的检查结果的影像学差异,使用判别器和预训练的分类器来强化生成器的学习效果并使生成器能够捕捉到病人的病变区域;本发明可以自动学习病人与正常人之间的差别,实现了无需对病变区域进行标注而能有效的对病变的区域进行定位,提供辅助诊断信息。

    一种基于GAN的医学图像病变区域弱监督定位方法

    公开(公告)号:CN112365464A

    公开(公告)日:2021-02-12

    申请号:CN202011242653.2

    申请日:2020-11-09

    Abstract: 本发明公开了一种基于GAN的医学图像病变区域弱监督定位方法。该方法具体包括以下步骤:收集数据并制作数据集,将每一次CT扫描的成像文件重采样成固定分辨率并保存为NPY格式并保存对应的标签信息;构建基于卷积神经网络的分类器,使用上述的数据集对分类器进行预训练,学习高级语义特征;构建基于生成对抗网络的框架,使用生成器学习正常人与病人的检查结果的影像学差异,使用判别器和预训练的分类器来强化生成器的学习效果并使生成器能够捕捉到病人的病变区域;本发明可以自动学习病人与正常人之间的差别,实现了无需对病变区域进行标注而能有效的对病变的区域进行定位,提供辅助诊断信息。

    一种基于哈希特征的加密语音内容认证方法

    公开(公告)号:CN108962267B

    公开(公告)日:2019-11-15

    申请号:CN201810742980.0

    申请日:2018-07-09

    Abstract: 本发明涉及一种基于哈希特征的加密语音内容认证方法,其包括:输入原始语音后,通过Logistic映射和流密码RC4对原始语音进行加密以生成加密语音,对加密语音进行分帧并对每帧加密语音执行整数小波变换和离散余弦变换,通过比较低频DCT系数的均值和方差来计算哈希特征,利用差分扩展将哈希特征作为水印嵌入到IWT的细节系数的高位比特中;然后对IWT近似系数和含哈希特征的细节系数执行逆IWT变换来获得含水印的加密语音,从含水印的加密语音中提取哈希特征与重构的哈希特征进行对比来对加密语音进行内容认证。本发明提高了云计算中的语音内容认证的鲁棒性,可以准确定位篡改语音帧,在实际应用中适用范围更广。

    一种基于深卷积神经网络的自然场景图像文本检测方法

    公开(公告)号:CN110427928A

    公开(公告)日:2019-11-08

    申请号:CN201910652768.X

    申请日:2019-07-19

    Abstract: 本发明公开了一种基于深卷积神经网络的自然场景图像文本检测方法,该方法具体包括以下步骤:制作数据集,将所有图片按照VOC格式制作成数据集,文件夹Annotation用于存放xml文件,每一个xml文件对应一张图像,并且每个xml文件中存放的是标记的各个目标的位置和类别信息。将自然图像通过ResNet网络从底层像素点获取更多的高级特征,然后利用BLSTM层提取字符序列的上下文特征,找到检测文本的边界框,有效地提高了文本检测的效果。本发明的有益效果:本发明使用自动学习,结合上下文特征替换人工定义的特征;本发明避免字符分割问题,实现端到端的无约束字符检测。提高了检测效率和精度,实现了对自然场景图像的文本检测。

Patent Agency Ranking