一种基于注意力U形卷积网络的异常检测方法

    公开(公告)号:CN118674980B

    公开(公告)日:2025-01-21

    申请号:CN202410728872.3

    申请日:2024-06-06

    Abstract: 本发明公开了一种基于注意力U形卷积网络的异常检测方法,涉及异常检测方法,包括以下步骤:S1:进行全局和局部采样,全局采样将整张图像的patch作为模型的输入,局部采样将一张图像上的patch作为模型的输入;S2:构建模型:模型包括基础U‑Net和三个嵌入模块;S3:模型嵌入:将模型嵌入到EfficientAD方法中,将原来的自编码器替换为注意力U‑Net,形成整体的网络架构;S4:模型训练:针对不同逻辑异常采用不同的旋转训练策略,将训练的图像输入网络进行训练,生成异常检测模型并保存;S5:检测结果:输入一批测试图像,利用训练好的异常检测模型进行推理,返回检测和定位结果。本发明使用U‑Net重构后得到的异常图轮廓更加分明,得到的定位结果更精细。

    基于解耦分类器和注意力特征对齐的小样本目标检测方法

    公开(公告)号:CN118674913A

    公开(公告)日:2024-09-20

    申请号:CN202410729813.8

    申请日:2024-06-06

    Abstract: 本发明公开了基于解耦分类器和注意力特征对齐的小样本目标检测方法,涉及目标检测领域,包括以下步骤:S1、数据集划分,将数据集的类别划分为基类和新类两个部分;S2、构建网络结构,通过对Faster R‑CNN的扩展,将标准分类器Faster R‑CNN解耦为两个独立的组件在R‑CNN的分类分支添加了校准网络CaliNet,解决了度量时特征不对齐的问题;在主干网络后面插入两个梯度解耦层GDL模块,实现在Faster R‑CNN不同组件之间的高效解耦;S3、使用基类数据对模型进行预训练;S4、使用新类数据对步骤S3中预训练之后的模型进行微调;S5、输入待检测的图像,利用经过步骤S4微调后的预训练模型进行推理,输出目标检测结果。本发明能更有效地执行小样本目标检测任务。

    一种文本图像合成和实例化权重的迁移学习方法

    公开(公告)号:CN116229442A

    公开(公告)日:2023-06-06

    申请号:CN202310002512.0

    申请日:2023-01-03

    Abstract: 本发明提供了一种文本图像合成和实例化权重的迁移学习方法,通过一系列合成策略以生成适合真实文本图像的合成数据,在长度和字符上提供两种文本选择方法,解决了合成数据集文本分布的偏差;通过提供文本合成策略,使合成的文本图像能够更加贴近现实世界图像;通过提出实例化权重的方法连接合成样本不同域的分布,并学习马氏距离,减少了合成样本和真实样本间差异,实现了生成困难场景下STR的合成数据的功能,解决了文本框图像中文本外观的逼真性和多样性,缓解了来自真实世界的注释文本图像的缺乏。本发明还提出了多种渲染策略,以合成真实的合成数据;针对合成数据迁移间差异问题提出了基于实例化的迁移方法训练识别模型。

    一种用于密集小目标的高分辨率图像的数据增强方法

    公开(公告)号:CN112990263B

    公开(公告)日:2022-12-06

    申请号:CN202110170578.1

    申请日:2021-02-08

    Abstract: 本发明提供了一种用于密集小目标的高分辨率图像的数据增强方法,通过裁剪高分辨率图像,裁剪成一定数量的适合训练网络的小尺寸图像,再进一步融合小尺寸图像得到特征信息丰富,目标表达更强的融合图,最后和裁剪后的小尺寸图合并,组合成新的数据集,提升了对小且密集目标的检测的准确度和可靠性,扩充了数据集以避免过拟合。本发明提出的数据增强方法优于其他最新的方法,能获得更多高质量小尺寸图像,从而实现高精准的对小且密集分布目标的检测。

    基于空间注意力和分组卷积的行为识别方法及系统

    公开(公告)号:CN114783053A

    公开(公告)日:2022-07-22

    申请号:CN202210300414.0

    申请日:2022-03-24

    Abstract: 本发明公开了一种基于空间注意力和分组卷积的行为识别方法及系统,该方法包括:稀疏采样:将输入的视频切帧后进行稀疏采样;构建网络结构,网络结构包括时空激励模块和运动激励模块两个分支:对于时空激励模块来说,首先将基于时序上的分组卷积加入到模块中,用于融合时序上的信息并且降低网络参数量;然后将空间注意力加入到模块中,使图像中较为重要的特征得到更好的提取;对于运动激励模块来说,使用多帧之间的差值来代替光流信息对运动特征进行建模;网络结构嵌入:利用网络结构替换resnet‑50中的残差块,得到行为识别模型;最后训练模型并利用模型进行行为识别。本发明所提出的行为识别方法优于其他的行为识别算法,能更有效地执行行为识别任务。

    一种阅读交互装置、方法、计算机设备和阅读笔

    公开(公告)号:CN114611530A

    公开(公告)日:2022-06-10

    申请号:CN202210162374.8

    申请日:2022-02-22

    Abstract: 本申请涉及一种阅读交互装置、方法、计算机设备和阅读笔,属于图像处理技术领域。装置包括图像采集模块和雾端连接模块;图像采集模块,用于获取包括目标文字区域的图像;雾端连接模块,用于和外接雾端建立连接,通过外接雾端中的学习软件对包括目标文字区域的图像进行相应的处理;其中,外接雾端为存储有学习软件的平台,学习软件为基于自然语言处理技术的算法模型。本申请通过与外接雾端建立连接,可以利用外接雾端中的学习软件对获取的包括目标文字区域的图像进行相应的处理,不占用阅读交互装置自身的资源。学习软件为基于自然语言处理技术的算法模型,可具备不同的处理方式,使得本申请中阅读交互装置的应用场景更加丰富,用户体验感更好。

    面向跨语言描述的对抗性数据增强方法、系统及存储介质

    公开(公告)号:CN112819091A

    公开(公告)日:2021-05-18

    申请号:CN202110198513.8

    申请日:2021-02-22

    Inventor: 肖宇 鲁统伟

    Abstract: 本发明公开了一种面向跨语言描述的对抗性数据增强方法、系统及存储介质,其中方法包括以下步骤:获取干净的图像‑文本对数据集;利用序列到序列模型,生成文本对抗性样本;对图像描述生成模型进行训练:若当前训练阶段为对抗性训练阶段,则生成图像对抗性样本,进而扩充图像‑文本对,然后以扩充后的图像‑文本对数据集对模型进行训练,并根据联合损失函数对模型进行优化;若当前训练阶段为非对抗性训练阶段,则以干净的图像‑文本对数据集对模型进行训练,并根据损失函数对模型进行优化;获得训练好的图像描述生成模型和扩充后的图像‑文本对数据集。本发明通过易操作的数据增强方式,扩充了数据集,提升了图像描述生成模型的鲁棒性以及性能。

    一种基于卷积神经网络的汉字识别方法

    公开(公告)号:CN106650748A

    公开(公告)日:2017-05-10

    申请号:CN201611009032.3

    申请日:2016-11-16

    CPC classification number: G06K9/4609 G06K9/6256 G06N3/0454

    Abstract: 本发明公开了一种基于卷积神经网络的汉字识别方法,该方法包括以下步骤:1)采集训练用的文本图像;2)图像预处理:首先对图像进行非均匀光照调整,然后将图像转换为灰度图像;3)对预处理的图像进行特征提取;4)通过训练获得最终识别模型,选取测试识别正确率最高的卷积神经网络模型,作为最终识别模型;5)文字识别:对待识别的文本图像进行如步骤2)的图像预处理,采用训练所得的卷积神经网络模型进行识别,输出类别,匹配标签中汉字类别,输出汉字识别结果。本发明将提取方向特征图作为先验知识,和原始图像一起作为输入层的数据输入,以增强神经网络的识别性能,提高了汉字的识别率;且最终模型较小,计算速度快。

    一种组件协议挖掘方法、装置及系统

    公开(公告)号:CN104932865A

    公开(公告)日:2015-09-23

    申请号:CN201510405107.9

    申请日:2015-07-10

    Abstract: 本发明公开了一种组件协议挖掘方法、装置及系统,该方法包括:发送开始插桩指令至所述N个客户端,所述开始插桩指令中携带有需要挖掘的类的M个函数的函数标识,M为大于1的整数;接收所述N个客户端发送的所述M个函数的函数调用信息;所述函数调用信息是所述N个客户端基于所述开始插桩指令收集的信息;根据所述函数调用信息更新所述服务器中存储的所述类的组件协议。本发明提供的方法、装置及系统用以解决现有技术中的组件协议挖掘方法存在的人力耗费大和挖掘效率低的技术问题。实现了降低数据获取人力成本,提高组件协议挖掘效率的技术效果。

Patent Agency Ranking