一种强化边缘细节的OCT单帧图像自监督去噪方法

    公开(公告)号:CN118279182B

    公开(公告)日:2024-09-27

    申请号:CN202410706336.3

    申请日:2024-06-03

    Abstract: 本发明公开一种强化边缘细节的OCT单帧图像自监督去噪方法,涉及OCT图像去噪领域;包括S1构建OCT单帧图像自监督去噪模型;S2获取OCT噪声图像;S3将OCT噪声图像输入全局掩码器;S4将OCT噪声图像输入邻近采样器;S5将掩码图像输入去噪网络;S6将邻近采样图像输入去噪网络;S7将OCT噪声图像输入去噪网络;S8将直接去噪图像输入邻近采样器;S9将掩码去噪图像输入全局掩码映射器;S10计算重构损失和正则化损失,两者相加;S11将掩码恢复图像和直接去噪图像进行权重和得到权重去噪图像。通过掩码和子采样策略融合的方式,更精确地对OCT图像进行自监督去噪。

    一种基于双流时空编码器的自监督视频异常检测方法

    公开(公告)号:CN118097517B

    公开(公告)日:2024-07-05

    申请号:CN202410465339.2

    申请日:2024-04-18

    Abstract: 本发明公开了一种基于双流时空编码器的自监督视频异常检测方法,属于视频异常检测技术领域。该方法包括预处理模块、视频流网络、光流网络以及横向链接。该方法引入光流来为模型提供额外的视觉线索,同时结合原始视频,从而设计了一个双流编码器来从视频中提取复杂的时空信息;其次,双流编码器采用针对不同模态数据的定制网络架构,分别为视频流网络和光流网络,实现了对视频中高级视觉特征更全面的提取;最后,通过设计横向连接来促进双流通道之间的信息交互,以弥补了深度网络中的信息遗漏问题。该方法通过以上几点提高了视频异常检测的性能。

    一种基于时空循环架构的3D人体姿态估计方法

    公开(公告)号:CN118038561B

    公开(公告)日:2024-06-21

    申请号:CN202410449199.X

    申请日:2024-04-15

    Abstract: 一种基于时空循环架构的3D人体姿态估计方法,通过分别设计三个图卷积网络来处理这些图数据,最终得到一个融合的特征,充分学习关节之间的空间相关性,同时在一定程度上解决了关节的自遮挡问题;采用了一种全局局部的交替机制,通过结合在建模全局信息方面表现出色的自注意力机制和能够控制注意力机制关注范围的滑动窗口机制,以引导网络在较短的时间内关注局部细节,在较长的时间内关注全局信息,因此本方法成功避免了较长序列的干扰,使改进后的自注意力能够交替关注全局和局部信息,更加全面地捕捉时间特征,并在一定程度上解决关节的深度模糊问题。经过实验,与将自注意力机制引入3D人体姿态估计领域的方法PoseFormer比较,本方法更加准确。

    一种工业报警泛滥的报警分析方法

    公开(公告)号:CN117118811A

    公开(公告)日:2023-11-24

    申请号:CN202311386097.X

    申请日:2023-10-25

    Abstract: 本发明属于工业互联网技术领域,公开了一种工业报警泛滥的报警分析方法,其结合知识驱动与数据驱动来构建报警传播网络,实现对报警传播网络、报警发生根本原因和间接关系的研究;利用数据驱动对报警数据的传递关系进行初始化,结合知识驱动来对初始化的网络结构进行训练获得报警传播网络,最后利用精确推理实现报警溯源,旨在帮助操作人员进行报警根源定位的同时了解接下来可能受到影响的报警变量,预防报警多米诺效应的发生,从而有效解决报警泛滥问题。

    一种面向微控制器的深度学习内存优化方法

    公开(公告)号:CN116501509A

    公开(公告)日:2023-07-28

    申请号:CN202310782140.8

    申请日:2023-06-29

    Abstract: 本发明属于深度学习技术领域,公开了一种面向微控制器的深度学习内存优化方法,包括:提出一种多算子融合计算优化方法,对深度学习模型中常用到的残差结构、卷积‑激活结构和连接结构分别进行优化,减少深度学习模型推理过程中的内存使用,使深度学习模型可以运行在内存更小的微控制器上;针对微控制器多段内存的特性提出一种面向多段内存的深度学习算子内存布局优化方法,能够使深度学习算子使用多段内存进行推理,解决现有技术只使用单段内存的缺点,有效提高内存使用效率。

    一种基于多通道注意力融合的方面级情感分析系统及方法

    公开(公告)号:CN116205222A

    公开(公告)日:2023-06-02

    申请号:CN202310500326.X

    申请日:2023-05-06

    Abstract: 本发明属于自然语言处理技术领域,公开了一种基于多通道注意力融合的方面级情感分析系统及方法,使用BERT预训练模型,将初始文本数据转换成为带有上下文语境信息的文本词向量。通过方面词增强机制,增强方面词在文本中的语义权重;通过BiGRU神经网络捕捉文本序列的位置信息,学习文本内的顺序关系,提取文本特征。构建多通道注意力融合层,引入文本卷积神经网络,多维度地提取不同大小的高维文本特征,同时每个通道中引入自注意力机制,有效地利用了上下文对于方面词的注意力信息,提高模型准确率。

    一种基于多模态学习的美学质量评价模型和方法

    公开(公告)号:CN115601772B

    公开(公告)日:2023-05-02

    申请号:CN202211611537.2

    申请日:2022-12-15

    Abstract: 本发明属于图像处理技术领域,公开了一种基于多模态学习的美学质量评价模型和方法,其根据文本信息和图像信息,在图像特征和文本特征提取后,基于跨越注意力机制,动态融合图像与文本之间的信息;在多模态学习的基础上使用Transformer作为骨干网络,不考虑传统的CNN方法,通过视觉和文本Transformer分别提取图像特征和高级语义,从而实现基于多模态学习的纯Transformer美学质量评价模型和方法。本发明有效提高了美学质量评价的准确率和其他评价指标;有利于促进美学应用,加快深度学习在未来美学领域的发展。

Patent Agency Ranking