一种面向不完整文本图像的图像修复方法

    公开(公告)号:CN119887586A

    公开(公告)日:2025-04-25

    申请号:CN202411850294.7

    申请日:2024-12-16

    Abstract: 本发明公开了一种面向不完整文本图像的图像修复方法。该方法主要包括两个阶段:文本结构重建和文本图像重建。在文本结构重建阶段,接收不完整文本图像作为输入,并通过编码器、中间模块和解码器的协同工作,实现文本结构的精确分割与预测,从而获得完整文本结构二进制图像。随后,在文本图像重建阶段,将重建后的完整文本结构图像与原始不完整文本图像共同作为条件输入。该阶段由识别引导模型和扩散模型组成。识别引导模型,即场景文本识别器,它通过分析不完整文本图像,预测每个字符属于特定字符集的概率分布,为文本修复提供语义指导。在语义指导的基础上,扩散模型对不完整文本图像进行精细化修复,显著提升了文本区域的可读性和图像的保真度。

    一种基于二次卷积和残差神经网络的轴承故障诊断方法

    公开(公告)号:CN118603557A

    公开(公告)日:2024-09-06

    申请号:CN202410653804.5

    申请日:2024-05-24

    Abstract: 本发明请求保护一种基于二次卷积和残差神经网络的轴承故障诊断方法,该方法首先采用六层二次卷积神经网络,然后,融入了五层创新设计的ResNet残差神经网络,旨在有效克服二次卷积神经网络在训练过程中可能出现的梯度消失或梯度爆炸难题;最后,通过两层全连接层的深层次转化处理,以及顶层Softmax激活函数的应用,系统得以精准量化各类故障模式的概率分布,最终得出可靠的轴承故障诊断结果。与传统的统计学习过程相比,本发明不需要复杂的过程,也不需要对轴承信息进行特殊的预处理。此外,特征提取的过程也更加便利。在不同噪声强度和不同负载功率的数据中,本发明的模型均能取得较高的分类准确率。

Patent Agency Ranking