文本图像识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN113313127B

    公开(公告)日:2023-02-14

    申请号:CN202110537652.9

    申请日:2021-05-18

    Abstract: 本发明公开了一种文本图像识别方法、装置、计算机设备和存储介质,所述方法包括:获取原始文本图像并进行预处理,得到处理后图像;利用特征编码网络中的残差卷积模块对所述处理后图像进行特征提取,得到图像特征;利用所述特征编码网络中上下文感知模块的类递归扩张卷积部分和通道级尺度注意力部分,对图像特征进行处理,得到上下文调制特征序列;对上下文调制序列进行解码,预测得到对应的符号序列。本发明利用上下文感知模块对不同尺度的文本进行上下文调制,同时利用残差模块和上下文感知模块交错连接,实现不同语义层次的上下文信息融合,为后续解码提供更多有效信息,提高了文本识别的准确率。

    基于对抗解耦的个性化手写文字生成方法

    公开(公告)号:CN114495118B

    公开(公告)日:2022-08-09

    申请号:CN202210392274.4

    申请日:2022-04-15

    Abstract: 本发明公开了基于对抗解耦的个性化手写文字生成方法,包括以下步骤:构建风格向量提取器和内容分类器;以所述的风格向量提取器为生成器,以所述的内容分类器为判别器,进行生成对抗学习;将手写文字图片输入学习后的风格向量提取器,获得手写风格向量;将待生成的目标文字通过内容嵌入层映射为内容向量;拼接所述的手写风格向量和所述的内容向量,然后在融合初始序列,获得解码向量;将所述的解码向量输入解码器进行解码,获得具有手写风格的目标文字的轨迹预测序列。本发明方法能够通过对抗解耦的方式,利用对抗网络帮助风格提取器消除风格向量中夹杂的内容信息,提取出干净的风格向量,进而提升个性化手写文字的生成效果。

    基于CTC解码器的文本序列识别模型校准方法

    公开(公告)号:CN114495114A

    公开(公告)日:2022-05-13

    申请号:CN202210402975.1

    申请日:2022-04-18

    Abstract: 本发明公开了基于CTC解码器的文本序列识别模型校准方法,包括:将文本图像支撑集输入至待校准训练模型中,获得文本序列识别结果;利用文本图像支撑集的文本序列识别结果计算上下文混淆矩阵,上下文混淆矩阵用于表征序列中相邻时刻预测字符之间的上下文分布关系;根据上下文混淆矩阵,利用上下文相关预测分布对标签平滑中平滑强度有选择性地进行自适应的变化,以实现序列置信度的自适应校准;基于上下文选择性损失函数重新训练待校准训练模型,输出预测文本序列及校准的置信度。本发明方法将标签平滑扩展到基于CTC解码器的文本序列识别模型上,引入序列间上下文关系,对预测序列进行自适应的校准,使得模型输出预测文本置信度能够更加精准。

    基于双流卷积神经网络的目标跟踪方法、系统、设备及介质

    公开(公告)号:CN109410242B

    公开(公告)日:2020-09-22

    申请号:CN201811031639.0

    申请日:2018-09-05

    Abstract: 本发明公开了一种基于双流卷积神经网络的目标跟踪方法、系统、设备及介质,所述方法包括:构建空间流二维卷积神经网络,提取当前帧中图像块的特征信息;构建时序流三维卷积神经网络,提取一定时序范围内的视频序列中帧与帧之间目标的运动变化特征信息;加性融合空间流二维卷积神经网络和时序流三维卷积神经网络的特征信息;根据融合的特征信息,构建全连接子网络,提取符合要求的图像块;对符合要求的图像块的边界框进行边界框回归,得到当前帧目标的预测位置和大小;在对目标跟踪前,对空间流二维卷积神经网络和时序流三维卷积神经网络进行线下训练;在对目标跟踪过程中,对全连接子网络进行线上精调。本发明达到了很好的跟踪效果。

    一种基于样本模板的数字化妆方法

    公开(公告)号:CN105488472B

    公开(公告)日:2019-04-09

    申请号:CN201510860633.4

    申请日:2015-11-30

    Abstract: 本发明提供一种基于样本模板的数字化妆方法,先对淡妆或素颜人脸照片和妆容提供照片进行人脸检测、人脸特征点定位检测和人脸图像变形对准,在此基础上对人脸图像利用改进的引导滤波器进行图层分解,利用基于样本的超分辨率重构算法解决妆容提供图像和输入人脸图像的分辨率差异问题,最后进行人脸图像的图层合成,输出淡妆或素颜照片化妆之后的图像。本发明提出一种新颖的基于模板的数字化妆方法,通过对图层分解和图层合成算法的改进,获得更为真实的化妆效果,且显著缩减算法时间复杂度,使得数字化妆算法实用化和实时化。

    基于双流卷积神经网络的目标跟踪方法、系统、设备及介质

    公开(公告)号:CN109410242A

    公开(公告)日:2019-03-01

    申请号:CN201811031639.0

    申请日:2018-09-05

    Abstract: 本发明公开了一种基于双流卷积神经网络的目标跟踪方法、系统、设备及介质,所述方法包括:构建空间流二维卷积神经网络,提取当前帧中图像块的特征信息;构建时序流三维卷积神经网络,提取一定时序范围内的视频序列中帧与帧之间目标的运动变化特征信息;加性融合空间流二维卷积神经网络和时序流三维卷积神经网络的特征信息;根据融合的特征信息,构建全连接子网络,提取符合要求的图像块;对符合要求的图像块的边界框进行边界框回归,得到当前帧目标的预测位置和大小;在对目标跟踪前,对空间流二维卷积神经网络和时序流三维卷积神经网络进行线下训练;在对目标跟踪过程中,对全连接子网络进行线上精调。本发明达到了很好的跟踪效果。

    一种基于改进的引导滤波器的人脸图像图层分解方法

    公开(公告)号:CN105469407B

    公开(公告)日:2018-06-22

    申请号:CN201510862964.1

    申请日:2015-11-30

    Abstract: 本发明提供一种基于改进的引导滤波器的人脸图像图层分解方法,对人脸图像亮度通道进行改进型引导滤波,得到人脸结构信息层,进一步差分运算得到纹理细节层。本发明对引导滤波器进行正则化因子自适应调整优化和对参数矩阵图像进行高斯模糊和腐蚀处理,使得人脸图像在不同区域获得不同滤波效果。应用于数字化妆系统,获得优异的图层分解效果,显著降低图层分解的时间复杂度。

    基于深度强化学习的场景文本检测方法及系统

    公开(公告)号:CN108090443A

    公开(公告)日:2018-05-29

    申请号:CN201711352220.0

    申请日:2017-12-15

    Abstract: 本发明公开了基于深度强化学习的场景文本检测方法及系统,所述方法包括:训练一个特征提取网络;训练一个决策网络;通过特征提取网络和决策网络定位待检测图像上场景文本的位置;其中,所述特征提取网络为场景文本图像特征提取的深度卷积神经网络;所述决策网络为拟合强化学习Q值函数的神经网络。本发明将场景文本检测解析为基于视觉的连续性决策问题,结合强化学习与深度神经网络,模拟日常生活中人眼从整图开始逐渐聚焦到目标物体的过程;在训练过程中,利用深度神经网络,很好地提取出当前定位框图像信息,以强化学习方法训练出能进行目标文本定位的模型。

    一种基于扩散模型的单样本手写文字临摹方法

    公开(公告)号:CN118762103B

    公开(公告)日:2025-01-24

    申请号:CN202411240512.5

    申请日:2024-09-05

    Abstract: 本发明公开了一种基于扩散模型的单样本手写文字临摹方法,包括以下步骤:构建能够临摹任意手写风格的扩散模型生成网络,包括风格特征增强模块,内容编码器,自适应融合模块,条件扩散模型;以手写样本图像和标准字体图像作为风格输入和内容输入,分别经内容编码器和风格编码器提取出风格特征和内容特征,然后将风格和内容特征同时输入到条件扩散模型中生成具有目标风格和内容的手写文字;训练所述的能够临摹任意手写风格扩散模型生成网络;使用训练好的扩散模型生成网络来生成同时满足目标风格和目标内容的手写文字。本发明方法结合高频信息提取和门控机制,能够提取更加准确的用户手写风格,引导条件扩散模型合成更加逼真的风格化手写文字。

Patent Agency Ranking