一种基于多尺度特征的场景文本识别方法

    公开(公告)号:CN111967471A

    公开(公告)日:2020-11-20

    申请号:CN202010841752.6

    申请日:2020-08-20

    Abstract: 本发明公开一种基于多尺度特征的场景文本识别方法,包括:获取场景文本图像数据集,并对场景文本图像数据集中的图像数据进行尺寸调整;构建文本识别模型,并利用尺寸调整后的场景文本图像数据集对文本识别模型进行训练;文本识别模型包括多尺度特征编码模块、多层注意力机制解码模块;多尺度特征编码模块用于获取若干个尺度的字符特征,多层注意力机制解码模块联合二维注意力机制和一维注意力机制对若干个尺度的字符特征进行融合,得到场景文本中的字符识别结果;采集待识别场景文本图像,将场景文本图像调整到统一尺寸后输入训练好的文本识别模型,完成场景文本中多尺度字符的识别。本发明能够对场景文本中的多尺度字符进行快速准确识别。

    一种基于对比学习和视觉表意描述序列的甲骨字破译方法及系统

    公开(公告)号:CN119625753A

    公开(公告)日:2025-03-14

    申请号:CN202411671924.4

    申请日:2024-11-21

    Inventor: 金连文 李子彦

    Abstract: 本发明属于模式识别与人工智能领域,公开了一种基于对比学习和视觉表意描述序列的甲骨字破译方法及系统,所述方法包括:使用训练好的甲骨文部件识别器对输入的待破译甲骨字图像部件进行特征提取,得到甲骨字图像视觉嵌入特征;使用视觉编码器对输入的待破译甲骨字图像和现代汉字集提取整体视觉特征,得到甲骨字整体视觉特征和汉字整体视觉特征;使用基于IDS互询的特征增强器对所述甲骨字图像视觉嵌入特征和甲骨字整体视觉特征、汉字图像视觉嵌入特征和汉字整体视觉特征进行表征增强,得到甲骨字增强特征和汉字增强特征;使用对比学习对所述甲骨字增强特征和所述汉字增强特征进行对比计算,得到对比向量,基于所述对比向量得到甲骨文破译结果。

Patent Agency Ranking