用于训练图像生成模型的方法及装置

    公开(公告)号:CN116091630A

    公开(公告)日:2023-05-09

    申请号:CN202211357095.3

    申请日:2022-11-01

    Abstract: 本公开的实施例提供一种用于训练图像生成模型的方法和装置。图像生成模型包括背景擦除模块、文本转换模块和融合模块。在该方法中,获取训练图像集。训练图像集包括:包含第一文本的风格图像和包含第二文本的内容图像。第一和第二文本分别具有第一和第二文本风格属性。通过背景擦除模块从风格图像中获得背景图像和第一文本掩码图像。第一文本掩码图像被用于计算背景擦除模块的损失函数。通过文本转换模块将内容图像中的第二文本转换为第一文本风格属性以获得转换后的内容图像和第二文本掩码图像。通过融合模块将转换后的内容图像与背景图像融合以得到目标图像。最小化背景擦除模块、文本转换模块和融合模块的损失函数以更新图像生成模型的参数。

    文本识别方法及文本识别装置
    3.
    发明公开

    公开(公告)号:CN115424285A

    公开(公告)日:2022-12-02

    申请号:CN202210915729.6

    申请日:2022-08-01

    Abstract: 本公开的实施例提供一种文本识别方法和文本识别装置。在该文本识别方法中,获取包括文本的图片。文本包括多个字符。通过浅层卷积神经网络来提取图片的特征以生成原始特征图。然后,通过注意力模块分别针对原始特征图的宽度维度和高度维度确定第一和第二注意力区域。将第一和第二注意力区域的重合区域确定为注意力选择区域。接着,根据原始特征图和注意力选择区域来生成候选特征矩阵。之后,将候选特征矩阵与原始特征图相乘以生成特征交互矩阵。对特征交互矩阵进行标准化处理以得到二维注意力权重矩阵。对原始特征图与二维注意力权重矩阵进行点积运算以获得增强特征矩阵。然后,根据增强特征矩阵和文本中的已识别字符来识别文本中的未识别字符。

Patent Agency Ranking