一种随机版式票据图像合成的基础数据集构建方法

    公开(公告)号:CN114722785A

    公开(公告)日:2022-07-08

    申请号:CN202210371837.1

    申请日:2022-04-11

    Abstract: 本发明公开了一种随机版式票据图像合成的基础数据集构建方法,包括票据表格线绘制、划定票据项目文本信息所在区域、填充票据项目文本信息到确定区域等3个部分,基于常见票据特征和票据版面文本关系最终得以实现。票据表格线绘制部分用于生成版式布局随机的票据表格。划定票据项目文本信息所在区域用于在票据凭证中选取位置分布随机、映射关系各样的票据项目文本信息区域。填充票据文本信息到确定区域用于生成票据相似文本并将其填充到确定好的区域,最终合成了随机版式票据图像。利用本发明方法合成的票据样本版式布局多样、布局分布合理、票据文本多样,能有效提升文本定位网络模型的准确率。

Patent Agency Ranking