复杂场景文本识别方法、系统、计算机设备及存储介质

    公开(公告)号:CN112163596A

    公开(公告)日:2021-01-01

    申请号:CN202010919026.1

    申请日:2020-09-04

    Abstract: 本发明公开了一种复杂场景文本识别方法、系统、计算机设备及存储介质,该方法包括:将残差卷积神经网络作为文本图像编码器,对文本图像进行特征提取,得到特征图;构建连接时序分类解码器和二维注意力解码器;并联连接时序分类解码器和二维注意力解码器,使两者共享文本图像编码器的输出;将特征图输入连接时序分类解码器,转换成一维特征序列,并将一维特征序列译码成第一文本序列;将特征图输入二维注意力解码器,转换成二维特征序列,并将二维特征序列译码成第二文本序列;利用输出选择策略对第一文本序列和第二文本序列进行优选,输出文本识别结果。本发明实现了对长短不一,线性文本序列和二维文本序列混合的复杂多样场景文本的精准识别。

    文本图像标注系统、方法、计算机设备和存储介质

    公开(公告)号:CN111898411A

    公开(公告)日:2020-11-06

    申请号:CN202010548848.3

    申请日:2020-06-16

    Abstract: 本申请涉及一种文本图像标注系统、方法、计算机设备和存储介质,通过接收前端网页上发的预标注请求;根据预标注请求携带的待标注文本图像的标识查找得到待标注文本图像;对待标注文本图像进行实例分割得到候选文本框集合;基于最小函数和交集运算,对候选文本框集合中的各个候选文本框进行计算,得到各个候选文本框之间的重叠度;根据重叠度在候选文本框集合中选取得到至少一个目标文本框,生成目标文本框集合;对待标注文本图像进行特征提取,根据提取得到的特征与目标文本框集合,对待标注文本图像进行预标注;将预标注结果发送至前端网页,以使前端网页显示预标注结果,根据修正指令对预标注结果进行修正,得到标注结果;能够提高标注效率。

    文本图像标注系统、方法、计算机设备和存储介质

    公开(公告)号:CN111898411B

    公开(公告)日:2021-08-31

    申请号:CN202010548848.3

    申请日:2020-06-16

    Abstract: 本申请涉及一种文本图像标注系统、方法、计算机设备和存储介质,通过接收前端网页上发的预标注请求;根据预标注请求携带的待标注文本图像的标识查找得到待标注文本图像;对待标注文本图像进行实例分割得到候选文本框集合;基于最小函数和交集运算,对候选文本框集合中的各个候选文本框进行计算,得到各个候选文本框之间的重叠度;根据重叠度在候选文本框集合中选取得到至少一个目标文本框,生成目标文本框集合;对待标注文本图像进行特征提取,根据提取得到的特征与目标文本框集合,对待标注文本图像进行预标注;将预标注结果发送至前端网页,以使前端网页显示预标注结果,根据修正指令对预标注结果进行修正,得到标注结果;能够提高标注效率。

Patent Agency Ranking