-
-
公开(公告)号:CN112329803B
公开(公告)日:2022-08-26
申请号:CN201910716704.1
申请日:2019-08-05
Applicant: 北京大学
IPC: G06K9/62 , G06V10/764 , G06V10/82 , G06V30/19 , G06N3/04
Abstract: 本发明公布了一种基于标准字形生成的文字识别方法,建立基于注意力机制和生成机制的神经网络模型,在每个时刻将注意力集中在图片的某个位置,利用该位置的神经网络特征,分别进行文字类别的预测和生成多字体标准字形,直到遍历图片中的所有文字为止,实现对一张包含一个或多个文字的自然场景图片中的文字进行识别和输出。本发明利用多字体字形生成,改进了注意力模块,提高了文字识别精度和字形生成质量,从而提升了文字识别的准确度。
-
公开(公告)号:CN112633428A
公开(公告)日:2021-04-09
申请号:CN201910955021.1
申请日:2019-10-09
Applicant: 北京方正手迹数字技术有限公司 , 北京大学
Abstract: 本申请提供一种笔画骨架信息提取方法、装置、电子设备及存储介质。本申请提供的笔画骨架信息提取方法通过获取目标图像,所获取的目标图像中包括目标文字图像,然后根据目标图像确定目标文字图像对应的参考文字,之后,再根据所确定的参考文字以及预设参考数据库确定参考笔画骨架信息,其中,预设参考数据库包括参考文字与参考笔画骨架信息的映射关系,最后根据目标文字图像以及参考笔画骨架信息确定目标笔画骨架信息,从而,能够实现笔画骨架信息的自动化提取,整个提取过程无需人工干预,降低提取成本的同时还提高了效率以及精确度。
-
-
公开(公告)号:CN107507129B
公开(公告)日:2019-12-13
申请号:CN201610422723.X
申请日:2016-06-14
Applicant: 北京大学
IPC: G06T3/40
Abstract: 本发明公布了一种中文字符缩放方法,包括中文字符拆分过程、笔画缩放重构过程和笔画拼接过程,使得中文字符缩放之后仍能维持中文字符结构信息;通过汉字骨架轮廓提取,将汉字拆分至笔画级别,然后对笔画分别进行缩放重构,将重构缩放后的笔画进行拼接,在对中文字符进行缩放的同时还能够维持中文字符结构信息,避免了非等比例缩放过程中笔画宽度不一致、笔画梯度变化以及笔画细节信息丢失带来的失真,有效提升中文字符领域相关算法的效果,用以解决中文字符在缩放过程中结构信息丢失的问题。
-
公开(公告)号:CN110427989A
公开(公告)日:2019-11-08
申请号:CN201910649353.7
申请日:2019-07-18
Applicant: 北京大学
Abstract: 本发明公布了一种汉字骨架自动合成方法及大规模中文字库的自动生成方法,将中文字符视为点的序列(即书写轨迹),通过构建具有单调注意力机制的循环神经网络模型FontRNN来进行汉字骨架的自动合成,从少量训练样本中学习合成其余具有相同风格的汉字字符,实现汉字骨架的自动合成。本发明可克服现有汉字合成技术存在的合成汉字模糊、笔画丢失、结构错误等不足,且本发明模型可以从仅仅几百个训练样本中学习如何合成其余数千个具有相同风格的汉字字符。因此,本发明可以极大地降低制作大规模中文字库的成本,具有很大的实际应用价值。
-
公开(公告)号:CN104794479B
公开(公告)日:2018-06-29
申请号:CN201410026091.6
申请日:2014-01-20
Applicant: 北京大学
IPC: G06K9/54
Abstract: 本发明涉及一种基于局部笔画宽度变换的自然场景图片中文本检测方法,其步骤包括:1)对待检测的自然场景图片进行预先处理以得到灰度图,然后求出灰度图的边缘图;2)根据边缘图与灰度图,采用二值化方法生成相应的二值图;3)根据二值图将含有相同值的相邻像素集合成候选部件;4)对候选部件进行笔画宽度计算,得出每个像素点所在文字笔画的宽度值;5)根据计算出的笔画宽度值使用滤波器对候选部件进行过滤,筛选出文本部件;6)将筛选出的文本部件连接成文本行,并显示最后结果。本发明方法是一种计算成本低、高效直观的文本检测方法,可以有效提高自然场景图片中的文本检测的准确性和精确度。
-
公开(公告)号:CN103870515B
公开(公告)日:2017-06-30
申请号:CN201210552880.4
申请日:2012-12-18
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供一种构造蒙文字库的方法、蒙文显示方法和装置,属蒙文显示技术领域,可解决现有的蒙文显示方法不能正确显示复杂文本布局引擎不识别的蒙文字符的问题。本发明的构造蒙文字库的方法包括:制作显示字型;整理名义字符与其他蒙文字符的位置关系显示规则,其中,名义字符与其他蒙文字符的位置关系显示规则规定了该名义字符与其他蒙文字符处于不同位置关系时分别对应的显示字型;构造字库。本发明的蒙文显示方法包括根据上述蒙文字库选择名义字符及与其相邻的蒙文字符的显示字型。本发明的蒙文显示装置包括蒙文字库存储单元、判断单元、显示字型选择单元。本发明可用于显示蒙文字符,尤其是复杂文本布局引擎不识别的蒙文名义字符。
-
公开(公告)号:CN103186511B
公开(公告)日:2017-03-08
申请号:CN201110459270.5
申请日:2011-12-31
Applicant: 北京大学 , 北大方正集团有限公司 , 方正信息产业控股有限公司 , 北京北大方正电子有限公司
IPC: G06F17/22
CPC classification number: G06T11/60 , G06F3/018 , G06F3/04883 , G06F17/214 , G06F17/2223 , G06T11/203
Abstract: 本发明提供一种汉字造字方法和设备、构造字体库的方法,属于字体库技术领域,其可解决现有的汉字造字技术效率低、成本高、不能实时造字的问题。本发明的汉字造字方法包括:获取所要构造的汉字的字符编码、部件编码、结构编码,根据部件编码从汉字部件库中提取汉字部件,其中结构编码规定了汉字的结构及汉字部件在汉字中的位置;用汉字部件根据结构编码生成汉字的字形数据,并将字形数据与字符编码对应。本发明的构造字体库的方法包括用上述汉字造字方法生成对应的汉字的字形数据与字符编码,并用所得的字形数据构造字体库。本发明的汉字造字设备包括与上述方法相应的单元。本发明可用于构造超大字体库。
-
公开(公告)号:CN104794479A
公开(公告)日:2015-07-22
申请号:CN201410026091.6
申请日:2014-01-20
Applicant: 北京大学
IPC: G06K9/54
Abstract: 本发明涉及一种基于局部笔画宽度变换的自然场景图片中文本检测方法,其步骤包括:1)对待检测的自然场景图片进行预先处理以得到灰度图,然后求出灰度图的边缘图;2)根据边缘图与灰度图,采用二值化方法生成相应的二值图;3)根据二值图将含有相同值的相邻像素集合成候选部件;4)对候选部件进行笔画宽度计算,得出每个像素点所在文字笔画的宽度值;5)根据计算出的笔画宽度值使用滤波器对候选部件进行过滤,筛选出文本部件;6)将筛选出的文本部件连接成文本行,并显示最后结果。本发明方法是一种计算成本低、高效直观的文本检测方法,可以有效提高自然场景图片中的文本检测的准确性和精确度。
-
-
-
-
-
-
-
-
-