-
公开(公告)号:CN107644006A
公开(公告)日:2018-01-30
申请号:CN201710908121.X
申请日:2017-09-29
Applicant: 北京大学
Abstract: 本发明公布了一种基于深度神经网络的手写体中文字库自动生成方法,通过少量手写体汉字进行字体特征重建,建立字体风格迁移网络,通过字体风格迁移网络估计用户未书写字形的字体风格特征,将参考字体的字形内容与用户书写风格结合,迁移到目标手写体风格,生成目标字形图片,从而得到完整的字库中文手写体字库。本发明方法是一种端到端的生成方法,不需要对汉字进行笔画或部件提取,也不需要人工干预,生成高质量的汉字字形,极大地提高了手写体字库制作的效率,使得个性化字库的生成变得简单方便,能够满足普通人对于个性化手写体字库的需求,加快个性化字库的发展进程。
-
公开(公告)号:CN107507129A
公开(公告)日:2017-12-22
申请号:CN201610422723.X
申请日:2016-06-14
Applicant: 北京大学
IPC: G06T3/40
Abstract: 本发明公布了一种中文字符缩放方法,包括中文字符拆分过程、笔画缩放重构过程和笔画拼接过程,使得中文字符缩放之后仍能维持中文字符结构信息;通过汉字骨架轮廓提取,将汉字拆分至笔画级别,然后对笔画分别进行缩放重构,将重构缩放后的笔画进行拼接,在对中文字符进行缩放的同时还能够维持中文字符结构信息,避免了非等比例缩放过程中笔画宽度不一致、笔画梯度变化以及笔画细节信息丢失带来的失真,有效提升中文字符领域相关算法的效果,用以解决中文字符在缩放过程中结构信息丢失的问题。
-
公开(公告)号:CN106503706A
公开(公告)日:2017-03-15
申请号:CN201610847230.0
申请日:2016-09-23
Applicant: 北京大学
CPC classification number: G06K9/342 , G06K9/3233 , G06K9/6223 , G06K9/6269
Abstract: 本发明公布了一种针对该字形切割算法的结果进行正确性判别的方法,属于汉字笔画和部件自动提取领域,本方法依次包括基于字形重建的判别过程、基于部件分类的判别过程、基于字形属性的判别过程和基于字形骨架的判别过程,当任一判别过程针对待判别的字形切割结果进行判别得到的判定结果为错误切割结果时,将所述待判别的字形切割结果判定为字形切割错误。通过本发明所提供的字形切割结果判别方法,能够识别出97%以上的错误切割结果。因此,本发明能够有效的判别切割错误的情况。
-
公开(公告)号:CN1821995B
公开(公告)日:2010-05-26
申请号:CN200610066429.6
申请日:2006-03-31
Applicant: 北京北大方正电子有限公司 , 北京大学
IPC: G06F17/25
Abstract: 本发明属于印刷排版领域,具体涉及一种适应文字内容的直边文字框的排版方法。现有的排版方法中,如果文字内容的多少和可以排入文字的区域直边文字框不是正好相适应,常会存在排版区域过大,或者过小,需要排版人员对直边文字框进行手工调整,费时费力。本发明所述的方法通过调整直边文字框的边线,并对边线进行合并处理后,使文字内容与直边文字框可以自动相适应,不必进行手工调整。采用本发明所述的方法,可以使排版人员通过对直边文字框的边线进行调整和合并,很容易地使文字框与其内容相适应,免去手工操作费时费力之苦。
-
公开(公告)号:CN101369953A
公开(公告)日:2009-02-18
申请号:CN200810222439.3
申请日:2008-09-17
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
Abstract: 本发明公开了一种字库的网络分发方法及系统,属于字符信息处理技术领域。现有的字库分发方法中,采用全字库分发方式。这种方式存在数据量大,响应速度慢,冗余数据量大等不足之处。本发明所述的方法及系统在现有字库格式的基础上,将字库中的数据划分为公有数据部分和字形专属数据部分两类数据;然后动态提取公有数据部分中的公有数据、字形专属数据部分中与所需字形相关的专属数据,并在提取数据的过程中对被提取的数据进行打包处理,生成数据包;最后向接收端分发数据包,接收端对收到的数据包进行解包处理后,提取数据包中的数据。采用本发明所述的方法及系统分发字库时,降低了网络负载和数据冗余量,提高了响应速度,实现了按需分发的目的。
-
公开(公告)号:CN110427989B
公开(公告)日:2021-07-09
申请号:CN201910649353.7
申请日:2019-07-18
Applicant: 北京大学
Abstract: 本发明公布了一种汉字骨架自动合成方法及大规模中文字库的自动生成方法,将中文字符视为点的序列(即书写轨迹),通过构建具有单调注意力机制的循环神经网络模型FontRNN来进行汉字骨架的自动合成,从少量训练样本中学习合成其余具有相同风格的汉字字符,实现汉字骨架的自动合成。本发明可克服现有汉字合成技术存在的合成汉字模糊、笔画丢失、结构错误等不足,且本发明模型可以从仅仅几百个训练样本中学习如何合成其余数千个具有相同风格的汉字字符。因此,本发明可以极大地降低制作大规模中文字库的成本,具有很大的实际应用价值。
-
公开(公告)号:CN112784531A
公开(公告)日:2021-05-11
申请号:CN201911069573.9
申请日:2019-11-05
Applicant: 北京大学
IPC: G06F40/109 , G06K9/62
Abstract: 本发明公布了一种基于深度学习和部件拼接的中文字形及字库生成方法,对目标字库中的汉字字形进行结构拆分得到用于重组的基础矢量部件;根据目标字库中的汉字字形的布局预测待生成字形的布局,将基础矢量部件拼接生成新的矢量字形;生成方法包括线下处理过程和线上处理过程;线下处理过程对已有字库的字体进行处理,得到训练数据和参考模板,线上处理过程针对任意包含少量特定汉字字形的目标字库,采用部件拼接的方法生成完整的中文矢量字形。采用本发明的技术方案,可根据设计好的少量矢量汉字字形,自动生成一套完整且可以被实际使用的高质量中文矢量字库。
-
公开(公告)号:CN112669407A
公开(公告)日:2021-04-16
申请号:CN201910984727.0
申请日:2019-10-16
Applicant: 北京方正手迹数字技术有限公司 , 北京大学
IPC: G06T11/20
Abstract: 本申请提供一种字库生成方法、装置、电子设备及存储介质。本申请提供的字库生成方法通过获取文字图像集合,所获取的文字图像集合中包括至少一张文字图像,然后根据所获取的文字图像确定第一参考字库,再根据文字图像集合中的文字图像以及第一参考字库确定目标笔画轨迹数据,所确定的目标笔画轨迹数据可以表征文字图像的形状特征,最后根据目标笔画轨迹数据以及预设处理算法确定目标文字图像,以生成目标字库,从而,能够通过文字图像实现整套字库的自动生成。字库生成过程简洁,提高了字库制作效率,减少了制作成本。并且,所生成字库中的文字能够保持原始文字的书写风格,字库质量较高。
-
公开(公告)号:CN106611172B
公开(公告)日:2019-11-08
申请号:CN201510696769.6
申请日:2015-10-23
Applicant: 北京大学
Abstract: 本发明公开了一种基于风格学习的汉字合成方法。本发明为:1)提取用户输入的每一手写字及对应参考字的骨架点坐标;2)根据骨架点分别计算对应手写字和参考字的笔画布局和每个笔画的笔画形状;3)对于每一手写字,计算该手写字与其对应参考字之间的笔画形状差值以及笔画布局差值;4)使用神经网络分别对笔画形状差值、笔画布局差值进行训练,得到笔画形状风格的神经网络权值、笔画布局风格的神经网络权值;5)将新的参考字的笔画惯性、笔画重心位置输入到已训练的神经网络中,分别得到该用户风格的笔画形状和笔画布局;6)组合步骤5)得到的笔画形状和笔画布局得到合成汉字的骨架,然后对该骨架进行平滑、渲染得到该用户风格的手写体汉字。
-
公开(公告)号:CN108376244A
公开(公告)日:2018-08-07
申请号:CN201810104830.7
申请日:2018-02-02
Applicant: 北京大学
Abstract: 本发明公布了一种自然场景图片中的文本字体的识别方法,通过图片合成方法获得大量融合不同字体文本的具体类似真实效果的自然场景图片,利用图片训练得到字体识别器和文本定位器,通过文本定位器从互联网图片中定位出更多文本图片,再利用迁移学习方法,通过字体识别器从图片中进一步学习,进一步提高识别的准确度。本发明采用自动合成高质量训练图片的方案,避免了耗时耗力的人工标注,大幅度降低成本,使得字体分类器具有更好的识别精度。此外,本发明引入迁移学习方法,充分利用大量无字体标签的图片,进一步增强字体分类器的准确度。
-
-
-
-
-
-
-
-
-