一种基于风格学习的汉字合成方法

    公开(公告)号:CN106611172A

    公开(公告)日:2017-05-03

    申请号:CN201510696769.6

    申请日:2015-10-23

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于风格学习的汉字合成方法。本发明为:1)提取用户输入的每一手写字及对应参考字的骨架点坐标;2)根据骨架点分别计算对应手写字和参考字的笔画布局和每个笔画的笔画形状;3)对于每一手写字,计算该手写字与其对应参考字之间的笔画形状差值以及笔画布局差值;4)使用神经网络分别对笔画形状差值、笔画布局差值进行训练,得到笔画形状风格的神经网络权值、笔画布局风格的神经网络权值;5)将新的参考字的笔画惯性、笔画重心位置输入到已训练的神经网络中,分别得到该用户风格的笔画形状和笔画布局;6)组合步骤5)得到的笔画形状和笔画布局得到合成汉字的骨架,然后对该骨架进行平滑、渲染得到该用户风格的手写体汉字。

    一种个性化汉字数字墨水的生成方法

    公开(公告)号:CN103488339B

    公开(公告)日:2016-09-07

    申请号:CN201310407336.5

    申请日:2013-09-09

    Applicant: 北京大学

    Abstract: 本发明涉及一种个性化汉字数字墨水的生成方法,步骤为:1)对字库中的所有同种笔画进行聚类,挑选出覆盖完整的笔画训练字并提取得到训练字图像;2)拆分已标定出训练字图像的笔画骨架,得到独立笔画段图像;3)根据最大圆滚动算法对独立笔画段图像进行笔画书写轨迹还原,按照还原结果建立笔画分段模型,得到带有笔画风格的笔画段;4)根据带有笔画风格的笔画段中的形状特征建立不同风格数据库;5)在风格数据库中输入手写汉字进行渲染,经过笔画分段、笔画相似度匹配后得到汉字数字墨水。本发明提供给用户一种个性化的触屏汉字输入体验,用户可以自己指定渲染风格,进行触屏书写时,显示结果既保持输入轨迹特征也能体现出指定的书写风格。

    一种面向矢量字形的汉字笔画自动提取方法

    公开(公告)号:CN104992143A

    公开(公告)日:2015-10-21

    申请号:CN201510303067.7

    申请日:2015-06-04

    Applicant: 北京大学

    CPC classification number: G06K9/00865

    Abstract: 本发明涉及一种面向矢量字形的汉字笔画自动提取方法,其步骤包括:1)对待提取的目标字形以及模板数据库中与其相对应的带有笔画归类信息的模板字形进行骨架提取,得到数据点集和模板点集;2)将数据点集、模板点集以及模板点集的笔画归属关系作为输入,进行基于结构信息的非刚性点集注册,得到数据点集的笔画归属关系;3)将数据点集的笔画归属关系转换成数据轮廓段的归属关系,使构成字形轮廓的每一个轮廓段具有相应的归属笔画;4)连接生成的轮廓段,得到最终的矢量笔画提取结果。本发明的矢量化方法能够精确地实现字形的笔画提取,且完全不需要人工的干预,算法可以自动运行,有利于矢量化笔画提取的批量运行。

    一种基于标准字形生成的自然场景文字识别方法

    公开(公告)号:CN112329803B

    公开(公告)日:2022-08-26

    申请号:CN201910716704.1

    申请日:2019-08-05

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于标准字形生成的文字识别方法,建立基于注意力机制和生成机制的神经网络模型,在每个时刻将注意力集中在图片的某个位置,利用该位置的神经网络特征,分别进行文字类别的预测和生成多字体标准字形,直到遍历图片中的所有文字为止,实现对一张包含一个或多个文字的自然场景图片中的文字进行识别和输出。本发明利用多字体字形生成,改进了注意力模块,提高了文字识别精度和字形生成质量,从而提升了文字识别的准确度。

    一种基于强化学习的中文字库自动生成方法及系统

    公开(公告)号:CN112732943A

    公开(公告)日:2021-04-30

    申请号:CN202110074336.2

    申请日:2021-01-20

    Applicant: 北京大学

    Inventor: 连宙辉 刘亦天

    Abstract: 本发明公布了一种基于强化学习的中文字库自动生成方法及系统,通过创建强化学习模块输出薄板样条TPS插值函数参数,并应用TPS插值函数将标准汉字骨架的每个笔画转化为目标风格;再对笔画实际位置与尺寸进行预测,将笔画骨架组合为汉字骨架;对汉字骨架进行渲染生成目标汉字图片,从而得到完整的中文字库文件。系统包括:强化学习模块、笔画位置预测模块、渲染模块。本发明实现了对标准笔画骨架的修改和笔画边界框的预测,确保生成更好的目标风格汉字骨架。模型结构简单,无需进行大规模的预训练处理,即可合成高质量的汉字骨架,自动生成高质量的中文字库。

    笔画骨架信息提取方法、装置、电子设备及存储介质

    公开(公告)号:CN112633428A

    公开(公告)日:2021-04-09

    申请号:CN201910955021.1

    申请日:2019-10-09

    Abstract: 本申请提供一种笔画骨架信息提取方法、装置、电子设备及存储介质。本申请提供的笔画骨架信息提取方法通过获取目标图像,所获取的目标图像中包括目标文字图像,然后根据目标图像确定目标文字图像对应的参考文字,之后,再根据所确定的参考文字以及预设参考数据库确定参考笔画骨架信息,其中,预设参考数据库包括参考文字与参考笔画骨架信息的映射关系,最后根据目标文字图像以及参考笔画骨架信息确定目标笔画骨架信息,从而,能够实现笔画骨架信息的自动化提取,整个提取过程无需人工干预,降低提取成本的同时还提高了效率以及精确度。

    一种基于流形学习的汉字笔画自动提取方法

    公开(公告)号:CN107092917B

    公开(公告)日:2020-06-02

    申请号:CN201710181667.X

    申请日:2017-03-24

    Applicant: 北京大学

    Abstract: 本发明提供一种基于流形学习的汉字笔画自动提取方法,属于人工智能、计算机图形学领域。该方法通过构建汉字骨架的二维流形空间并从其中寻找风格最相似的字作为参考字来指导目标字的笔画提取。本发明可以解决基于数据驱动的笔画自动提取方法中参考字与目标字风格差异太大的问题,有效提高了汉字笔画提取的准确率。

    一种中文字符缩放方法
    28.
    发明授权

    公开(公告)号:CN107507129B

    公开(公告)日:2019-12-13

    申请号:CN201610422723.X

    申请日:2016-06-14

    Applicant: 北京大学

    Abstract: 本发明公布了一种中文字符缩放方法,包括中文字符拆分过程、笔画缩放重构过程和笔画拼接过程,使得中文字符缩放之后仍能维持中文字符结构信息;通过汉字骨架轮廓提取,将汉字拆分至笔画级别,然后对笔画分别进行缩放重构,将重构缩放后的笔画进行拼接,在对中文字符进行缩放的同时还能够维持中文字符结构信息,避免了非等比例缩放过程中笔画宽度不一致、笔画梯度变化以及笔画细节信息丢失带来的失真,有效提升中文字符领域相关算法的效果,用以解决中文字符在缩放过程中结构信息丢失的问题。

    汉字骨架自动合成方法及大规模中文字库自动生成方法

    公开(公告)号:CN110427989A

    公开(公告)日:2019-11-08

    申请号:CN201910649353.7

    申请日:2019-07-18

    Applicant: 北京大学

    Abstract: 本发明公布了一种汉字骨架自动合成方法及大规模中文字库的自动生成方法,将中文字符视为点的序列(即书写轨迹),通过构建具有单调注意力机制的循环神经网络模型FontRNN来进行汉字骨架的自动合成,从少量训练样本中学习合成其余具有相同风格的汉字字符,实现汉字骨架的自动合成。本发明可克服现有汉字合成技术存在的合成汉字模糊、笔画丢失、结构错误等不足,且本发明模型可以从仅仅几百个训练样本中学习如何合成其余数千个具有相同风格的汉字字符。因此,本发明可以极大地降低制作大规模中文字库的成本,具有很大的实际应用价值。

    一种基于书写风格建模的中文字库自动生成方法

    公开(公告)号:CN106384094B

    公开(公告)日:2019-07-19

    申请号:CN201610828454.7

    申请日:2016-09-18

    Applicant: 北京大学

    Inventor: 连宙辉 肖建国

    Abstract: 本发明公布了一种基于书写风格建模的中文字库自动生成方法,通过对输入的手写体汉字图片进行笔画轨迹自动提取与错误结果筛除操作,得到训练数据,采用人工神经网络对手写体汉字笔画形状风格和笔画间架结构风格进行学习和建模,并通过统计分析得到书写笔画连接特性和笔画端部轮廓书写特征,生成与用户书写风格一致的高质量汉字字形。本发明使得只需书写少量常用汉字作为输入,无需任何人工干预,便可自动生成包含海量汉字字形的矢量中文字库,可为用户快速自动生成具备其书写风格的手写体中文字库,能够显著提高手写体中文字库的制作效率、大幅降低生产成本。

Patent Agency Ranking