一种基于全局和局部注意力机制的文本识别方法

    公开(公告)号:CN113705713B

    公开(公告)日:2023-08-22

    申请号:CN202111029998.4

    申请日:2021-09-03

    Abstract: 本发明公开了一种基于全局和局部注意力机制的文本识别方法,具体包括如下步骤:使用合成数据以及公开的真实文本行作为训练数据,使用真实场景下采集的文本行作为测试数据;对所有训练和测试样本进行数据预处理;采用有监督的方法训练识别模型,每个文本行都有对应的文本信息;采用卷积层和自注意力层等结构设计识别网络;将训练数据和标签输入到识别网络中进行训练;输入测试数据到训练完成的网络中,得到识别结果。本发明利用全局和局部注意力网络实现文本行识别,能够识别各种场景下复杂多样的联机和脱机文本,并在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。

    一种无人机机载二自由度增稳云台机构及无人机

    公开(公告)号:CN110525673A

    公开(公告)日:2019-12-03

    申请号:CN201910871599.9

    申请日:2019-09-16

    Inventor: 林上港 金连文

    Abstract: 本发明公开了一种无人机机载二自由度增稳云台机构及无人机,该云台机构包括上支承板、定位孔、减震球体、下支承板、连接臂倒U型支架、两根左侧对称连接臂、两根右侧对称连接臂、横滚角调节舵机U型支架、俯仰角调节舵机U型支架、横滚角调节舵机、俯仰角调节舵机、横滚角调节舵机侧部倒左U型支架、横滚角调节舵机底部倒U型支架、俯仰角调节舵机顶部U型支架、俯仰角调节舵机底部倒U型支架、摄像机平台U型支架、摄像机以及角度控制单元。本发明的云台机构可以实现俯仰角和横滚角的二自由度角度调整,并且减震效果良好。

    一种基于强化学习的古籍文字精准检测方法

    公开(公告)号:CN111507247B

    公开(公告)日:2023-04-18

    申请号:CN202010298651.9

    申请日:2020-04-16

    Abstract: 本发明公开一种基于强化学习的古籍文字精准检测方法,包括步骤S1、数据获取,收集古籍文献的图像数据,并进行单字标注,形成古籍文献数据集;步骤S2、文字粗检测,采用基于深度神经网络的目标检测算法构建粗检测器,通过步骤S1得到的古籍文献数据集对粗检测器进行训练,基于训练后的粗检测器对古籍文献进行文字粗检测;步骤S3、文字精调,基于深度神经网络构建强化学习智能体,将文字粗检测结果作为强化学习智能体的输入,选取基于价值函数的方法,设计奖励函数来训练强化学习智能体,通过训练后的强化学习智能体进行古籍文献的文字检测。本发明通过强化学习来进一步提高文字检测精度,为古籍文字的研究提供了有力的帮助。

    一种文本识别中识别网络与语言模型的联合优化方法

    公开(公告)号:CN113704477A

    公开(公告)日:2021-11-26

    申请号:CN202111030020.X

    申请日:2021-09-03

    Abstract: 本发明公开了一种文本识别中识别网络与语言模型的联合优化方法,包括:采集文本数据,将文本数据划分为训练集和测试集,并设置文本行标签;构建识别网络,将文本数据输入识别网络,获得第一概率分布;构建语言模型,将概率分布输入语言模型,通过建模语义,获得第二概率分布;将训练集和文本行标签输入由识别网络和语言模型串联组成的网络进行训练,获得目标网络;将测试集和文本行标签输入目标网络,获得识别结果。本发明利用识别网络和语言模型的联合优化,大大提升了识别的精度,并且适用于不同机制的识别网络。该方案在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。

    一种基于样本合成以及排序学习的联机签名鉴定方法

    公开(公告)号:CN112699349A

    公开(公告)日:2021-04-23

    申请号:CN202011566442.4

    申请日:2020-12-25

    Abstract: 本发明公开了一种基于样本合成以及排序学习的联机签名鉴定方法。所述方法包括以下步骤:采集签名序列并进行预处理;建立签名序列的Sigma Lognormal拟合模型;对拟合参数增加扰动采样合成真实签名以及伪造签名;进行排序学习优化平均精度损失训练神经网络模型参数;对于待鉴定签名序列,利用训练完成的神经网络模型提取特征并进行归一化,计算特征向量间欧式距离判断真伪。本发明解决了联机签名鉴别任务中伪造样本难以获取的困难,使用Sigma Lognormal模型生成样本,不再依赖于伪造签名数据的采集,并且进行排序学习以学习签名样本间的相关性和相似度信息,实现了高精度的联机签名鉴定方法,具有准确率高、适应性好等特点,具有较好的实用价值。

    一种无人机与无人地面机器人协作循径避障系统及其方法

    公开(公告)号:CN109901580A

    公开(公告)日:2019-06-18

    申请号:CN201910188193.0

    申请日:2019-03-13

    Inventor: 林上港 金连文

    Abstract: 本发明公开了一种无人机与无人地面机器人协作循径避障系统及其方法,该系统包括均设有无线通信模块、GPS模块和动力模块的无人机和无人地面机器人,无人机还包括飞行控制单元、机载计算处理单元、多传感器融合惯性导航模块和摄像机;无人地面机器人还包括机载控制单元、障碍物检测模块和导航模块;该避障方法为:摄像机将拍摄的图像传输至机载计算处理单元,识别道路障碍物后生成可通行路径并对无人地面机器人准确定位,将规划得到的前进避障路线传输至无线地面机器人进行导航控制,同时,障碍物检测模块将障碍物位置和方位信息回传至机载计算处理单元更新路线,使无人地面机器人能够在复杂环境中自主导航,提高了循径避障的成功率和稳定性。

    无人机运输箱用的机臂无损开合式夹扣装置

    公开(公告)号:CN112607200B

    公开(公告)日:2024-03-26

    申请号:CN202011533265.X

    申请日:2020-12-22

    Inventor: 林上港 金连文

    Abstract: 本发明公开了一种无人机运输箱用的机臂无损开合式夹扣装置,包括无损开合式夹扣机构、夹扣机构承托横梁、高度调节竿和运输箱壳体;无损开合式夹扣机构包括直角承托夹板、可摆动夹板、夹板连接螺杆、马蹄形支架、马蹄形支架紧固螺钉、马蹄形开合扳手、支架轴孔连接螺杆、可摆动铜扣环和双侧缓冲软胶片。本发明通过无损固定无人机的机臂,在运输过程中防止无人机在运输箱壳体内发生碰撞,保证无人机在运输过程中的完整性,并且具有良好的减震性能。

    基于残差卷积和递归神经网络的中文场景文本行识别方法

    公开(公告)号:CN109948714B

    公开(公告)日:2022-11-29

    申请号:CN201910221267.6

    申请日:2019-03-22

    Abstract: 本发明公开了基于残差卷积和递归神经网络的中文场景文本行识别方法,包括以下步骤:收集中文场景文本训练图像、对训练图像尺寸做归一化处理、对训练图像做数据增广处理、设计残差卷积神经网络、残差递归神经网络和CTC模型、对水平文本行和竖直文本行训练以及选择取置信度较高的结果为识别结果;本发明通过将卷积神经网络和递归神经网络结合起来,解决中文场景文本行识别的问题,避免了对文本行进行字符分割以及误分割带来的错误识别,通过在卷积神经网络和递归神经网络中加入了残差连接可加速模型的训练,从而得到实用的中文场景文本识别模型,且具有鲁棒性强,能够识别复杂背景、复杂光照和多种字体的中文文本行。

    一种文档图像几何校正方法、系统、装置及介质

    公开(公告)号:CN114418869A

    公开(公告)日:2022-04-29

    申请号:CN202111584077.4

    申请日:2021-12-22

    Abstract: 本发明公开了一种文档图像几何校正方法、系统、装置及介质,其中方法包括:获取第一文档图像,对第一文档图像中的像素进行分类,区分文档图像中前景文档区域和环境边界区域,获取前景文档区域的掩膜图;在掩模图上提取控制点,根据控制点对第一文档图像进行初步矫正,删除环境边界,获得初步矫正并删除环境边界的第二文档图像;获取第二文档图像的第一坐标偏移矩阵,根据第一坐标偏移矩阵对第二文档图像进行偏移后,获得矫正后的第三文档图像。本发明能够处理具有不同环境边界区域的拍摄文档图像,包括具有较小的环境边界区域、具有较大的环境边界区域或者不具有环境边界区域的情况。本发明可广泛应用于模式识别与人工智能技术领域。

Patent Agency Ranking