-
公开(公告)号:CN112464781A
公开(公告)日:2021-03-09
申请号:CN202011328157.9
申请日:2020-11-24
Applicant: 厦门理工学院
Abstract: 本发明涉及一种基于图神经网络的文档图像关键信息提取及匹配方法,包括以下步骤:步骤1:构建用于获取关键文本所在区域边框位置的关键文本信息检测模型;步骤2:构建用于识别文字边框内的文字关键文本识别模型;步骤3:将待提取信息的文档图像依次通过关键文本信息检测模型和关键文本识别模型,获取全部子图的文字识别结果;步骤4:以关键文本边框为节点构建图,以图神经网络为基础网络分别对于每个文本框的节点进行聚合,并预测节点的关键文本节点类型;步骤5:以正则表达式以及领域规则库的方式修正关键文本的识别结果,并得到最终的提取及匹配结果。本发明实现高效提取文档图像中的关键元素,并且准确地为关键元素匹配相应键值。
-
公开(公告)号:CN118711191A
公开(公告)日:2024-09-27
申请号:CN202410510028.3
申请日:2024-04-26
Applicant: 厦门理工学院 , 福建火炬电子科技股份有限公司
IPC: G06V30/16 , G06V30/14 , G06V30/148 , G06V30/18 , G06V30/19 , G06V30/41 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/048
Abstract: 本发明提出一种应用于扭曲文档的文档图像校正方法及其装置,包括:构建并训练获得基于几何失真和照明表征的文档图像校正模型;将待检测的文档图像信息输入获得的所述校正模型中,得到几何校正后的文档图像,再根据所述文档图像所受的环境光信息区分是否需要进行亮度表征学习;对于所受的环境光信息很差的文档图像,将经过几何表示学习后把图像输入到亮度表征模型中,得到亮度表征学习后的文档图像;对于照明条件良好的图像,则不需要进行亮度表征学习;将输出的文档图像结果,输出至下游任务进行文字识别或者关键信息提取处理。实现对歪曲的和环境光差的文档图像分别进行几何表示和亮度表征学习;同时引入多层注意力机制提高文档图像校正的精度。
-
公开(公告)号:CN118606498A
公开(公告)日:2024-09-06
申请号:CN202410709765.6
申请日:2024-06-03
Applicant: 福建火炬电子科技股份有限公司 , 厦门理工学院
IPC: G06F16/532 , G06F16/51 , G06F16/583 , G06F16/55 , G06F40/30 , G06F18/25 , G06F18/213 , G06F18/2433 , G06N3/0464 , G06N3/0455 , G06N3/048
Abstract: 本发明公开一种基于文本图像对齐的电容检测报告文档检索方法,提取文档图像的语义特征#imgabs0#和待搜索关键字的语义特征#imgabs1#;图像语义特征#imgabs2#和文本语义特征#imgabs3#融合得到自注意力对齐修正后的概率特征图#imgabs4#;基于所述概率特征图#imgabs5#通过设定阈值Hr得到文档图像的二值图Bm,获取文本框位置;基于概率特征图#imgabs6#通过设定阈值Ht进行特征选择,提取每个文本行的特征区域,构建出概率特征图#imgabs7#上所有存在文本的选择特征集合;基于所述选择特征集合进行GLR预测,得到包含待搜索关键字的位置信息,将位置信息映射到二值图Bm的文本框中,从而得到待搜索关键字在所述输入的文档图像中的位置。此种方法能够实现高效准确地对电容检测报告进行关键词检索和定位。
-
公开(公告)号:CN108763817B
公开(公告)日:2022-06-21
申请号:CN201810593966.9
申请日:2018-06-11
Applicant: 厦门理工学院
IPC: G06F30/18
Abstract: 本发明公开一种基于最小二乘法建模的电力地下管网匹配方法,步骤是:输入原始管线以及普查管线,采用插值点方法对于两条管线进行插值处理;通过加入插值方法,用以增加管线的特征向量,缓解特征向量稀疏问题;基于最小二乘法建模,对经插值处理后的原始管线以及普查管线进行特征提取;对提取的特征向量分别进行过滤,去除拐角特征向量;分别对原始管线和普查管线的特征进行归一化处理,然后将二者进行比较,如果差值在阈值范围内,则保留原有原始管线的拓扑属性数据,使用普查管线的坐标代替原始数据的坐标;如果不在阈值范围内,则为存疑管线,不处理。此种方法可高效准确地解决新旧电力管线的匹配问题。
-
公开(公告)号:CN118609147A
公开(公告)日:2024-09-06
申请号:CN202410511895.9
申请日:2024-04-26
Applicant: 厦门理工学院 , 福建火炬电子科技股份有限公司
IPC: G06V30/412 , G06V30/18 , G06V30/19 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本申请提出了一种基于掩码注意力的电容检验报告表格识别方法,包括:S1、输入含有电容检验报告表格的图像,并对输入的图像进行特征提取;S2、对提取的图像特征进行卷积得到不同尺寸的图像特征,融合不同尺寸的图像特征,并对融合后的图像特征进行反卷积得到适应三个不同尺寸的特征图;S3、对特征图进行n级解码并输出每个单元信息的14个属性。该方法采用了掩码注意力机制的编解码特征学习机制,模型可以直接输出表格的表格结构信息,从而通过后处理可以构造出电容检验报告的完整表格信息,具备准确高效的应用效果,大大提高了电容检验报告分析工作效率和分析报告的准确性。
-
公开(公告)号:CN108763817A
公开(公告)日:2018-11-06
申请号:CN201810593966.9
申请日:2018-06-11
Applicant: 厦门理工学院
IPC: G06F17/50
CPC classification number: G06F17/509
Abstract: 本发明公开一种基于最小二乘法建模的电力地下管网匹配方法,步骤是:输入原始管线以及普查管线,采用插值点方法对于两条管线进行插值处理;通过加入插值方法,用以增加管线的特征向量,缓解特征向量稀疏问题;基于最小二乘法建模,对经插值处理后的原始管线以及普查管线进行特征提取;对提取的特征向量分别进行过滤,去除拐角特征向量;分别对原始管线和普查管线的特征进行归一化处理,然后将二者进行比较,如果差值在阈值范围内,则保留原有原始管线的拓扑属性数据,使用普查管线的坐标代替原始数据的坐标;如果不在阈值范围内,则为存疑管线,不处理。此种方法可高效准确地解决新旧电力管线的匹配问题。
-
公开(公告)号:CN118606849A
公开(公告)日:2024-09-06
申请号:CN202410511896.3
申请日:2024-04-26
Applicant: 厦门理工学院 , 福建火炬电子科技股份有限公司
IPC: G06F18/2433 , G06F18/10 , G06F18/214 , G06F40/186 , G06F40/177
Abstract: 本申请提出了一种陶瓷电容检测与分析报告自动化生成方法,包括:S1、按照统一的时间戳采集初始数据,初始数据为待测陶瓷电容的性能指标数据,并对初始数据进行预处理;S2、利用多维时间序列异常检测可解释性方法对预处理后的初始数据进行AI训练,得到检测分析模型,检测分析模型由基于深度学习异常检测方法及可解释性方法搭建;S3、利用检测分析模型对经过预处理的初始数据进行分析;S4、根据选择的报告样式生成分析报告并输出。该方法能够利用多维时间序列异常检测可解释性方法自动对陶瓷电容的检测数据进行异常检测分析,生成一份详尽且精确的分析报告,还可以展示生成的陶瓷电容检测与分析报告和提供用户交互功能。
-
公开(公告)号:CN112464781B
公开(公告)日:2023-06-02
申请号:CN202011328157.9
申请日:2020-11-24
Applicant: 厦门理工学院
IPC: G06V30/413 , G06V20/62 , G06V10/82 , G06N3/042 , G06N3/049
Abstract: 本发明涉及一种基于图神经网络的文档图像关键信息提取及匹配方法,包括以下步骤:步骤1:构建用于获取关键文本所在区域边框位置的关键文本信息检测模型;步骤2:构建用于识别文字边框内的文字关键文本识别模型;步骤3:将待提取信息的文档图像依次通过关键文本信息检测模型和关键文本识别模型,获取全部子图的文字识别结果;步骤4:以关键文本边框为节点构建图,以图神经网络为基础网络分别对于每个文本框的节点进行聚合,并预测节点的关键文本节点类型;步骤5:以正则表达式以及领域规则库的方式修正关键文本的识别结果,并得到最终的提取及匹配结果。本发明实现高效提取文档图像中的关键元素,并且准确地为关键元素匹配相应键值。
-
公开(公告)号:CN108427842B
公开(公告)日:2022-02-22
申请号:CN201810203514.5
申请日:2018-03-13
Applicant: 厦门理工学院
Abstract: 本发明公开一种基于插值点缓冲区的电力管网管线核查方法,步骤是:首先对L1、L2进行插值处理,判断L2上有无与L1的任一端点距离小于插值距离的地理点,若有,则继续判断该点F是否L2的端点,若是,且L2上与点F相邻的地理点与L1的任一非端点的地理点距离小于插值距离,L2上的地理点与L1的另一个端点的距离均不小于插值距离,表示两条电力管线位置合理;若点F是L2的端点,且F点相邻的地理点与L1非端点的地理点距离不小于插值距离,或点F不是L2的端点,则判断L1上有无与L2的任一端点距离小于插值距离的地理点,若存在,则表示两条电力管线存在重复线段。此种方法可高效准确地更新地下管网系统数据,提高管网传输系统的管理时效性。
-
公开(公告)号:CN108427842A
公开(公告)日:2018-08-21
申请号:CN201810203514.5
申请日:2018-03-13
Applicant: 厦门理工学院
Abstract: 本发明公开一种基于插值点缓冲区的电力管网管线核查方法,步骤是:首先对L1、L2进行插值处理,判断L2上有无与L1的任一端点距离小于插值距离的地理点,若有,则继续判断该点F是否L2的端点,若是,且L2上与点F相邻的地理点与L1的任一非端点的地理点距离小于插值距离,L2上的地理点与L1的另一个端点的距离均不小于插值距离,表示两条电力管线位置合理;若点F是L2的端点,且F点相邻的地理点与L1非端点的地理点距离不小于插值距离,或点F不是L2的端点,则判断L1上有无与L2的任一端点距离小于插值距离的地理点,若存在,则表示两条电力管线存在重复线段。此种方法可高效准确地更新地下管网系统数据,提高管网传输系统的管理时效性。
-
-
-
-
-
-
-
-
-