-
公开(公告)号:CN117351003B
公开(公告)日:2024-02-23
申请号:CN202311579723.7
申请日:2023-11-24
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于视频动作的多模型集成多相位MRI肿瘤分类方法,包括以下步骤:步骤1,对MRI肿瘤病例数进行划分处理与对MRI三维图像进行预处理;步骤2,通过分类模型获取MRI三维图像的特征图;步骤3,对特征图进行融合并映射到输出类别中得到预测结果;步骤4,重复步骤2和步骤3,获取多个独立且对不同类别具有不同分类能力的模型的预测结果;步骤5,集成多个模型的预测结果从而得到最终的多相位MRI肿瘤分类结果;得到更具鲁棒性和更精准的预测结果,使自动诊断多相位MRI肿瘤分类结果的精准度进一步提高,有效的缓解了医疗数据集中、数据量少、数据集不平衡的问题。
-
公开(公告)号:CN114782961B
公开(公告)日:2023-04-18
申请号:CN202210285238.8
申请日:2022-03-23
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
IPC: G06V30/19 , G06T3/00 , G06N3/0464 , G06N3/048 , G06N3/094
Abstract: 本发明公开了一种基于形状变换的字符图像增广方法,包括以下步骤:构建形状变换生成对抗网络,包括生成器和判别器;以原始字符图像作为生成器的输入,经过空间变换之后产生形变的字符图像,将生成器的输出端与判别器的输入端连接,同时,将目标字符图像输入到判别器的另一个输入端,判别器输出对形变的字符图像和目标字符图像的判别结果;训练所述的形状变换生成对抗网络;使用训练好的生成器生成增广后的字符图像。本发明方法结合仿射矩阵和TPS变换采样网格参数使STN能够同时产生全局和局部的形状变化,能够更好的拟合字符的形状特征,使产生的字符真实性和多样性更好,使用增广后的数据所训练的分类器的分类性能进一步提升。
-
公开(公告)号:CN115618154A
公开(公告)日:2023-01-17
申请号:CN202211632718.3
申请日:2022-12-19
Applicant: 华南理工大学
IPC: G06F16/958
Abstract: 本发明公开了一种表格的标记语言标签与单元格锚框鲁棒对齐方法,方法包括:解析HTML结构字符串,得到td标签的行号、列号、跨行数目以及跨列数目;基于单元格的Bbox的竖直方向的坐标位置关系,为每个Bbox分配行号,并根据水平方向的坐标位置关系将Bbox从左至右进行排序;进行匹配行的各Bbox标签的分配;基于匹配行,根据水平方向的坐标位置关系,对所有未匹配行中的Bbox的列号进行投票,投票数最多的列号作为Bbox列号的预测结果,基于列号将Bbox与同行的td标签进行对齐,进行未匹配行的各Bbox标签的分配;由此得到整个表格各Bbox的行号、列号、跨行数目以及跨列数目的分配结果。
-
公开(公告)号:CN114511853B
公开(公告)日:2022-07-12
申请号:CN202210417388.X
申请日:2022-04-21
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
Abstract: 本发明公开了一种文字图像书写轨迹恢复效果判别方法,包括:对原始文字图像进行掩膜化操作并二值化处理得到输入图像掩膜;将恢复轨迹渲染得到恢复轨迹掩膜;恢复轨迹掩膜逐步进行多次膨胀操作,得到多个膨胀掩膜;采用交并比计算方法,分别计算恢复轨迹掩膜以及多个膨胀掩膜与输入图像掩膜的IoU分数;计算出的数值最大的IoU分数作为DloU分数,所述DloU分数为最终判别结果。本发明方法设计交并比计算方法,计算输入图像掩膜和恢复轨迹掩膜的相似度,设计动态膨胀机制,将恢复轨迹掩膜和膨胀掩膜分别与输入图像掩膜计算交并比分数,使用动态交并比分数消除输入文字图像笔画宽度对字形保真程度评价的影响。
-
公开(公告)号:CN114494003B
公开(公告)日:2022-06-21
申请号:CN202210336338.9
申请日:2022-04-01
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
Abstract: 本发明公开了一种联合形状变换和纹理转换的古文字生成方法,包括:构建形状变换生成对抗网络A,包括生成器A1和判别器A2;构建纹理转换生成对抗网络B,包括生成器B1、判别器B2、生成器B3和判别器B4,纹理转换生成对抗网络B为循环生成对抗网络;将形状变换生成对抗网络A和纹理转换生成对抗网络B进行连接,获得摄影古文字生成网络模型;联合训练摄影古文字生成网络模型中的形状变换生成对抗网络A和纹理转换生成对抗网络B;使用训练好的生成器A1和生成器B1,将生成器A1的输出端与生成器B1输入端相连,获得摄影古文字图像生成器;采用所述的摄影古文字图像生成器进行古文字生成。
-
公开(公告)号:CN114494003A
公开(公告)日:2022-05-13
申请号:CN202210336338.9
申请日:2022-04-01
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
Abstract: 本发明公开了一种联合形状变换和纹理转换的古文字生成方法,包括:构建形状变换生成对抗网络A,包括生成器A1和判别器A2;构建纹理转换生成对抗网络B,包括生成器B1、判别器B2、生成器B3和判别器B4,纹理转换生成对抗网络B为循环生成对抗网络;将形状变换生成对抗网络A和纹理转换生成对抗网络B进行连接,获得摄影古文字生成网络模型;联合训练摄影古文字生成网络模型中的形状变换生成对抗网络A和纹理转换生成对抗网络B;使用训练好的生成器A1和生成器B1,将生成器A1的输出端与生成器B1输入端相连,获得摄影古文字图像生成器;采用所述的摄影古文字图像生成器进行古文字生成。
-
公开(公告)号:CN114387608A
公开(公告)日:2022-04-22
申请号:CN202210293274.9
申请日:2022-03-24
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
IPC: G06V30/412 , G06V30/414 , G06V30/19 , G06V30/26 , G06K9/62 , G06N3/04 , G06N3/08 , G06F40/151 , G06F40/143
Abstract: 本发明公开了一种联合卷积与图神经网络的表格结构识别方法,其特征在于,所述方法包括:构建联合卷积图神经网络,所述的联合卷积神经网络包括深度二维卷积神经网络、二维卷积神经网络和图神经网络;利用不确定度加权的多任务学习损失函数训练所述的联合卷积图神经网络;使用二维卷积神经网络预测表格各单元格中心点坐标,基于中心点构建表格结构的图,利用所述的图神经网络对图的每条边进行分类;后处理算法处理分好类的表格结构的图,得到各单元格的结构属性,并转换为描述表格结构的标记语言。本发明方法提供一种端到端可训练的基于图神经网络显示建模表格结构的方法来高效识别表格结构。
-
公开(公告)号:CN113807336A
公开(公告)日:2021-12-17
申请号:CN202110906651.7
申请日:2021-08-09
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
IPC: G06K9/20
Abstract: 本发明公开了一种图像文本检测半自动标注方法、系统、计算机设备及介质,所述方法包括:获取文本图像;从文本图像中获取文本中心线;生成N个围绕文本中心线的候选边界框;将N个候选文本区域同时输入宽松识别器和严苛识别器,通过宽松识别器将从N个候选文本区域中识别得到估计的文本内容,通过严苛识别器预测每个候选文本区域的内容识别结果;将N个内容识别结果与估计的文本内容相比,分别计算识别损失,得到N个识别损失;通过确定所有识别损失中最小损失的索引,获得最准确候选边界框的索引,进而得到最终的文本框标注;将文本框标注以识别损失为引导进行优化,最终得到紧致的文本框标注。本发明能够提高文本检测标注效率和标注效果。
-
公开(公告)号:CN111797834B
公开(公告)日:2021-06-15
申请号:CN202010469514.7
申请日:2020-05-28
Abstract: 本申请涉及一种文本识别方法、装置、计算机设备和存储介质。所述方法包括:获取原始文本图像;对所述原始文本图像进行图像预处理,得到处理后文本图像;利用特征编码网络中的残差卷积网络对所述处理后文本图像进行特征提取,得到图像特征;利用所述特征编码网络中的上下文感知网络对所述图像特征进行上下文编码,得到特征序列;对所述特征序列进行解码,得到目标文本。采用本方法能够提高文本识别的准确率。
-
公开(公告)号:CN111915540A
公开(公告)日:2020-11-10
申请号:CN202010553556.9
申请日:2020-06-17
Applicant: 华南理工大学
Abstract: 本发明公开了一种拓片甲骨文字符图像增广方法、系统、计算机设备及介质,所述方法包括:将临摹甲骨文字符图像集合输入字形增广模块进行随机形态处理,得到增广临摹甲骨文字符图像集合;构建风格迁移网络,以学习增广临摹甲骨文字符图像集合的分布到拓片甲骨文字符图像集合的分布之间的映射函数;将增广临摹甲骨文字符图像集合输入风格迁移网络进行处理,得到拓片甲骨文图像增广数据集;将拓片甲骨文字符图像集合与拓片甲骨文图像增广数据集混合,对拓片甲骨文字符识别网络进行训练。本发明可得到总数充足且类别平衡的增广数据集,以解决拓片甲骨文字符识别任务中的缺少训练数据的问题,利用增广数据集进行训练能够提升识别模型的精度。
-
-
-
-
-
-
-
-
-