-
公开(公告)号:CN117115541A
公开(公告)日:2023-11-24
申请号:CN202311104552.2
申请日:2023-08-30
Applicant: 广东工业大学
IPC: G06V10/764 , G06T7/00 , G06V10/75 , G06V10/25 , G06N3/0464 , G06N3/08 , G06V10/26 , G06V10/82
Abstract: 本发明涉及喷印工业检测技术领域,特别是涉及一种喷墨打印的缺陷检测方法和系统。包括:将待检测图像划分为多个图像块,将图像块逐个输入Transformer中,将获得的特征向量输入特征描述器,获得并存储面向目标训练集的特征向量,将特征向量与记忆库中存储的特征向量进行匹配,根据匹配结果判断待检测图像是否有缺陷和获得图像块对应标签,将待检测图像分别输入注意力机制和类激活图网络,将获得的注意力权重矩阵和类激活图进行点乘,获得特征热图,使用全连接层分类特征热图,使用损失函数约束特征热图,获得精确特征热图,裁剪精确特征热图,将获得的特征热图块逐个输入卷积神经网络,获得检测结果,本发明提高了喷印缺陷检测的准确率和效率。
-
公开(公告)号:CN117094308A
公开(公告)日:2023-11-21
申请号:CN202311076463.1
申请日:2023-08-24
Applicant: 广东工业大学
IPC: G06F40/211 , G06F40/295 , G06F40/30 , G06N3/0464 , G06N3/08 , G06N3/048
Abstract: 本发明公开了一种结直肠癌病理文本关系抽取方法,包括以下步骤:S1:对文本进行双流特征提取;S2:对提取到的双流特征进行基于特征分解的多任务提取,得到主客体和关系;S3:利用提取到的主客体和关系用三仿射机制进行三元组对齐。本发明使用双流特征提取、多任务分解的病理文本关系抽取和根据三仿射得分来生成三元组,解决了三元组的提取准确率低、未考虑关系和主客体之间特征的独立性和关联性和没有进一步地考虑关系与主客体之间的信息交互的问题。
-
公开(公告)号:CN117057354A
公开(公告)日:2023-11-14
申请号:CN202311093406.4
申请日:2023-08-28
Applicant: 广州华银医学检验中心有限公司 , 广东工业大学
IPC: G06F40/295 , G06N3/0464 , G06F18/25
Abstract: 本发明公开了一种结直肠肿瘤病理文本的实体识别方法、装置、设备及介质。该方法包括:将待测结直肠肿瘤病理文本输入到预先训练完成的目标实体识别模型中;通过目标实体识别模型中的短实体识别网络,基于输入的待测结直肠肿瘤病理文本,确定短实体特征;通过目标实体识别模型中的长实体识别网络,基于短实体识别网络输出的短实体特征,确定长实体特征;通过目标实体识别模型中的特征融合网络,基于短实体识别网络输出的短实体特征以及长实体识别网络输出的长实体特征,输出待测结直肠肿瘤病理文本对应的目标实体识别数据。本发明实施例提高了结直肠肿瘤病理文本的实体识别的识别质量。
-
公开(公告)号:CN115713480A
公开(公告)日:2023-02-24
申请号:CN202210243487.0
申请日:2022-03-11
Applicant: 广东工业大学
Abstract: 本发明提供一种集成电路金属封装深度学习缺陷检测方法,该方法首先设计带Transformer的多尺度生成对抗网络GAN,将其命名为MST‑GAN,用于在多个尺度上捕获样本的内在模式,生成多尺度无缺陷模板;然后,设计多尺度权重掩膜来抑制多尺度差分图像中的重建误差;最后在线检测阈值图像中的潜在缺陷并得到缺陷定位;该方法解决了以往GAN会在生成模板中引入大量干扰噪声的问题。提出多尺度权重掩膜方案用于抑制重建误差,提出多尺度自适应阈值,用于突出加权图像的潜在缺陷,提出基于图像块的多尺度缺陷评估方案,对阈值化后多尺度图像的潜在缺陷进行多尺度的充分评估。
-
公开(公告)号:CN113989604A
公开(公告)日:2022-01-28
申请号:CN202111370406.5
申请日:2021-11-18
Applicant: 广东工业大学
IPC: G06V10/80 , G06V10/82 , G06V20/62 , G06V30/146 , G06V30/148 , G06K9/62 , G06T3/00 , G06N3/04
Abstract: 本发明公开了一种基于端到端深度学习的轮胎DOT信息识别方法,包括步骤如下:将轮胎图像进行特征提取,分别得到N个阶段输出的第一特征图,同时将N个阶段输出的第一特征图进行特征融合得到第二特征图;对融合后的第二特征图进行DOT信息粗略定位,用于检测是否有“DOT”三个字符及其位置信息,得到区域图;将区域图生成一个掩膜图,并与第二特征图相乘,对相乘得到的第三特征图进行DOT信息精细定位,得到DOT信息文本概率和位置信息,定位到有角度的候选文本块;对最后一个阶段输出的第一特征图进行轮胎弯曲方向检测,获取轮胎胎面的字符方向信息;将候选文本块和轮胎胎面的字符方向信息进行仿射变换,转化为方向向上的水平文本块;对水平文本块输入基于深度学习的文本识别网络进行DOT字符识别,得到最后的识别信息。
-
公开(公告)号:CN117114000A
公开(公告)日:2023-11-24
申请号:CN202311093625.2
申请日:2023-08-28
Applicant: 广东工业大学
IPC: G06F40/295 , G06F40/30 , G06N3/045 , G06N3/0442 , G06N3/0464 , G16H50/70
Abstract: 本发明公开了一种结直肠肿瘤病理文本命名实体识别方法及系统,该方法包括:通过SoftLexicon模型和BigBird模型对结直肠肿瘤病理文本进行特征提取,获得多层次相同维度大小的语义特征;为了实现边界的检测,提出一个多层次边界信息检测模型,采用卷积神经网络将多层次的语义信息特征融合为复合语义特征,并使用双仿射注意力网络单元获取命名实体的局部语义信息特征;通过多层次语义特征融合注意力机制模型,将文本低层次、中层次和高层次的语义信息通过注意力机制融合获得文本的全局语义信息特征。局部语义信息特征和全局语义信息特征的拼接后通过条件随机场学习进行命名实体识别,提高了命名实体识别的准确率和鲁棒性。
-
公开(公告)号:CN114119547A
公开(公告)日:2022-03-01
申请号:CN202111417005.0
申请日:2021-11-19
Applicant: 广东工业大学
IPC: G06T7/00 , G06T7/11 , G06T7/12 , G06T7/13 , G06T7/62 , G06N3/08 , G06N3/04 , G06K9/62 , G06V10/764
Abstract: 本发明提供一种三维肝胆管图像分割算法及系统,该方法通过先构建残差网络ResNet‑3D来处理输入图像序列,得到输入图像序列的残差网络ResNet‑3D低层特征和高层特征;然后,构建多尺度注意力网络,来学习得到的低层特征和高层特征之间的关联性;接着,构建特征解码网络,将经过处理后的低层特征和高层特图进行融合;最后,构建损失函数,对得到的结果进行处理得到最终分割结果。本发明引入的多尺度注意力模块能显著增强不同尺度感兴趣特征提取的性能;采用新的偏置损失函数,在准确识别显著胆管区域的同时,能有效识别胆管的边缘特征,提高分割准确率。
-
公开(公告)号:CN112734748B
公开(公告)日:2022-05-17
申请号:CN202110083764.1
申请日:2021-01-21
Applicant: 广东工业大学
Abstract: 本申请公开了一种肝胆管及胆道结石的图像分割系统,在第一编码器‑解码器中,在下采样阶段对小目标区域进行特征学习,并在上采样阶段进行特征融合,并且下采样提取了低层多尺度时域上下文特征,用于后续的逐层特征融合;在第二编码器‑解码器模块中,上采样阶段融合了低层多尺度时域上下文特征与高层双向时域上下文特征,并获得原始分辨率尺寸的预测序列图,从而获得更准确的位置和分类信息;通过改进的损失函数对分割网络模型进行训练,以增加序列图像切片间时域上下文信息的关注,使之更适应于处理序列图像。从而解决了现有技术对于肝胆管结石病的CT图像中的肝胆管及胆道结石分割,不能同时兼顾精确度和高效率的技术问题。
-
公开(公告)号:CN113989604B
公开(公告)日:2024-06-25
申请号:CN202111370406.5
申请日:2021-11-18
Applicant: 广东工业大学
IPC: G06V10/80 , G06V10/82 , G06V20/62 , G06V30/146 , G06V30/148 , G06T3/02 , G06N3/0442 , G06N3/0464
Abstract: 本发明公开了一种基于端到端深度学习的轮胎DOT信息识别方法,包括步骤如下:将轮胎图像进行特征提取,分别得到N个阶段输出的第一特征图,同时将N个阶段输出的第一特征图进行特征融合得到第二特征图;对融合后的第二特征图进行DOT信息粗略定位,用于检测是否有“DOT”三个字符及其位置信息,得到区域图;将区域图生成一个掩膜图,并与第二特征图相乘,对相乘得到的第三特征图进行DOT信息精细定位,得到DOT信息文本概率和位置信息,定位到有角度的候选文本块;对最后一个阶段输出的第一特征图进行轮胎弯曲方向检测,获取轮胎胎面的字符方向信息;将候选文本块和轮胎胎面的字符方向信息进行仿射变换,转化为方向向上的水平文本块;对水平文本块输入基于深度学习的文本识别网络进行DOT字符识别,得到最后的识别信息。
-
公开(公告)号:CN118014074A
公开(公告)日:2024-05-10
申请号:CN202410018672.9
申请日:2024-01-04
Applicant: 广东工业大学 , 广州华银医学检验中心有限公司
IPC: G06N5/025 , G06N5/02 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/08 , G06F16/36 , G06F16/35 , G06F40/30
Abstract: 本发明公开了一种复杂文本关系抽取深度学习方法,包括:获取文本数据和标签;使用知识图谱处理文本数据和标签,生成关系嵌入;根据预设的分类规则对标签进行分类,得到多个模块;对模块提取隐藏特征,利用预训练好的模型提取模块的第一语义特征和第二语义特征,并结合隐藏特征,采用注意力机制提取模块的第三语义特征;利用提取到的第三语义特征经过线性层和激活函数抽取头实体和尾实体;将头实体和尾实体分别进行平均池化后相加,利用双仿射和关系嵌入进行融合实现三元组的对齐。本发明使用知识图谱生成关系嵌入,能从知识图谱中学习领域知识信息,对双仿射抽取提供实体和关系之间的特征信息,使得模型训练更加稳定和提高模型的鲁棒性。
-
-
-
-
-
-
-
-
-