-
公开(公告)号:CN117809123A
公开(公告)日:2024-04-02
申请号:CN202410227319.1
申请日:2024-02-29
Applicant: 南京信息工程大学
IPC: G06V10/764 , G06V10/26 , G06F16/51 , G06F16/532 , G06F16/583 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种双阶段图像的异常检测与重构方法及系统,方法包括:将输入图像输入至预设的图像分割模型获得异常掩码图#imgabs0#;将所述异常掩码图#imgabs1#中的伪异常区域所对应在输入图像的区域记为可疑异常区域#imgabs2#;将输入图像的可疑异常区域#imgabs3#替换为相似图像对应的区域获得叠加图像#imgabs4#;对叠加图像#imgabs5#进行灰度化处理后输入预设的图像重构模型获得重构图像#imgabs6#;逐像素比较重构图像#imgabs7#与输入图像之间的差异获得异常得分,根据异常得分对输入图像的异常区域进行定位和判断;本发明不仅可以重构正常图片细节,还可以有效重构大面积的异常,进而增加整体的异常检测精度。
-
公开(公告)号:CN116385807A
公开(公告)日:2023-07-04
申请号:CN202310621436.1
申请日:2023-05-30
Applicant: 南京信息工程大学
IPC: G06V10/764 , G06V10/56 , G06V10/26
Abstract: 本发明公开了一种异常图像样本生成方法及装置,步骤1:获取标准化图像;步骤2:进行像素点采样;步骤3:进行分类确定标准化图像的颜色分布情况;步骤4:生成区域的位置以及生成异常的大小;步骤5:随机选取对应所述所需区域大小的区域,确定随机区域,接着确定随机区域的位置,并在此位置根据所述生成异常的大小生成方框;步骤6:为生成的方框随机添加颜色滤镜、增大、旋转、填充、变色中的一种操作;步骤7:在操作后的方框对应位置处随机选择一个方向,重复步骤4和步骤5若干次,扩展生成多个方框,将包括所有方框的标准化图像作为最终的模拟异常图像。优点:保证了模拟出的异常能够拟合实际中的异常情况,更好的完成异常检测任务。
-
公开(公告)号:CN114862890A
公开(公告)日:2022-08-05
申请号:CN202210582218.7
申请日:2022-05-26
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于改进LSD的磁极倒转图信息抽取方法,包括获取图片集;将所述图片集进行人工标注深度信息;通过sobel算子对所述标注过的图片集进行边缘检测;通过改进LSD算法对所述边缘图像进行线段检测;对所述线段进行筛选,得到边界线段集;将所述边界线段集依深度排序两两组合成磁极倒转区域,获得磁极倒转区域集合;对所述磁极倒转区域遍历每一个像素,获取该磁极倒转区域的磁性;使用所述深度信息与各磁极倒转区域的边界线段坐标,推算出各磁极倒转区域的深度信息;依据所述磁极倒转区域的磁性与各磁极倒转区域的深度信息,整合出该磁极倒转图的深度‑磁性数据,本发明提高了对磁极倒转区域边缘线段检测的准确度。
-
公开(公告)号:CN113609906A
公开(公告)日:2021-11-05
申请号:CN202110736883.2
申请日:2021-06-30
Applicant: 南京信息工程大学
Abstract: 本发明涉及一种面向文献的表格信息抽取方法,属于数据处理以及计算机视觉领域。该方法包括以下步骤:1:利用规则获取所有可能含表格的候选页面;2:将获取的页面转化为图片文件;3:采用深度学习方法,获取图片文件的特征;4:根据获取的图片文件的特征,对图片进行特征融合;获取融合后的特征;5:根据获取的特征融合后的特征,对表格的位置进行初步定位;6:针对获得的表格定位信息,根据表格元素的长宽关系,将横板表格旋转为竖版表格;7:根据获得的竖版表格,读取单元格字符流。本发明能自动对表格位置进行准确的定位,能够精确的从表格中读取表格的字符流。
-
公开(公告)号:CN113255493A
公开(公告)日:2021-08-13
申请号:CN202110533314.8
申请日:2021-05-17
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种融合视觉词和自注意力机制的视频目标分割方法,属于计算机视觉技术领域。该方法包括如下步骤:首先利用固定数量的视觉词来表示感兴趣的目标,即使一个对象作为一个整体可能会受到遮挡,变形,视点变化或者从同一视频中消失并重新出现,但其某些局部部分的外观仍会保持一致,因此使用视觉词可以实现更鲁棒的匹配。然后,我们将自注意力机制用于视觉单词匹配生成的相似图,以捕获不同相似图之间的依赖关系。最后,为了解决目标对象的外观变化和视觉词不匹配问题,提出了在线更新和全局匹配机制进一步提高准确率。本发明在部分视频场景中分割精度超出同类算法,同时分割效率有明显的提升。
-
公开(公告)号:CN119418345A
公开(公告)日:2025-02-11
申请号:CN202510025440.0
申请日:2025-01-08
Applicant: 南京信息工程大学
IPC: G06V30/148 , G06V30/19 , G06V30/18 , G06N3/0455
Abstract: 本申请涉及一种基于VMamba框架和通道‑空间注意力机制的场景文本检测方法、装置和计算机设备。该方法包括:获取包含文本的场景图像参考样本数据集和增强样本数据集;基于VMamba框架采用可变形卷积构建可变形VMamba特征编码器,获得各场景图像分别对应的多尺度文本实例特征图;采用插值和最大池化方法获得平衡特征图;基于通道‑空间注意力机制构建GASM模块,得到逐像素增强后的文本实例特征;构建傅里叶特征解码器,获得重构的文本实例轮廓;采用损失函数训练以增强样本数据集为输入、文本实例轮廓为输出的场景文本检测模型。采用本方法能够实现拥有全局感受野、快速收敛和精准定位的场景文本检测。
-
公开(公告)号:CN117474797B
公开(公告)日:2024-03-19
申请号:CN202311832535.0
申请日:2023-12-28
Applicant: 南京信息工程大学
IPC: G06T5/70 , G06T5/50 , G06T5/60 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种多尺度互补学习的图像去噪方法及装置,方法包括:步骤1:图像预处理之后得到标准化的基层和细节层;步骤2:将细节层输入细节特征学习分支得到第一个图像细节特征;步骤3:将细节层输入噪声学习分支得到第二个图像细节特征;步骤4:融合两个分支学习得到的图像细节特征;步骤5:将最终的图像细节特征和基层相加得到去噪后的图像;步骤6:计算损失并迭代训练,重复步骤2至步骤5并保存最优去噪模型;步骤7:将测试图像输入保存好的去噪模型进行测试。当噪声水平越高时,去噪模型的去噪效果越好,使噪声的去除和细节的保留之间达到良好的平衡。同时只使用了细节层参与去噪模型训练,极大减少了计算量。
-
公开(公告)号:CN117058450A
公开(公告)日:2023-11-14
申请号:CN202311012204.2
申请日:2023-08-10
Applicant: 南京信息工程大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于自适应掩码重构的异常检测方法及装置,该方法对于输入图片,通过策略添加异常部位后,使用自适应选择的掩码分别遮掩其三分之一,得到三张带有掩码的残差图,将这三张残差图分别进行重构后,得到三张重构后的图片,选择与输入图差别最大的图片作为最终的重构图片,再进行异常检测。本发明可以有效提高异常检测的准确度,同时提高异常定位的准确性。
-
公开(公告)号:CN115861256A
公开(公告)日:2023-03-28
申请号:CN202211617088.2
申请日:2022-12-15
Applicant: 南京信息工程大学
IPC: G06T7/00 , G06N3/08 , G06V10/44 , G06V10/774 , G06N3/0464
Abstract: 本发明公开了一种基于知识蒸馏结合图像重构的异常检测方法,将知识蒸馏与基于U型卷积神经网络的图像重构方法结合,利用Unet网络重构特征图来进一步指导学生网络学习正常像素的语义信息,建立可用于图像异常检测与异常定位的模型;该模型的教师网络为预先训练的图像分类强模型ResNet18,学生网络为Unet网络,结合多尺度特征匹配策略使学生网络能够同时利用低层特征、中层特征和高层特征的语义信息,从而允许检测各种尺度大小的异常。本发明能够减轻CNN对异常的泛化能力和弥补教师网络和学生网络之间出现的知识转移不完整、不正确等问题,有效提高异常检测的准确率和异常点定位的精度。
-
公开(公告)号:CN115712720A
公开(公告)日:2023-02-24
申请号:CN202210723816.1
申请日:2022-06-23
Applicant: 南京信息工程大学
IPC: G06F16/35 , G06F16/36 , G06F40/205 , G06F40/242 , G06F40/284 , G06F40/295 , G06F40/30 , G06Q50/26
Abstract: 本发明公开了一种基于知识图谱的降雨动态预警方法,属于知识图谱的技术领域和数据挖掘领域,其包括步骤1:通过动态实时多路下载有关区域降雨新闻数据;步骤2:根据步骤1的文本非结构化信息抽取城市地点信息,降雨信息时间等;步骤3:根据步骤2构建时‑空多维知识图谱,并实时去除冗余的降雨信息;步骤4:统计区域地势数据,通过聚类算法将区域地势数据进行动态分类;步骤5:根据步骤4的结果,对分类地区自动生成对应预警信息,标记具体位置并通知相关人员;通过该方法有利于提升整体的气象降雨数据关键词挖掘效率,减少人工标注所带来的时间成本,快速的为专家聚类出组合排列结果,对于降雨情况做出迅速反应。
-
-
-
-
-
-
-
-
-