-
公开(公告)号:CN117593602A
公开(公告)日:2024-02-23
申请号:CN202311515054.7
申请日:2023-11-15
IPC: G06V10/774 , G06V10/778 , G06V10/82 , G06N3/096
Abstract: 本发明提供一种基于非对称教师学生网络的知识蒸馏异常检测方法,包含构建工业产品正常样本训练集;搭建基于非对称教师学生网络的多尺度知识蒸馏网络,避免了因教师网络和学生网络结构高度相似导致的对于异常区域仍提取相似特征以至无法很好定位异常区域的问题,结合掩码特征重生成模块进一步加强学生网络的特征学习能力;将待检测的工业产品图像输入训练好的模型中,根据所得的异常分数和异常区域图,设定阈值得到图像异常判断结果和异常区域定位结果。该基于非对称教师学生网络的知识蒸馏异常检测方法,可用于自动化的工业质检系统进行工业产品的异常检测,避免高额的人力成本,能及时发现潜在的产品缺陷,避免进一步的安全、经济隐患。
-
公开(公告)号:CN117503139A
公开(公告)日:2024-02-06
申请号:CN202311694267.0
申请日:2023-12-12
IPC: A61B5/16
Abstract: 本发明涉及信息技术、医工交叉技术领域,且公开了一种基于视线估计的多范式孤独症辅助诊断方法,包括以下步骤,校准环节:被试者坐于设备前,观看出现在设备屏幕中的十三个校准点,数据采集,计算视线落点,特征提取和分类预测,实现孤独症儿童的辅助诊断。该基于视线估计的多范式孤独症辅助诊断方法,通过让被试者完成空白重叠、自由视图、监护人注视、空间线索四种范式的眼动任务,通过单目摄像头获取面部图像,输送至视线估计神经网络中,再将得到一系列视线落点输送到分类网络中,实现孤独症儿童的辅助诊断,解决现有的孤独症辅助诊断过程中效率低下、准确率低下、对操作人员的专业性要求高的问题。
-
公开(公告)号:CN116912500A
公开(公告)日:2023-10-20
申请号:CN202310961296.2
申请日:2023-08-02
IPC: G06V10/26 , G06V20/70 , G06V10/774 , G06V10/82 , G06N3/0464 , G06V20/05
Abstract: 本发明提供一种基于混合建模的轻量化前视声呐图像语义分割方法,包括模型搭建、训练、采集和预测等模块;模型搭建模块,使用混合建模网络作为主干网络提取特征,结合动态注意力门控模块和解码器搭建模型;训练模块,基于训练数据集进行训练;采集模块,获取新的前视声呐图像;预测模块,将新获取的前视声呐图像输入训练好的模型进行像素级类别预测,输出用于语义分割结果。本发明提出了准确度高、运行速度快、参数量少的前视声呐图像语义分割方法,可用于水下航行器识别水下物体,辅助水下物体抓取和避障。
-
公开(公告)号:CN119672422A
公开(公告)日:2025-03-21
申请号:CN202411746529.8
申请日:2024-12-02
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/098
Abstract: 本发明涉及一种专家注视点引导的基于视觉Transformer的胸片分类模型构建方法,属于胸片图像领域,构建专家注视点引导的基于视觉Transformer的胸片分类模型,能够利用专家注视点信息指导模型关注胸片中的潜在疾病区域;采用混合学习策略,通过在训练时选择一部分胸片图像样本及相应的专家注视点作为输入,而另一部分仅用胸片图像作为输入,使得模型可在推理阶段只需要胸片图像作为输入,采用包含专家注视点的胸片分类数据集,并基于其中专家注视点标注生成嵌入向量,完成对视觉Transformer的胸片分类模型的端到端训练。该构建系统、应用方法、终端及介质,将专家注视点特征与图像特征有效结合,具有预测效率高、成本低、易于实现、并且部署十分灵活等特点。
-
公开(公告)号:CN119131869A
公开(公告)日:2024-12-13
申请号:CN202411311178.8
申请日:2024-09-20
IPC: G06V40/16 , G06V40/18 , G06V10/774 , G06V10/25 , G06V10/766 , G06F17/14 , G06V10/82 , G06N3/0464
Abstract: 本发明提供了一种多任务视线估计模型的构建方法,包括;构建基于频域与空域交互的多任务视线估计模型。该多任务视线估计模型的构建方法,通过傅里叶变换在频域有效地实现具有图像大小的感受野的卷积,能够捕获全局依赖性以更好地利用图像中的小而复杂的局部特征;采用多任务学习策略,通过同时训练多个相关任务,使得模型能够共享不同任务之间的有用信息,从而提升每个任务的性能;采用已知的视线估计数据集,并基于其中的左右眼眼角标注生成的代表人眼区域的显著性图,完成对所述基于频域与空域交互的多任务视线估计模型的端到端训练;采用已知的视线估计数据集中的测试图像对训练后的基于频域与空域交互的多任务视线估计模型进行测试。
-
公开(公告)号:CN117478949A
公开(公告)日:2024-01-30
申请号:CN202311307902.5
申请日:2023-10-11
IPC: H04N21/439 , H04N21/44 , G06F18/24 , G06F18/25 , G06F18/214 , G06N3/0895 , G06V40/18 , G06V40/20 , G10L15/16 , G06V10/764 , G06V10/82 , G06V10/774 , G06V10/762
Abstract: 本发明提供了一种多模态架构的视听觉注意力预测模型的构建方法,针对视频这一种含有多感官刺激的媒介,包括:构建多模态架构的视听觉注意力预测模型,能够获取视频中音频特征以及图像静态和动态显著性特征;采用已知的图像眼动数据集对图像级的视觉注意力预测模型进行端到端预训练,将训练好的模型作为视听觉注意力模型的图像显著性特征提取层,将图像级的显著性信息融入到视听觉注意力预测模型当中;采用大数据预训练音频分类网络以及视频分类网络作为音频和视频的特征提取网络,通过自监督架构的音频和视觉特征融合模块充分融合两种模态的特征。该一种多模态架构的视听觉注意力预测模型的构建方法将视频的音频和图像时空特征有效结合,具有预测效率高,成本低,易于实现,并且部署十分灵活等特点。
-
公开(公告)号:CN119069115A
公开(公告)日:2024-12-03
申请号:CN202411230028.4
申请日:2024-09-04
IPC: G16H50/20 , G16H50/30 , G16H50/70 , G16H10/60 , G06V40/20 , G06V20/40 , G06V10/764 , G06V10/82 , G06V40/16 , G06N3/0442 , G06N3/049 , G06N3/084
Abstract: 本发明涉及一种基于头部姿态分析的孤独症行为特征预测方法,属于孤独症领域,包括以下步骤:S1、建立预处理和训练模型;S2、数据预处理;S3、分类数据集划分;S4、模型训练测试;S5、行为特征结果验证。该基于头部姿态分析的孤独症行为特征预测方法,通过使用儿童的头部姿态特征为LSTM深度学习网络模型提供训练数据,在时间序列的层面上,对人脸进行精确检测和跟踪,使模型能够准确捕捉头部姿态的动态变化,有效预测儿童的行为特征,提高预测的准确性。
-
公开(公告)号:CN118038529A
公开(公告)日:2024-05-14
申请号:CN202410302192.5
申请日:2024-03-18
Abstract: 本发明涉及图像技术领域,且公开了一种基于ViT和双眼特征融合网络的视线估计方法,包括以下步骤:步骤S1,首先,获取目标人员图像,目标人员以一定角度凝视屏幕,进行提取特征;步骤S2将图像分割为面部图像、左眼图像、右眼图像和面部边界框位置信息;步骤S3将其输送至视线估计网络中,利用基于卷积神经网络的双眼特征融合模块和基于Vi T的面部特征提取模块提取眼脸特征;步骤S4,进行特征拼接,最终实现2D视线估计。该发明能够降低视线估计对于硬件设备的要求,在不依赖眼动设备的前提下实现精准的视线估计。
-
公开(公告)号:CN119785261A
公开(公告)日:2025-04-08
申请号:CN202411855121.4
申请日:2024-12-17
IPC: G06V20/40 , G06T7/269 , G06V10/82 , G06N3/0464 , G06N3/0985 , G06N3/084 , G06N3/0455
Abstract: 本发明提供了一种视频异常检测的少样本微调框架构建方法包括:构建基于辅助任务的少样本场景视频异常检测微调框架,分割视频中容易出现异常的目标,同时预测出光流图。通过分割和光流估计这两个辅助任务提取丰富的时空特征促进异常检测模型微调到新场景;采用三阶段的训练策略,对于辅助任务网络的三个部分:分割分支网络、光流分支网络和分割与光流信息融合模块,在三个训练阶段分别训练其中一个部分,而冻结其余两个部分的参数,从而降低训练过程的不稳定性。该视频异常检测的少样本微调框架构建方法及构建系统将视频的分割目标与光流信息有效结合,具有微调效率高、成本低、易于实现、且部署灵活等特点。
-
公开(公告)号:CN114140398B
公开(公告)日:2024-07-16
申请号:CN202111348548.1
申请日:2021-11-15
Applicant: 上海大学
IPC: G06T7/00 , G06T7/73 , G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/80 , G06V10/774 , G06V10/764
Abstract: 本发明公开了一种利用无缺陷图像来增强缺陷区域特征的少样本缺陷检测方法,对缺陷图像数据集进行处理,将所有类别的缺陷划分为基础类与新类,按照随机选取的原则为新类选定少量样本;构建少样本缺陷检测的深度学习网络,输入的缺陷图像及无缺陷图像经过多层卷积特征提取以及特征融合后,得到输入图像的缺陷区域特征增强的特征图,再对其进行分类和边框回归计算即可得到缺陷的类别及位置;将处理好的训练数据输入构建的深度学习网络训练;利用训练好的模型对测试数据进行实验,基础类的测试实验只需要输入缺陷图像,即可得到该缺陷的类别和位置信息,而新类的测试实验需要同时输入少量缺陷图像和无缺陷图像,得到该缺陷的类别和位置信息。
-
-
-
-
-
-
-
-
-