-
公开(公告)号:CN118691540A
公开(公告)日:2024-09-24
申请号:CN202410658369.5
申请日:2024-05-24
Applicant: 湖南大学
IPC: G06T7/00 , G06T3/02 , G06T7/62 , G06V10/774 , G06V10/82 , G06V10/764 , G06V10/40 , G06V10/80 , G06N3/0464
Abstract: 本申请提供一种陶瓷基复合材料的缺陷识别方法、设备、介质及产品。该方法包括:获取目标图像及已训练缺陷识别模型;目标图像为待识别的陶瓷基复合材料的微观图像;已训练缺陷识别模型为改进的Yolov8模型,包括:自校准特征提取网络、自校准特征聚合网络和预测输出网络;采用自校准特征提取网络对目标图像进行特征提取、空间重构、通道重构和特征增强,以获得目标图像在不同感受野的增强特征;采用自校准特征聚合网络对各增强特征进行双向自校准聚合处理,以获得目标图像在不同感受野的聚合特征;采用预测输出网络基于各聚合特征生成对目标图像的识别结果并输出。本申请能够提高对陶瓷基复合材料的缺陷识别的效率和准确率。
-
公开(公告)号:CN118607526A
公开(公告)日:2024-09-06
申请号:CN202410719064.0
申请日:2024-06-05
Applicant: 湖南大学
IPC: G06F40/295 , G06F40/284 , G06F40/30 , G06V20/62 , G06V10/40 , G06N20/00
Abstract: 本发明公开了一种基于细粒度适配器的视觉问答方法,其从三个方面提升视觉问答的效果,一方面利用Spacy进行命名实体识别以获取问题中的特殊信息,同时利用Ground‑Dino模型能捕获到图片中与特殊信息相关的细粒度区域;另一方面,利用图文匹配预训练大模型CLIP提取图片的多粒度语义特征,利用语言预训练大模型llama‑7B提取文本语义特征,并利用视觉语义特征提取模块将视觉域迁移到语义域,实现了视觉和语义对齐,使模型兼具视觉感知能力与语义理解能力;最后,利用基于细粒度适配器微调llama‑7B预训练语言模型所得到的多模态模型生成问题的答案,由于适配器体量小,能够轻量级而高效地迁移预训练模型中的知识到具体的视觉问答任务上。
-
公开(公告)号:CN118570607A
公开(公告)日:2024-08-30
申请号:CN202410721232.X
申请日:2024-06-05
Applicant: 湖南大学
IPC: G06V10/82 , G06V10/20 , G06N3/0464 , G06N3/08 , G06V10/774
Abstract: 本发明公开了一种复杂天气下基于YOLO的目标检测方法,包括:获取待检测图像,并对获取的待检测图像进行预处理,以得到预处理后的图像,将预处理后的图像输入预先训练好的图像处理模型进行图像增强处理,以得到图像增强后的图像,将图像增强后的图像输入预先训练好的目标检测模型,以得到最终的目标检测结果。本发明能够解决现有基于区域提议的方法虽然检测准确度较高,但速度较慢,导致实时检测效率低的技术问题,以及现有基于单阶段回归的方法具有较快的识别速度,但在面对复杂环境、伪装目标等问题时,检测性能明显下降的技术问题。
-
公开(公告)号:CN118298160A
公开(公告)日:2024-07-05
申请号:CN202410503276.5
申请日:2024-04-25
Applicant: 湖南大学
IPC: G06V10/25 , G06V10/764 , G06V10/766 , G06V10/82 , G06V10/30 , G06V20/10 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种复杂天气下结合扩散模型和可变形卷积的目标检测方法,包括:获取复杂天气下的待检测图像,对复杂天气下的待检测图像进行数据增强处理,以得到数据增强后的图像,对获取的数据增强后的图像进行去噪处理,以获取去噪后的图像,将去噪后的图像输入到预先训练好的结合扩散模型和可变形卷积的目标检测网络中,以获取最终的检测结果。本发明能够解决现有基于图像复原和重构的方法只能去除单一的天气退化,无法实现端到端的图像复原,导致检测速度低、模型通用性和实用性差的技术问题,以及现有基于深度学习的目标检测方法难以获取大量标注的、具有代表性的训练数据的技术问题,以及在复杂天气下识别准确率低的技术问题。
-
-
-