-
公开(公告)号:CN119027576A
公开(公告)日:2024-11-26
申请号:CN202410867945.7
申请日:2024-07-01
Applicant: 厦门大学
Abstract: 本发明涉及一种由文本生成3D场景的方法,其首先使用一个轨迹扩散变换器作为摄影指导,根据文本描述来建模相机轨迹的分布;接下来,一个由高斯驱动的多视图潜变量扩散模型作为装饰者,根据相机轨迹和文本来建模图像序列分布。这个模型是从一个2D扩散模型微调而来,可以直接生成与像素对齐的3D高斯,作为直接的3D场景表现形式,用于三维一致的去噪;最后,这些3D高斯通过一种新颖的融合了2D扩散模型的先验知识的SDS++损失,作为细节优化者进一步细化得到真实的3D场景。
-
公开(公告)号:CN118247607B
公开(公告)日:2024-09-06
申请号:CN202410658185.9
申请日:2024-05-27
Applicant: 厦门大学
IPC: G06V10/774 , G06V10/82 , G06N3/0895
Abstract: 本发明公开一种基于双旋转局部不一致性学习的半监督伪装目标检测方法,针对于“伪装目标数据的像素级标注耗时耗力,半监督学习提供了潜在解决方案,但是直接将成功的半监督范式迁移到伪装目标检测任务上,面临伪标签存在局部性噪声的问题,即同一伪标签内不同区域噪声程度不同,直接用带噪声伪标签进行监督会损害模型性能”的问题,基于经典的半监督学习教师‑学生范式,同时提出了一种新颖的双旋转局部不一致性学习。双旋转局部不一致性学习通过不同旋转视图的局部预测不一致对同一伪标签不同区域赋予不同权重来缓解局部噪声问题,帮助模型自适应调整不同质量伪标签的贡献,使伪装目标检测模型获得充分监督的同时,避免确认偏差。
-
公开(公告)号:CN116229101A
公开(公告)日:2023-06-06
申请号:CN202310198831.3
申请日:2023-03-03
Applicant: 厦门大学
IPC: G06V10/44 , G06V10/764 , G06V10/774 , G06V10/25 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 一种基于少样本学习的开放世界目标检测方法,属于图像处理领域。基于少样本学习的开放世界目标检测任务,在类别不可知的目标检测中引入少样本学习方法,提供少量未知类别的样本,指导网络实现对于新类别的检测与未知类别的定位。提供基于少样本学习的开放世界目标检测的网络OFDet,在两阶段微调范式下的类别不可知的物体检测器上建模。OFDet由三个模块组成:类别不可知目标检测模块CALM、基础分类模块BCM以及新类别的检测模块NDM。为选择更准确的未知物体,提出基于未知候选框的选择算法。在已有的多个已有任务上性能良好,在新设定的OFOD任务上,对于未知类别的平均召回率达到最好效果,同时获得较高新类别平均精度。
-
公开(公告)号:CN120032371A
公开(公告)日:2025-05-23
申请号:CN202510109507.9
申请日:2025-01-23
Applicant: 厦门大学
IPC: G06V20/70 , G06V10/26 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/82 , G06F40/30 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种面向高效的开放词汇全景分割方法,包括以下步骤:S1、基于多尺度特征提取器和轻量级聚合器进行视觉特征提取和聚合;S2、利用文本编码器对任意类别词汇进行编码,得到文本嵌入 S3、基于词汇感知选择模块提升视觉聚合特征的语义理解,减轻掩码解码器的特征交互负担;S4、基于双向动态嵌入专家,通过动态分配专家权重,生成具有语义感知和空间感知的实例嵌入;S5、基于轻量级解码器,使用对象核逐层进行掩码预测和细化,利用对象核和文本嵌入进行点积作为类别预测;该方法在实现相当性能的同时,旨在减少模型计算开销、加快推理速度,具有显著的实用价值和应用前景。
-
公开(公告)号:CN119762852A
公开(公告)日:2025-04-04
申请号:CN202411811497.5
申请日:2024-12-10
Applicant: 厦门大学
IPC: G06V10/764 , G06V10/82 , G06V10/776 , G06N3/0455 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种基于重校准注意力的工业异常检测方法,包括以下步骤:S1、构建工业异常检测模型,并对工业异常检测模型进行初始化;所述工业异常检测模型由教师模型、学生模型和自动编码器组成;S2、采用层级异常评分模块HSQ对工业异常检测模型中网络每层的异常判断能力进行评估,根据异常识别能力给各层分配相应的量化比特宽度,再逐层对工业异常检测模型进行训练后量化;S3、对学生模型和自动编码器进行微调训练;S4、采用微调训练后的工业异常检测模型进行工业异常检测;该方法系统地分解和重新校准注意力图,提高了模型的泛化能力和异常检测精度,具有显著的实用价值和应用前景。
-
公开(公告)号:CN119316586A
公开(公告)日:2025-01-14
申请号:CN202411189113.0
申请日:2024-08-28
Applicant: 厦门大学
Abstract: 本发明公开了一种基于视觉语言模型的少样本图像质量评估方法及装置,涉及图像质量评估技术领域。本发明通过引入梯度调节元提示图像质量评估(GRMP‑IQA),先通过元提示预训练采用双层梯度优化过程合并来自各种图像失真的元知识,从而用于细化文本和视觉提示的初始化,增强了CLIP模型对IQA任务的适应能力,降低了提示初始化对各种IQA场景的敏感性;然后通过质量感知梯度正则化纠正视觉‑语言模型(CLIP)过度关注语义内容而引入的偏差,确保对图像质量进行更准确的评估,使预训练的CLIP模型适应具有少量训练样本的BIQA任务。
-
公开(公告)号:CN118229700B
公开(公告)日:2024-10-22
申请号:CN202410645393.5
申请日:2024-05-23
Applicant: 厦门大学
Abstract: 本发明公开一种实时的交互式图像分割方法,涉及计算机视觉技术领域,引入了一种创新的处理交互分割问题的流程,能够提高交互式分割任务的计算效率,包括:步骤1、使用大型视觉模型对图像进行并行预处理,得到图像特征;步骤2、通过一轻量级的交互式分割模块,实时处理图像特征和用户输入的交互信息,能够从图像中准确地分割出目标区域,并根据用户的反馈不断提高分割的准确度。本发明通过将来自大型视觉模型预处理的图像特征与用户输入的交互信息相结合,并使用单一的轻量级交互式分割模块执行交互式分割,这种设计不仅保持了模型分割性能的竞争力,同时也优化了模型推理流程,显著提高了计算效率,为实时交互式图像分割提供了有效的解决方案。
-
公开(公告)号:CN118446963A
公开(公告)日:2024-08-06
申请号:CN202410427394.2
申请日:2024-04-10
Applicant: 厦门大学
IPC: G06T7/00 , G06T7/11 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于空间异构失真感知的无参考图像质量评价方法,涉及图像质量评估技术领域。所述方法包括将输入图像分割成图像块并随机构建空间异构失真生成退化图像;将输入图像和退化图像分别输入学生编码器和教师编码器提取输入图像块失真特征以及退化图像块失真特征,然后送入失真感知知识蒸馏模块通过对比知识蒸馏模块和亲和知识蒸馏模块将输入图像块失真特征与退化图像块失真特征进行交互;构建整体损失函数完成模型训练后,将待评价图像分割成图像块,采用训练好的学生编码器作为失真感知编码器提取特征,再通过解码器解码,通过质量感知适应头计算质量分数。本发明实现了通过分析局部失真块来评估图像质量。
-
公开(公告)号:CN116012585A
公开(公告)日:2023-04-25
申请号:CN202310018185.8
申请日:2023-01-06
Applicant: 厦门大学
IPC: G06V10/26 , G06V10/82 , G06N3/08 , G06V10/25 , G06N3/0464
Abstract: 一种基于类别核化动态卷积的实例分割方法,涉及计算机视觉中的图像检测和分割。设计一种分类核化动态CANDY卷积,结合RoI信息、类别信息和位置信息来生成用于分割的动态核。生成实例分割框架CANDY‑Mask,增强对前景对象的判别能力。在MS‑COCO数据集上实验验证CANDY‑Mask性能。创新点内容:1)多级金字塔特征集成。通过多次卷积操作将具有特征金字塔网络层融合成一个基于像素位置的统一特征图。2)类别感知内核生成。利用类别信息解决“类不可分现象”并嵌入基于实例的位置信息。3)动态卷积操作。将统一的全局特征与局部信息和实例位置相结合,融合基于局部的细节信息和基于全局的感受视野特征。
-
公开(公告)号:CN109086721A
公开(公告)日:2018-12-25
申请号:CN201810878976.7
申请日:2018-08-03
Applicant: 厦门大学
Abstract: 用于人脸画像合成的主动表观模型,属于图像处理技术领域。针以现有方法的缺陷,利用包含“合成解释”思想的方法即主动表观模型来辅助人脸画像合成研究,提供可提高已有画像合成方法性能的用于人脸画像合成的主动表观模型。引入“合成解释”的思想进行人脸画像合成,因此能在一定程度上考虑重建问题的基本原理;所用的重建模型是基于主成分分析的方法,因此能快速的进行人脸画像的合成。考虑了人脸形状与人脸纹理两个部分,因此不仅能提高合成画像的纹理,而且还能考虑到合成画像的形状。
-
-
-
-
-
-
-
-
-