-
公开(公告)号:CN118823830A
公开(公告)日:2024-10-22
申请号:CN202410887980.5
申请日:2024-07-03
Applicant: 厦门大学嘉庚学院 , 平和县嗨果匠果业有限公司
IPC: G06V40/10 , G06V20/52 , G06V10/80 , G06V10/774 , G06V10/764 , G06V10/40 , G06V10/82 , G06N3/0464 , G06N3/094 , G06N3/088
Abstract: 本发明提出一种基于GPA_VLPD全局自适应的跨模态单阶段行人检测方法,利用预训练好的视觉语言模型CLIP的Text Encoder将类别文本映射为文本特征;通过CLIP的Image Encoder获得伪标签;然后将训练集和文本特征输入到GPA‑VLPD特征提取模块,得到适用于检测行人的GPA‑VLPD模型;最后将训练完成的模型对图像进行推理检测;如果检测到行人,则框选并输出。
-
公开(公告)号:CN119810117A
公开(公告)日:2025-04-11
申请号:CN202411877177.X
申请日:2024-12-19
Applicant: 厦门大学嘉庚学院
IPC: G06T7/11 , G06N3/0464 , G06N3/0455 , G06N5/04
Abstract: 本发明提供一种基于SSRepVM‑UNet的轻量化医学图像分割方法,流程为:图像处理、模型训练、图像分割三个步骤。首先将下载的数据集进行划分,然后resize为统一大小(256×256)并生成对应的.npy文件。然后将训练集进行数据增强后送入SSRepVM‑UNet模型中进行训练,经过250轮训练后将验证集loss最小的模型参数保存为best.pt。最后利用best.pt对测试集进行测试,得到各个指标结果,并且保存推理结果,方便与mask进行对比,直观感受到其分割效果。
-