-
公开(公告)号:CN117496307A
公开(公告)日:2024-02-02
申请号:CN202311434063.3
申请日:2023-10-31
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06V10/776 , G06V20/70 , G06V10/82 , G06F16/951 , G06N3/0464 , G06V10/764
Abstract: 本发明属于图像数据处理技术领域,公开了一种基于大语言模型的恐龙足迹图像数据集构建方法及系统,包括:S1,挖掘数据源:数据来源于研究成果包含的的图像数据;S2,采集恐龙足迹化石图像;S3,处理恐龙足迹化石图像;S4,标注恐龙足迹化石图像;S5,验证图像数据有效性。通过深度神经网络验证图像数据有效。本发明通过图像数据处理技术,构建出可用于训练图像识别算法的图像数据集,为后续的恐龙足迹自动化识别提供了图像数据基础。本发明利用大语言模型的语义分析能力,挖掘现有恐龙足迹理论研究成果中包含的图像数据,形成一种可用于自动构建恐龙足迹图像数据集的方法,从而更好地支持该领域的自动识别人工智能算法的设计与开发。
-
公开(公告)号:CN117576515A
公开(公告)日:2024-02-20
申请号:CN202311641601.6
申请日:2023-11-30
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06V10/774 , G06V10/82 , G06N3/0895 , G06N3/0455 , G06N3/0464 , G06N3/0475
Abstract: 本发明属于计算机视觉中的图像数据集构建技术领域,公开了一种基于扩散生成的自监督图像数据集构建方法、系统及设备,使用包含1000个类名及原始图像的ImageNet‑1K数据集;微调Diffusion预训练模型,Diffusion模型用于生成图像;设计自监督Transformer网络,在训练过程中所用数据集无需人为添加标签,所设计的网络会自动完成自监督任务;加载预训练模型和数据集,初步生成GenImageNet数据集,训练并使用自监督Transformer网络,最终生成高质量数据集。本发明通过引入自监督网络,实现了对生成图像的自动筛选,提高了生成图像的质量。同时,操作简便,易于实现。
-