基于潜在扩散模型的机器人多模态数据生成方法及系统

    公开(公告)号:CN119903471A

    公开(公告)日:2025-04-29

    申请号:CN202411864119.3

    申请日:2024-12-18

    Applicant: 南昌大学

    Abstract: 本发明公开了一种基于潜在扩散模型的机器人多模态数据生成方法及系统,方法包含:获取机器人感知所需的多模态数据,并对其进行预处理和数据增强操作,生成多模态数据集;构建基于潜在扩散模型的多模态数据生成模型,该模型包括变分自编码器、U‑Net网络和条件嵌入编码器;确定训练配置,动态调整各模态的融合权重,利用多模态数据集训练该模型;由条件信息进行引导,通过该模型进行可控多模态数据生成。本发明有效解决了机器人感知领域中数据获取困难及成本高昂的问题。通过引入潜在扩散模型,可生成高质量的大规模多模态数据,为多种下游任务提供支持,从而显著提升机器人感知能力。

    一种用于灵巧手掌内操作的三维重建系统及方法

    公开(公告)号:CN119444975A

    公开(公告)日:2025-02-14

    申请号:CN202411334558.3

    申请日:2024-09-24

    Applicant: 南昌大学

    Abstract: 本发明公开一种用于灵巧手掌内操作的三维重建系统及方法。系统包括壳体、多光谱单目相机、白光发射器、红外光发射器、紫外光发射器、转动机构、控制模块和智能终端。其中,转动机构可使壳体360°旋转,多光谱单目相机用于捕捉不同光谱下的物体图像,白光发射器、红外光发射器和紫外光发射器安装在三条臂的末端,分别发射白光、红外光和紫外光。控制模块和智能终端位于壳体的后方,二者通过局域网连接。本发明提供的一种用于灵巧手掌内操作的三维重建系统及方法,能够快速精准地获取物体表面形貌信息,帮助灵巧手进行掌内操作的决策。本系统重建精度高,环境适应性好,为灵巧手掌内操作时的环境信息获取提供了新的思路。

Patent Agency Ranking