-
公开(公告)号:CN118990504A
公开(公告)日:2024-11-22
申请号:CN202411345828.0
申请日:2024-09-26
Applicant: 北京工业大学
IPC: B25J9/16
Abstract: 本发明公开了一种基于视觉与力感知的机器人擦拭动作策略学习方法,利用PPO算法构建机器人擦拭动作规划模型,PPO通过使用计算一定截断比例的方法限制策略更新的幅度,确保新策略不会偏离旧策略太远,从而在探索和利用之间找到平衡。这种设计有助于维持学习过程的稳定性和避免大幅度性能下降。本方法经过密集的仿真环境下的训练与奖励机制的不断调优,机械臂将逐步精炼其擦拭技能,不仅提升任务执行效率,还能在保证安全的前提下,灵活应对不同清洁需求。最后,将训练成熟的模型部署至实体机械臂上进行实地测试与微调,显著增强其在多样化的家居应用场景中的擦拭作业能力。