-
公开(公告)号:CN114898124A
公开(公告)日:2022-08-12
申请号:CN202210509390.X
申请日:2022-05-10
Applicant: 复旦大学
IPC: G06V10/70 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明属于机器学习技术领域,具体为一种多智能体在线进化学习的机器学习方法。本发明方法包括:在OEL场景中,在局部区域内,有多个智能体模型在实时获取感知数据,同时结合少量的有标注数据进行不断的学习与智能体模型更新;多个智能体模型通过交互学习实现知识迁移;每个智能体模型都在面临大量的无标注non‑i.i.d感知数据,结合多个智能体模型的自身能力对这些感知数据进行有效的联合处理;其中采用相互匹配(MM)算法,用于模型之间的知识共享和持续学习,以稳定模型的泛化能力,保证各智能体在OEL环境中获得更好的性能提升。本发明方法可以减少大量的数据标注需求,利用多模型的知识共享提高整个感知系统的性能。
-
公开(公告)号:CN114898124B
公开(公告)日:2025-02-14
申请号:CN202210509390.X
申请日:2022-05-10
Applicant: 复旦大学
IPC: G06V10/70 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/042 , G06N3/096 , G06N3/086 , G06N3/0895
Abstract: 本发明属于机器学习技术领域,具体为一种多智能体在线进化学习的机器学习方法。本发明方法包括:在OEL场景中,在局部区域内,有多个智能体模型在实时获取感知数据,同时结合少量的有标注数据进行不断的学习与智能体模型更新;多个智能体模型通过交互学习实现知识迁移;每个智能体模型都在面临大量的无标注non‑i.i.d感知数据,结合多个智能体模型的自身能力对这些感知数据进行有效的联合处理;其中采用相互匹配(MM)算法,用于模型之间的知识共享和持续学习,以稳定模型的泛化能力,保证各智能体在OEL环境中获得更好的性能提升。本发明方法可以减少大量的数据标注需求,利用多模型的知识共享提高整个感知系统的性能。
-