-
公开(公告)号:CN119512079A
公开(公告)日:2025-02-25
申请号:CN202411494398.9
申请日:2024-10-24
IPC: G05D1/43 , G05D1/644 , G05D109/10
Abstract: 本发明提供一种面向机器人智能控制的平滑强化学习方法及装置,涉及机器人智能控制技术领域。该方法包括:获取当前时刻机器人的环境观测样本信息;根据当样本信息,构建平滑强化学习控制模型;根据样本信息,构建控制模型的奖励函数;采用机器人的离散时间运动学方程,构建控制模型的约束条件;将样本信息、奖励函数以及约束条件输入控制模型中进行在线训练,获得当前时刻机器人的平滑控制动作;构造控制模型的目标函数;根据目标函数对控制模型进更新,获得更新后的控制模型;根据平滑控制动作,获得下一时刻的观测样本信息,输入更新后的控制模型中,获得下一时刻机器人平滑控制动作。采用本发明可使机器人完成高实时且高精度的平滑控制任务。
-
公开(公告)号:CN118840534A
公开(公告)日:2024-10-25
申请号:CN202410717153.1
申请日:2024-06-04
Applicant: 清华大学
IPC: G06V10/25 , G06V10/82 , G06N3/0455 , G06N3/0895
Abstract: 本申请涉及图像处理技术领域,特别涉及一种基于计算基础平台的无标签自动化学习方法及装置,其中,方法包括:基于初始点云数据获取稠密化的点云数据,并进行地面点去除,得到去除地面点的点云数据;生成去除地面点的点云数据中每个目标的3D检测框,并生成3D检测框的伪标签,以得到每个目标的3D目标检测结果;基于3D目标检测结果形成至少一条初始目标轨迹,优化至少一条初始目标轨迹,以得到最终轨迹,并将其作为新的伪标签,迭代优化检测器的权重,直至达到迭代停止条件,更新每个目标的伪标签。由此,解决了相关技术中,过度依赖标注的数据,耗费了大量的时间和成本,降低了算法的准确性和泛化能力,无法适应复杂的外界环境等问题。
-
公开(公告)号:CN118759912A
公开(公告)日:2024-10-11
申请号:CN202410818420.4
申请日:2024-06-24
Applicant: 清华大学 , 北京智行者科技股份有限公司
IPC: G05B19/042
Abstract: 本发明公开了面向自动驾驶汽车的显式安全跟踪控制器及其参数优化方法,包括:通过引入指数控制李雅普诺夫函数ECLF与指数控制障碍函数ECBF在离散时间系统下的反馈线性化理论,并设计了适用于自动驾驶汽车的ECLF与ECBF及其显式可解的安全跟踪控制律,最后提出了基于强化学习的自动驾驶汽车显式安全跟踪控制律参数优化方案。本发明能够有效解决自动驾驶集成式决控中实时性、安全性和求解精度无法兼得的问题。
-
公开(公告)号:CN118570253A
公开(公告)日:2024-08-30
申请号:CN202410670047.2
申请日:2024-05-28
Applicant: 清华大学
IPC: G06T7/246 , G06T5/80 , G06T7/33 , G06T3/4007 , G06T3/4038 , G06T7/73 , G06T3/06 , G06T7/277 , G06V10/25 , G06V20/58
Abstract: 本申请涉及数据处理技术领域,特别涉及一种4D动静态目标真值数据标注系统及方法,其中,系统包括:静态物体标注组件用于处理原始雷达点云数据,以获得运动补偿后的点云和各帧雷达的位姿,进行线性插值与地图拼接,从而可以得到全局地图并转化为鸟瞰视图,利用相机位姿将其投影到图像上进行标注,得到静态物体的真实位置;动态物体标注组件通过在原始雷达点云中进行目标标注和动态跟踪,得到动态目标的检测框和轨迹,利用雷达位姿和相机位姿进行投影,获得动态物体的多相机真实位置。由此,解决了相关技术中,由于只在3D空间上对目标物体标注,只能得到物体的静态信息,无法准确预测动态场景,且为获得高质量的真值数据,导致成本增加等问题。
-
公开(公告)号:CN116976423B
公开(公告)日:2024-07-23
申请号:CN202310680255.6
申请日:2023-06-09
Applicant: 清华大学
IPC: G06N3/084 , B60W40/08 , G06N3/0455 , G06F18/214 , G06F18/241 , G06F18/2415 , G06F18/213 , G06F18/15 , G06F123/02
Abstract: 本申请涉及一种融合事故后车辆动力学的事故前风险评估模型的训练方法及装置、乘员损伤风险评估方法及装置、计算机设备、存储介质和计算机程序产品。所述方法包括:将车辆运动序列信息输入至参照风险评估模型,获取第一编码隐变量和第一解码隐变量;参照风险评估模型基于车辆运动序列信息训练得到;将碰撞工况特征信息输入至初始的目标风险评估模型,得到第二编码隐变量、第二解码隐变量、乘员损伤评估信息;基于第一编码隐变量、第一解码隐变量、第二编码隐变量、第二解码隐变量、乘员损伤评估信息和乘员损伤真值信息确定损失值,基于损失值调整模型参数。采用本方法训练得到的风险评估模型,可以兼顾较高的风险评估效率和风险评估准确性。
-
公开(公告)号:CN117485337A
公开(公告)日:2024-02-02
申请号:CN202210877502.7
申请日:2022-07-25
Abstract: 本申请公开了一种自动驾驶汽车协同型编队控制方法、装置及存储介质,方法包括:在预设地理范围内,确定目标车辆的车辆行驶信息;基于车辆行驶信息,以及获取到的预设地理范围内的静态环境信息,确定目标车辆的参考行驶信息,其中静态环境信息包括多条车道的道路信息,参考行驶信息包括目标车辆的至少一个候选路径;基于获取到的目标车辆的周围车辆的周车行驶信息,利用参考行驶信息,确定各个候选路径上的目标车辆对应的跟驰前车;针对候选路径以及跟驰前车,实时构建有限时域最优控制问题,以利用有限时域最优控制问题,确定目标车辆对应的目标行驶轨迹以及相应的目标跟驰前车。该方法实现多车协同型编队决策控制的自动驾驶功能。
-
公开(公告)号:CN116796554A
公开(公告)日:2023-09-22
申请号:CN202310790834.6
申请日:2023-06-30
Applicant: 清华大学
Abstract: 本公开提供的一种行人与非机动车微观行为建模方法,根据道路拓扑结构确定被控交通参与者的可执行的离散目标点集合;选择下一目标点并设定目标速度;计算被控交通参与者的社会力合力,其中车辆对被控交通参与者的社会力是通过结合车辆当前位置至未来时刻位置所涵盖的区域投影至被控交通参与者目标点坐标系下形成抽象的车辆形状,同时将横纵向距离较近的车辆合并抽象为一辆车,分开计算车辆对被控交通参与者的横向社会力和纵向社会力,并根据被控交通参与者相对车辆的位置约束横纵向社会力的大小所得到;根据被控交通参与者所受的社会力合力更新其下一时刻的状态。本公开仅用少数参数即可描述被控交通参与者复杂动态的运动,更加符合真实交通场景。
-
公开(公告)号:CN116552568A
公开(公告)日:2023-08-08
申请号:CN202310658789.9
申请日:2023-06-05
Applicant: 清华大学
IPC: B60W60/00 , B60W30/095 , B60W40/00 , G06F17/10
Abstract: 本申请涉及一种自动驾驶汽车集成式决控的静态路径优选方法及装置,其中,方法包括:基于静态路径集合,分别计算每条静态路径的安全性指标、合规性指标、通畅性指标、经济性指标和舒适性指标;根据每条静态路径的安全性指标、合规性指标、通畅性指标、经济性指标和舒适性指标及对应的优先度和权重,计算每条静态路径的综合评价指标;根据每条静态路径的综合评价指标的大小和变化信息从基于静态路径集合中选取满足预设条件的最优静态路径。由此,解决了相关技术中,由于集成式决控动态跟踪控制将决策,规划和控制融合为一体,使得存在功能集成度高、算法设计复杂、计算规模大和实时性差的问题。
-
公开(公告)号:CN113159576B
公开(公告)日:2022-05-13
申请号:CN202110430527.8
申请日:2021-04-21
Applicant: 清华大学
Abstract: 本发明公开了一种自动驾驶汽车的行车风险计算方法及在线评估系统,所述方法计算自车以未来时刻的运动状态与周边的交通参与者或者静态道路设施发生的假设性碰撞将导致的碰撞损伤;将碰撞损伤在空间和时间维度上进行折减,取最大值作为当前时刻的行车风险值。所述系统包括传感器模块,轨迹预测模块和风险评估模块。本发明通过考虑潜在碰撞双方类型及其安全特性,实现以碰撞损伤为标准的车辆行车碰撞风险计算,为涉及多个、多类型潜在碰撞对象情况下的车辆运行风险差异化表征提供了技术方案。
-
公开(公告)号:CN111897217B
公开(公告)日:2022-03-11
申请号:CN202010698398.6
申请日:2020-07-20
Applicant: 清华大学
IPC: G05B13/04
Abstract: 本发明涉及一种模型预测控制器时域分解加速方法,属于自动控制技术领域。本发明方法将模型预测控制算法在预测时域上进行分解,将预测时域内的每一组状态量,视作拓扑结构中的节点,利用系统的预测方程,实现信息的跨节点传递。再利用一致性优化方法对该问题进行迭代计算,交替更新原始变量、共识变量以及对偶变量,直至满足收敛准则。本发明通过信息的跨节点传递,提升了各节点间的信息传递效率。相比于信息仅在相邻节点间传递的传统方法,该方法大幅度提升了算法的收敛速。
-
-
-
-
-
-
-
-
-