一种表格型密集强化学习方法、计算机存储介质及终端

    公开(公告)号:CN118245763A

    公开(公告)日:2024-06-25

    申请号:CN202410382456.2

    申请日:2024-03-29

    Applicant: 清华大学

    Abstract: 本申请公开一种表格型密集强化学习方法、计算机存储介质及终端,包括:从关键状态集合中均匀采样初始状态,使得初始状态均为关键状态;根据学习率、时序差分误差及关键状态集合的示性函数,对未达到最优的兴趣事件的发生概率Q(s,a)进行更新学习。本公开实施例从关键状态集合中均匀采样初始状态,基于包含关键状态集合的示性函数实现兴趣事件的发生概率Q(s,a)的更新学习,使得训练数据包含的关键状态信息密集化,减少了计算量、节省了计算资源,提升了未达到最优的兴趣事件的发生概率Q(s,a)的学习效率。

    一种实现测试场景生成的模型的训练方法

    公开(公告)号:CN116467599A

    公开(公告)日:2023-07-21

    申请号:CN202310410081.1

    申请日:2023-04-17

    Applicant: 清华大学

    Abstract: 本文公开一种实现测试场景生成的模型的训练方法,包括:获取用于模型训练的数据集,数据集中包含历史观测序列和地图信息;对历史观测序列进行升维,获得第一高维特征信息;根据地图信息中包含的离散点之间的相关关系,获得的第二高维特征信息;根据第一高维特征信息、第二高维特征信息与表征所有车辆在场景中的随机性的随机函数信息,生成隐变量状态信息;对隐变量状态信息进行解码,获得交通先验模型的输出;对数据集中数据,根据交通先验模型的输入和获得的交通先验模型的输出计算预设的第一损失函数,获得交通先验模型。本发明实施例训练获得了交通先验模型,为自动生成自动驾驶汽车在正常工作情况下安全行驶的驾驶场景提供了支持。

    一种基于序贯博弈的单交叉口信号配时方法

    公开(公告)号:CN108364484A

    公开(公告)日:2018-08-03

    申请号:CN201810153796.2

    申请日:2018-02-22

    Applicant: 清华大学

    Abstract: 本发明涉及一种基于序贯博弈的单交叉口信号配时方法,其特征在于包括以下步骤:1)建立表征单交叉口各相位信号配时时间的无穷期序贯博弈模型,并确定该模型的收益函数和贴现因子;2)通过车路协同系统获取单交叉口当前周期各相位的收益函数计算参数以及上一周期各个相位的排队长度,用于序贯模型博弈计算;3)将单交叉口各相位作为无穷期序贯博弈模型的参与者进行序贯博弈,根据得到的序贯博弈均衡解以及单交叉口的周期时长,计算得到单交叉口各个相位在当前周期下分配得到的通行时间。本发明可以广泛应用于单交叉口信号配时领域中。

    一种实现自动驾驶感知层测试场景生成的方法

    公开(公告)号:CN116414720A

    公开(公告)日:2023-07-11

    申请号:CN202310513125.3

    申请日:2023-05-08

    Applicant: 清华大学

    Abstract: 本文公开一种实现自动驾驶感知层测试场景生成的方法,包括:根据预先设定的干扰变量与输入目标检测算法的感知层的场景数据,构建测试场景函数;根据目标检测算法的感知层的输出数据和真实场景数据,确定车辆安全性指标函数;在预先设定的合理性约束条件下,根据确定的车辆安全性指标函数求解构建的测试场景函数,获得用于安全性测试的测试场景;其中,真实场景数据为现实场景中真实的目标数据及对应状态。本发明实施例针对感知层所引起的车辆潜在安全问题,考虑感知层的组成结构,以合理性约束作为约束条件,求解获得了感知层的测试场景,为提高无人驾驶的测试效率和获知感知层所导致的车辆潜在安全隐患提供了技术支持。

    一种候诊排队优化方法、装置及存储介质

    公开(公告)号:CN116364251A

    公开(公告)日:2023-06-30

    申请号:CN202310215686.5

    申请日:2023-03-08

    Abstract: 本文公开候诊排队优化方法、装置及存储介质。所述方法包括:初始化候诊优先级模型的参数并利用该模型确定患者的初始优先级分数,利用该分数重排队列生成第一候诊队列;根据患者的挂号信息、报到时间和前方排队人数预测每个患者的候诊等待时长;将患者按照就诊类型进行分组,将所有组的组内平均候诊等待时长与队列内所有患者的候诊等待时长标准差进行加权累加得到加权和,以加权和最小为优化目标对模型进行参数优化;利用优化后的模型确定每个患者的最终优先级分数,根据最终优先级分数对队列进行重排生成最终的候诊队列。本文的方案能灵活调整不同就诊类型的患者的候诊优先级,缩小不同患者候诊时间的差异以及患者的平均候诊时间。

    自动驾驶测试场景库生成方法及装置、存储介质

    公开(公告)号:CN116187091A

    公开(公告)日:2023-05-30

    申请号:CN202310369199.4

    申请日:2023-04-07

    Applicant: 清华大学

    Abstract: 一种自动驾驶测试场景库生成方法及装置、计算机可读存储介质,所述方法包括:设置初始虚拟测试场景和测试任务,初始虚拟测试场景包括被测车辆和周围车辆;构建车辆行为效用模型,车辆行为效用模型包括多种不同的驾驶策略;对被测车辆执行所述测试任务,并在测试任务执行过程中,改变周围车辆的驾驶策略;获取测试结果,根据所述测试结果生成测试场景库,所述测试场景库包括多种针对所述被测车辆具有不同难度的虚拟测试场景以及每种所述虚拟测试场景对应的周围车辆的驾驶策略。

    一种实现自适应加速测试的方法及装置

    公开(公告)号:CN116009516A

    公开(公告)日:2023-04-25

    申请号:CN202310063836.5

    申请日:2023-01-12

    Applicant: 清华大学

    Abstract: 本文公开一种实现自适应加速测试的方法及装置,包括:根据第i‑1次及之前的自适应加速测试的测试结果,确定第i次自适应加速测试的重要性采样函数;根据确定的第i次自适应加速测试的重要性采样函数,采样确定第i次自适应测试的测试场景Xi;在采样确定的第i次自适应测试的测试场景Xi中对自动驾驶汽车进行自适应加速测试,获得测试结果;根据获得的测试结果,确定测试场景Xi的自适应加速测试的测试指标;根据确定的测试指标判断出测试结果收敛时,将确定的测试指标确定为测试评估结果。本发明实施例通过多重重要性采样函数的确定,加速了测试场景生成,提高了自动驾驶汽车测试评估的效率。

    一种基于交通业务特征的车辆可信度获取方法及装置

    公开(公告)号:CN114051039A

    公开(公告)日:2022-02-15

    申请号:CN202111187335.5

    申请日:2021-10-12

    Applicant: 清华大学

    Abstract: 本申请公开了一种基于交通业务特征的车辆可信度获取方法及装置,在车路协同平台下,车辆的可信度通过以车辆行驶的交通业务特征作为车辆信任判断的主要依据,通过甄别分析交通业务特征得到可信判断结果。本申请实施例中,在车辆计算对方车辆的可信度时,通过接收对方发送的基于交通业务特征计算得到的自车信任值,同时利用对方车辆的交通业务可信特征计算他车信任值,车辆的可信度根据结合了自车检测和他车检测两方面得到的判别结果获得,实现了对可信关系的可信度进行甄别,为实现车辆可信关系的建立提供了保障。

    一种基于轨迹预测的轨迹跟踪方法、介质和车载设备

    公开(公告)号:CN111260950B

    公开(公告)日:2021-03-26

    申请号:CN202010051158.7

    申请日:2020-01-17

    Applicant: 清华大学

    Abstract: 本申请实施例提供一种基于轨迹预测的轨迹跟踪方法、介质和车载设备,所述方法包括:当需要获取所述车辆在采样时刻tp+1的定位信息时,获取N个历史定位信息和参考路径信息序列,其中,所述N个历史定位信息为所述车辆在采样时刻tp+1之前的N个采样时刻的定位信息,所述参考路径信息序列为待跟踪的预定轨迹上的轨迹点的坐标序列,N为大于1的正整数,p+1为大于N的正整数;基于所述N个历史定位信息和参考路径信息序列,预测所述车辆在采样时刻tp+1的定位信息。如此,能够在需要获取车辆的定位信息时,精确预测出车辆的定位信息,从而,能够提高轨迹跟踪控制的精确度。

    一种用于事故分析与安全评价的平衡采样方法

    公开(公告)号:CN105046957A

    公开(公告)日:2015-11-11

    申请号:CN201510382446.X

    申请日:2015-07-02

    Applicant: 清华大学

    Abstract: 本发明公开了属于安全性评价技术领域的一种用于事故分析与安全评价的平衡采样方法,具体选择某种事故类型,采集相关数据,导入处理系统进行预处理,建立事故分析与安全评价数据集;建立分析模型,进行参数估计及收敛性判断,包括平衡采样事故样本、计数模型求解、重采样参数估计、收敛性判断;最后输出模型结果,针对显著因素分析提出改进建议。本发明涉及交通事故等偶发事件的预测及评价;采用平衡采样方法能够有效解决采用非平衡数据集的零膨胀问题;保障参数估计结果的稳定性与有效性,提高模型精度,减小参数估计误差,挖掘更多与事故发生相关的显著因素,有效指导实践应用。

Patent Agency Ranking