-
公开(公告)号:CN111137292B
公开(公告)日:2023-08-08
申请号:CN201910496094.9
申请日:2019-06-10
Applicant: 通用汽车环球科技运作有限责任公司 , 卡内基梅隆大学
IPC: B60W30/18 , G06N3/0464 , G06N3/084 , G06N3/045 , G06N3/0442 , G06V10/774 , G06V10/82
Abstract: 提供了采用基于空间和时间注意力的分层车道变换策略的深度强化学习来控制自主车辆的系统和方法。执行器‑评价网络架构包括:执行器网络,其处理从环境接收的图像数据以将车道变换策略作为分层动作的集合来学习;以及评价网络,其评估车道变换策略以计算损失和梯度来预测动作值函数(Q),其用于驱动学习车道变换策略以及更新其参数。执行器‑评价网络架构实施空间注意力模块以选择图像数据中重要的相关区域,以及时间注意力模块以学习要应用于过去的图像数据帧的时间注意力权重,从而指示在决定选择哪个车道变换策略时的相对重要性。
-
公开(公告)号:CN111204346A
公开(公告)日:2020-05-29
申请号:CN201910503444.X
申请日:2019-06-11
Applicant: 通用汽车环球科技运作有限责任公司 , 卡内基梅隆大学
Abstract: 提供了用于控制自主车辆的命令的端对端学习的系统及方法。预处理器对由传感器以当前时间步长(CTS)获取的图像数据进行预处理以生成与附加输入(例如,分割图和/或光流图)级联的经预处理的图像数据以生成动态场景输出。卷积神经网络(CNN)处理所述动态场景输出以生成特征图,所述特征图包括与车辆运动学级联的提取空间特征以生成空间上下文特征向量。LSTM网络在所述(CTS)期间处理所述(CTS)的所述空间上下文特征向量和相应的先前时间步长的一个或多个先前LSTM输出,以生成所述(CTS)的编码后时间上下文向量。完全连接层处理所述编码后时间上下文向量以学习控制命令(例如,转向角、加速率和/或制动速率控制命令)。
-
公开(公告)号:CN111137292A
公开(公告)日:2020-05-12
申请号:CN201910496094.9
申请日:2019-06-10
Applicant: 通用汽车环球科技运作有限责任公司 , 卡内基梅隆大学
Abstract: 提供了采用基于空间和时间注意力的分层车道变换策略的深度强化学习来控制自主车辆的系统和方法。执行器-评价网络架构包括:执行器网络,其处理从环境接收的图像数据以将车道变换策略作为分层动作的集合来学习;以及评价网络,其评估车道变换策略以计算损失和梯度来预测动作值函数(Q),其用于驱动学习车道变换策略以及更新其参数。执行器-评价网络架构实施空间注意力模块以选择图像数据中重要的相关区域,以及时间注意力模块以学习要应用于过去的图像数据帧的时间注意力权重,从而指示在决定选择哪个车道变换策略时的相对重要性。
-
公开(公告)号:CN111204346B
公开(公告)日:2023-04-28
申请号:CN201910503444.X
申请日:2019-06-11
Applicant: 通用汽车环球科技运作有限责任公司 , 卡内基梅隆大学
IPC: B60W50/00 , G05D1/02 , G06V20/56 , G06V10/764
Abstract: 提供了用于控制自主车辆的命令的端对端学习的系统及方法。预处理器对由传感器以当前时间步长(CTS)获取的图像数据进行预处理以生成与附加输入(例如,分割图和/或光流图)级联的经预处理的图像数据以生成动态场景输出。卷积神经网络(CNN)处理所述动态场景输出以生成特征图,所述特征图包括与车辆运动学级联的提取空间特征以生成空间上下文特征向量。LSTM网络在所述(CTS)期间处理所述(CTS)的所述空间上下文特征向量和相应的先前时间步长的一个或多个先前LSTM输出,以生成所述(CTS)的编码后时间上下文向量。完全连接层处理所述编码后时间上下文向量以学习控制命令(例如,转向角、加速率和/或制动速率控制命令)。
-
公开(公告)号:CN110806744A
公开(公告)日:2020-02-18
申请号:CN201910500233.0
申请日:2019-06-11
Applicant: 通用汽车环球科技运作有限责任公司 , 卡内基梅隆大学
Abstract: 本发明涉及使用分层选项马尔可夫决策过程的交叉路口自主驾驶决策。提供了一种自主车辆(AV)中的方法。该方法包括:从车辆传感器数据和道路几何数据,确定多个距离测量和障碍物速度数据;确定车辆状态数据,其中,车辆状态数据包括自主车辆的速度、到停止线的距离、到交叉路口的中点的距离以及到目标的距离;基于多个距离测量、障碍物速度数据以及车辆状态数据,确定离散行为动作的集合以及与各离散行为动作关联的独特轨迹控制动作;选择要执行的离散行为动作以及独特轨迹控制动作;以及向车辆控制器传递消息,所述车辆控制器传递与所述离散行为动作关联的所述选择的独特轨迹控制动作。
-
-
-
-