使用神经网络对上下文信息进行嵌入式编码的方法

    公开(公告)号:CN110857100B

    公开(公告)日:2023-03-14

    申请号:CN201910498016.2

    申请日:2019-06-10

    Abstract: 本发明提供了用于实现控制自主车辆(AV)的神经网络系统的系统、装置以及方法,包括:具有多个节点的神经网络,这些节点具有实现自主车辆操作的“上下文到向量(context2vec)”上下文嵌入;按时序嵌入上下文和行为数据的多个编码的上下文到向量自主车辆词;输入集,其包括:当前、先前以及后续的编码的上下文到向量自主车辆中的至少一个;神经网络解决方案,由至少一个计算机应用以基于当前上下文到向量自主车辆词确定各输入集的目标上下文到向量自主车辆词;由神经网络计算的输出向量,其表示输入的编码上下文到向量自主车辆词的嵌入分布独热方案;以及行为控制操作集,其用于控制自主车辆的行为。

    自动驾驶员代理和为自动驾驶员代理提供策略的策略服务器

    公开(公告)号:CN110850854A

    公开(公告)日:2020-02-28

    申请号:CN201910482888.X

    申请日:2019-06-04

    Abstract: 提供了用于控制自动驾驶汽车的系统、方法和控制器。系统、方法和控制器实现自动驾驶员代理以及用于向自动驾驶员代理提供策略以控制自动驾驶汽车的策略服务器。该系统可包括成组的自动驾驶员代理,存储由驾驶员代理捕获的体验的体验存储器,成组的驾驶策略学习模块,用于基于存储在体验存储器中的集体体验生成和改进策略,以及为驾驶员代理提供策略参数的策略服务器。驾驶员代理可收集驾驶体验以创建存储在体验存储器中的知识库。驾驶策略学习模块能够处理集体驾驶体验以提取驾驶策略。驾驶员代理可以经由驾驶策略学习模块以并行和分布的方式进行训练,以便更快更高效地找到新型的高效驾驶策略和行为。

    基于注意的分层变道深度强化学习

    公开(公告)号:CN110850861A

    公开(公告)日:2020-02-28

    申请号:CN201910443618.8

    申请日:2019-05-24

    Abstract: 一种基于注意的分层变道深度强化学习。提供了生成自动驾驶策略的系统和方法。该系统可包括成组的自动驾驶员代理,以及驾驶策略生成模块,其包括成组的驾驶策略学习模块,用于基于驾驶员代理收集的集体体验生成和改进策略。驾驶员代理可收集驾驶体验以创建知识库。驾驶策略学习模块能够处理集体驾驶体验以提取驾驶策略。驾驶员代理可以经由驾驶策略学习模块以并行和分布的方式进行训练,以便更快更高效地找到新型的高效驾驶策略和行为。并行和分布式学习能够加快多个自动智能驾驶员代理的训练。

    自主车辆的基于云的场景规划的驾驶系统和控制逻辑

    公开(公告)号:CN110271556A

    公开(公告)日:2019-09-24

    申请号:CN201910162789.3

    申请日:2019-03-05

    Abstract: 提出了场景规划和路线生成分布式计算系统、用于操作/构建此类系统的方法,以及具有场景规划选择和实时轨迹规划能力的车辆。一种用于控制机动车辆的操作的方法包括确定车辆状态数据,例如车辆的当前位置和速度,以及路径规划数据,例如车辆的起点和期望目的地。机动车辆的非车载的远程计算节点基于车辆状态数据、路径规划数据以及当前道路场景数据生成轨迹规划候选的列表。远程计算节点随后针对轨迹规划候选列表中的每个候选计算相应行驶成本,并且将该列表从最低到最高行驶成本进行排序。具有最低行驶成本的候选被传送至驻留车辆控制器。车辆控制器基于接收的轨迹规划候选执行自动化驾驶操作。

    用于自主驾驶应用的无监督学习代理

    公开(公告)号:CN109460015A

    公开(公告)日:2019-03-12

    申请号:CN201810986094.2

    申请日:2018-08-28

    Abstract: 提供了用于控制车辆的系统和方法。在一个实施例中,提供了一种包括训练自主驾驶代理的计算机实施方法,该方法包括以下步骤:由处理器使用神经网络从驾驶行为的演示中提取信息;将提取的信息传输到发生器模块;将与驾驶行为的演示相关联的真实环境状态传输到鉴别器模块;由处理器使用发生器模块从提取的信息中产生环境状态解译;由处理器训练鉴别器模块以更好地确定所产生的环境状态解译是否对应于真实环境状态,同时由处理器训练发生器模块以产生鉴别器确定对应于真实环境状态的改进的环境状态解译;并且由处理器使用从经过训练的发生器模块中产生的环境状态解译来恢复奖励图。

    用于自主驾驶应用的无监督学习代理

    公开(公告)号:CN109460015B

    公开(公告)日:2022-04-15

    申请号:CN201810986094.2

    申请日:2018-08-28

    Abstract: 提供了用于控制车辆的系统和方法。在一个实施例中,提供了一种包括训练自主驾驶代理的计算机实施方法,该方法包括以下步骤:由处理器使用神经网络从驾驶行为的演示中提取信息;将提取的信息传输到发生器模块;将与驾驶行为的演示相关联的真实环境状态传输到鉴别器模块;由处理器使用发生器模块从提取的信息中产生环境状态解译;由处理器训练鉴别器模块以更好地确定所产生的环境状态解译是否对应于真实环境状态,同时由处理器训练发生器模块以产生鉴别器确定对应于真实环境状态的改进的环境状态解译;并且由处理器使用从经过训练的发生器模块中产生的环境状态解译来恢复奖励图。

    使用神经网络对上下文信息进行嵌入式编码的方法

    公开(公告)号:CN110857100A

    公开(公告)日:2020-03-03

    申请号:CN201910498016.2

    申请日:2019-06-10

    Abstract: 本发明提供了用于实现控制自主车辆(AV)的神经网络系统的系统、装置以及方法,包括:具有多个节点的神经网络,这些节点具有实现自主车辆操作的“上下文到向量(context2vec)”上下文嵌入;按时序嵌入上下文和行为数据的多个编码的上下文到向量自主车辆词;输入集,其包括:当前、先前以及后续的编码的上下文到向量自主车辆中的至少一个;神经网络解决方案,由至少一个计算机应用以基于当前上下文到向量自主车辆词确定各输入集的目标上下文到向量自主车辆词;由神经网络计算的输出向量,其表示输入的编码上下文到向量自主车辆词的嵌入分布独热方案;以及行为控制操作集,其用于控制自主车辆的行为。

Patent Agency Ranking