-
公开(公告)号:CN117610643B
公开(公告)日:2024-10-11
申请号:CN202311532896.3
申请日:2023-11-16
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种离散化多智能体的深度强化学习方法及系统。所述方法包括:获取多智能体系统中的所有智能体的动作及所有智能体的观测;迭代执行至少一次第一训练过程,直至达到预设训练次数或多智能体系统对应的深度强化学习网络的损失函数收敛。本发明使用一种离散化处理的网络结构来表征多智能体系统的观测以及其他智能体的动作,该离散化网络以所有智能体的观测和其他智能体的动作作为输入,用于离散化智能体的智能体观测集合以及其他智能体的动作,能够减轻环境中噪声对智能体决策的影响,促进智能体的协作,提升多智能体系统的协作效率。
-
公开(公告)号:CN117610643A
公开(公告)日:2024-02-27
申请号:CN202311532896.3
申请日:2023-11-16
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种离散化多智能体的深度强化学习方法及系统。所述方法包括:获取多智能体系统中的所有智能体的动作及所有智能体的观测;迭代执行至少一次第一训练过程,直至达到预设训练次数或多智能体系统对应的深度强化学习网络的损失函数收敛。本发明使用一种离散化处理的网络结构来表征多智能体系统的观测以及其他智能体的动作,该离散化网络以所有智能体的观测和其他智能体的动作作为输入,用于离散化智能体的智能体观测集合以及其他智能体的动作,能够减轻环境中噪声对智能体决策的影响,促进智能体的协作,提升多智能体系统的协作效率。
-
公开(公告)号:CN111611956B
公开(公告)日:2023-09-26
申请号:CN202010466033.0
申请日:2020-05-28
Applicant: 中国科学院自动化研究所
IPC: G06V20/54 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种面向地铁视觉图像的轨道检测方法及系统,所述检测方法包括:采集地铁场景下的多个轨道图像,作为训练图像;通过基于卷积神经网络的特征提取网络,对训练图像进行特征提取,得到对应的图像特征;采用信息聚合算法,根据所述图像特征,得到基于轨道形状和分布特征的融合特征;根据所述融合特征,建立分类预测模型;根据所述分类预测模型,预测待处理轨道图像的各像素点的类别。本发明通过对训练图像特征提取,得到图像特征,进一步考虑轨道特殊的分布和形状特征,采用信息聚合算法,根据图像特征得到基于轨道形状和分布特征的融合特征;进而根据融合特征建立分类预测模型,可以准确、有效地预测出待处理轨道图像的各像素点的类别。
-
公开(公告)号:CN111597961B
公开(公告)日:2023-04-25
申请号:CN202010400600.2
申请日:2020-05-13
Applicant: 中国科学院自动化研究所
IPC: G06V20/56 , G06N3/0464 , G06N3/0442
Abstract: 本发明属于数据挖掘、智能驾驶领域,具体涉及一种面向智能驾驶的移动目标轨迹预测方法、系统、装置,旨在解决现有的移动目标轨迹预测方法预测精度较低的问题。本系统方法包括:获取输入视频中的图像帧;获取各图像帧中所有移动目标对应的检测区域,并分别计算第一影响;提取各第一影响、各第一位置信息的特征分别构建第一特征序列、第二特征序列;通过注意力机制分别对第一特征序列、第二特征序列中的各特征进行时间维度上的加权求和;结合待预测目标在待预测时刻上一时刻的位置信息提取的特征,进行加权求和,并通过解码器得到待预测目标待预测时刻的预测位置;迭代获取设定时间段内的多个预测位置,构建预测轨迹。本发明提高了轨迹预测的精度。
-
公开(公告)号:CN113894780A
公开(公告)日:2022-01-07
申请号:CN202111136603.0
申请日:2021-09-27
Applicant: 中国科学院自动化研究所
IPC: B25J9/16
Abstract: 本发明提供一种多机器人协作对抗方法、装置、电子设备和存储介质,其中方法包括:获取对抗环境的当前全局状态信息,以及每一己方机器人的当前局部观测信息;将所述对抗环境的当前全局状态信息和每一己方机器人的当前局部观测信息输入至协作对抗模型,得到所述协作对抗模型输出的每一己方机器人的当前决策行为;基于每一己方机器人的当前决策行为,对每一己方机器人进行控制。本发明提供的方法、装置、电子设备和存储介质,利用了对方机器人的训练数据,扩大了训练样本,提高了训练数据的利用率,提高了协作对抗模型的鲁棒性和准确性。
-
公开(公告)号:CN113837348A
公开(公告)日:2021-12-24
申请号:CN202110858503.2
申请日:2021-07-28
Applicant: 中国科学院自动化研究所
IPC: G06N3/02 , G06N3/08 , A63F13/847 , A63F13/822
Abstract: 本发明提供一种基于强化学习的变化环境多智能体控制方法与装置,包括:将当前环境信息和各个智能体的隐含状态输入到智能体网络,得到智能体网络输出的各个智能体的观测动作价值;观测动作价值用于表征对应智能体当前执行所有动作的预估价值;基于各个智能体的观测动作价值,控制各个智能体执行动作;其中,智能体网络是基于样本环境信息和样本智能体的样本隐含状态,联合自加权网络进行强化学习得到的;自加权网络用于确定所有样本智能体执行动作的联合动作价值;在强化学习过程中,自加权网络的输入包括智能体网络输出的所有样本智能体的样本观测动作价值。本发明提供的方法与装置能够避免变化环境中智能体数量动态变化对训练过程的影响。
-
公开(公告)号:CN110304045B
公开(公告)日:2020-12-15
申请号:CN201910552495.1
申请日:2019-06-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于智能驾驶领域,具体涉及一种智能驾驶横向换道决策方法,旨在为了解决现有决策方法对未知情况的泛化能力和对异常情况的抗干扰能力较差的问题。本发明采集目标车辆及相邻车辆的速度信息和位置信息,转化为环境表征;通过基于深度强化学习算法构建的高层决策模型获取高层横向驾驶决策动作;基于环境信息和高层横向驾驶决策动作,通过基于规则的低层校正器校正高层横向驾驶决策动作,获取目标车辆最终的横向驾驶决策动作。本发明在基于学习的方法的基础上,加入规则的限制,相比于规则的方法提高了泛化能力,相比于学习的方法提高了对异常情况的抗干扰能力,提高了稳定性,可实现高速路场景下安全、稳定的车辆自主横向换道决策。
-
公开(公告)号:CN111611956A
公开(公告)日:2020-09-01
申请号:CN202010466033.0
申请日:2020-05-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种面向地铁视觉图像的轨道检测方法及系统,所述检测方法包括:采集地铁场景下的多个轨道图像,作为训练图像;通过基于卷积神经网络的特征提取网络,对训练图像进行特征提取,得到对应的图像特征;采用信息聚合算法,根据所述图像特征,得到基于轨道形状和分布特征的融合特征;根据所述融合特征,建立分类预测模型;根据所述分类预测模型,预测待处理轨道图像的各像素点的类别。本发明通过对训练图像特征提取,得到图像特征,进一步考虑轨道特殊的分布和形状特征,采用信息聚合算法,根据图像特征得到基于轨道形状和分布特征的融合特征;进而根据融合特征建立分类预测模型,可以准确、有效地预测出待处理轨道图像的各像素点的类别。
-
公开(公告)号:CN111597961A
公开(公告)日:2020-08-28
申请号:CN202010400600.2
申请日:2020-05-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于数据挖掘、智能驾驶领域,具体涉及一种面向智能驾驶的移动目标轨迹预测方法、系统、装置,旨在解决现有的移动目标轨迹预测方法预测精度较低的问题。本系统方法包括:获取输入视频中的图像帧;获取各图像帧中所有移动目标对应的检测区域,并分别计算第一影响;提取各第一影响、各第一位置信息的特征分别构建第一特征序列、第二特征序列;通过注意力机制分别对第一特征序列、第二特征序列中的各特征进行时间维度上的加权求和;结合待预测目标在待预测时刻上一时刻的位置信息提取的特征,进行加权求和,并通过解码器得到待预测目标待预测时刻的预测位置;迭代获取设定时间段内的多个预测位置,构建预测轨迹。本发明提高了轨迹预测的精度。
-
公开(公告)号:CN109466552B
公开(公告)日:2020-07-28
申请号:CN201811260601.0
申请日:2018-10-26
Applicant: 中国科学院自动化研究所
IPC: B60W30/12
Abstract: 本发明涉及一种智能驾驶车道保持方法及系统,所述智能驾驶车道保持方法包括:获取驾驶员视角的当前前方图像;基于预设的驾驶图像感知模型,预测所述当前前方图像的车道特征;基于预设的数据驱动车道保持模型,根据所述车道特征,计算方向盘转角控制量;根据所述方向盘转角控制量,控制本车行驶在车道中央。本发明通过采用多任务学习网络构建所述驾驶图像感知模型,促使所述驾驶图像感知模型学习到多个相关任务共有的图像特征,可提高车道特征预测的准确率;在方向盘转角控制量计算中,采用数据驱动的方法,不依赖于车辆模型,可提高方向盘转角控制量计算的准确性与鲁棒性。
-
-
-
-
-
-
-
-
-