-
公开(公告)号:CN119513292B
公开(公告)日:2025-05-13
申请号:CN202411250877.6
申请日:2024-09-06
Applicant: 中国科学院自动化研究所
IPC: G06F16/335 , G06F40/16 , G06N5/04 , G06F40/35
Abstract: 本发明提供一种基于大语言模型增强的推荐策略生成方法及相关设备。其中,方法包括获取推荐任务;将所述推荐任务输入至智能体,获取所述智能体输出的推荐策略;其中,所述智能体是基于样本推荐任务和大语言模型进行训练得到的,所述大语言模型用于基于所述样本推荐任务预测用户行为。本发明通过将大语言模型与强化学习智能体相结合,有效解决了传统方法难以快速提供准确的推荐策略的问题,实现了在提高推荐策略的准确性和个性化程度的同时,也提升了推荐系统的效率和适应性。
-
公开(公告)号:CN117973554B
公开(公告)日:2025-03-21
申请号:CN202311865731.8
申请日:2023-12-29
Applicant: 中国科学院自动化研究所
IPC: G06N20/00 , G06N3/0464 , G06N3/084
Abstract: 本发明提供一种视觉变化环境的强化学习泛化方法及装置,包括:将当前时刻智能体的原始状态、当前时刻智能体的动作、当前时刻智能体的环境奖励以及下一时刻智能体的原始状态关联存放于回放池中;使用增强函数对原始状态进行增强,得到原始状态对应的增强状态;对原始状态以及增强状态分别加入显著性引导信息,结合回放池中的数据以及增强状态获取智能体的价值一致性损失,基于价值一致性损失更新智能体的价值网络及表征网络;获取原始状态以及增强状态对应的智能体的策略一致性损失,基于策略一致性损失更新智能体的策略网络;通过动力学模型获取原始状态以及增强状态对应的智能体的动力学损失,基于动力学损失更新智能体的表征网络与动力学模型。
-
公开(公告)号:CN117973554A
公开(公告)日:2024-05-03
申请号:CN202311865731.8
申请日:2023-12-29
Applicant: 中国科学院自动化研究所
IPC: G06N20/00 , G06N3/0464 , G06N3/084
Abstract: 本发明提供一种视觉变化环境的强化学习泛化方法及装置,包括:将当前时刻智能体的原始状态、当前时刻智能体的动作、当前时刻智能体的环境奖励以及下一时刻智能体的原始状态关联存放于回放池中;使用增强函数对原始状态进行增强,得到原始状态对应的增强状态;对原始状态以及增强状态分别加入显著性引导信息,结合回放池中的数据以及增强状态获取智能体的价值一致性损失,基于价值一致性损失更新智能体的价值网络及表征网络;获取原始状态以及增强状态对应的智能体的策略一致性损失,基于策略一致性损失更新智能体的策略网络;通过动力学模型获取原始状态以及增强状态对应的智能体的动力学损失,基于动力学损失更新智能体的表征网络与动力学模型。
-
公开(公告)号:CN110415277B
公开(公告)日:2022-03-08
申请号:CN201910669359.0
申请日:2019-07-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于智能驾驶领域,具体涉及一种基于光流和卡尔曼滤波的多目标追踪方法、系统、装置,旨在解决多目标追踪过分依赖于检测及匹配难度大的问题。本系统方法包括获取输入视频中t时刻的图像帧;对图像帧进行多目标检测,构建检测目标的目标区域集合;根据t‑1时刻追踪到的目标,通过预设的追踪模型分别预测目标在t时刻图像帧中对应的目标区域,构建预测目标的目标区域集合;对检测目标、预测目标的目标区域集合,通过区域相似度,以及匈牙利算法获取两个目标区域集合中目标区域匹配关系;将检测目标的目标区域集合中匹配成功的目标区域作为t时刻追踪到的目标区域。本发明实现多目标的准确预测,提高了多帧目标的位置匹配及追踪的准确率。
-
公开(公告)号:CN119312672B
公开(公告)日:2025-04-18
申请号:CN202411361134.6
申请日:2024-09-27
Applicant: 中国科学院自动化研究所
IPC: G06F30/27 , G06F30/15 , G06F18/213 , G06F18/2431 , G06F18/214
Abstract: 本发明提供了一种基于真实交通数据集的自动驾驶仿真方法,可以应用于智能驾驶技术领域。该方法包括:对真实交通数据集进行数据解析和格式处理,基于所得到的字典格式交通数据集初始化仿真环境中的实体,并对初始化所得到的多类别实体实例进行管理;利用多类别实体实例计算仿真环境中实体的几何特征以及实体间的几何关系,并利用预定义的实时检测与跟踪算法对多类别实体实例进行处理,得到仿真环境中的全局规划方案;基于几何关系和全局规划方案,利用待测试的自动驾驶算法得到仿真环境中被控车辆实体的期望运动策略,并基于期望运动策略对车辆运动学模型进行求解,得到被控车辆实体的未来运动状态进而实现被控车辆实体的自动驾驶仿真。
-
公开(公告)号:CN119514716A
公开(公告)日:2025-02-25
申请号:CN202411318441.6
申请日:2024-09-20
Applicant: 中国科学院自动化研究所
IPC: G06N20/00 , G06Q10/047
Abstract: 一种基于视觉语言大模型的自动驾驶规划方法及相关设备,涉及人工智能技术领域。其中方法包括:获取驾驶场景信息;将所述驾驶场景信息输入至视觉语言大模型,获取所述视觉语言大模型输出的自动驾驶规划参数,其中,所述视觉语言大模型是通过样本驾驶场景信息和思维链微调得到,所述思维链用于辅助所述视觉语言大模型对所述样本驾驶场景信息进行多阶段推理分析。实施本发明提供的技术方案,通过多阶段推理提高了模型输出的可靠性,增强了自动驾驶系统的安全性。
-
公开(公告)号:CN119513292A
公开(公告)日:2025-02-25
申请号:CN202411250877.6
申请日:2024-09-06
Applicant: 中国科学院自动化研究所
IPC: G06F16/335 , G06F40/16 , G06N5/04 , G06F40/35
Abstract: 本发明提供一种基于大语言模型增强的推荐策略生成方法及相关设备。其中,方法包括获取推荐任务;将所述推荐任务输入至智能体,获取所述智能体输出的推荐策略;其中,所述智能体是基于样本推荐任务和大语言模型进行训练得到的,所述大语言模型用于基于所述样本推荐任务预测用户行为。本发明通过将大语言模型与强化学习智能体相结合,有效解决了传统方法难以快速提供准确的推荐策略的问题,实现了在提高推荐策略的准确性和个性化程度的同时,也提升了推荐系统的效率和适应性。
-
公开(公告)号:CN111611956B
公开(公告)日:2023-09-26
申请号:CN202010466033.0
申请日:2020-05-28
Applicant: 中国科学院自动化研究所
IPC: G06V20/54 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种面向地铁视觉图像的轨道检测方法及系统,所述检测方法包括:采集地铁场景下的多个轨道图像,作为训练图像;通过基于卷积神经网络的特征提取网络,对训练图像进行特征提取,得到对应的图像特征;采用信息聚合算法,根据所述图像特征,得到基于轨道形状和分布特征的融合特征;根据所述融合特征,建立分类预测模型;根据所述分类预测模型,预测待处理轨道图像的各像素点的类别。本发明通过对训练图像特征提取,得到图像特征,进一步考虑轨道特殊的分布和形状特征,采用信息聚合算法,根据图像特征得到基于轨道形状和分布特征的融合特征;进而根据融合特征建立分类预测模型,可以准确、有效地预测出待处理轨道图像的各像素点的类别。
-
公开(公告)号:CN110304045B
公开(公告)日:2020-12-15
申请号:CN201910552495.1
申请日:2019-06-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于智能驾驶领域,具体涉及一种智能驾驶横向换道决策方法,旨在为了解决现有决策方法对未知情况的泛化能力和对异常情况的抗干扰能力较差的问题。本发明采集目标车辆及相邻车辆的速度信息和位置信息,转化为环境表征;通过基于深度强化学习算法构建的高层决策模型获取高层横向驾驶决策动作;基于环境信息和高层横向驾驶决策动作,通过基于规则的低层校正器校正高层横向驾驶决策动作,获取目标车辆最终的横向驾驶决策动作。本发明在基于学习的方法的基础上,加入规则的限制,相比于规则的方法提高了泛化能力,相比于学习的方法提高了对异常情况的抗干扰能力,提高了稳定性,可实现高速路场景下安全、稳定的车辆自主横向换道决策。
-
公开(公告)号:CN111611956A
公开(公告)日:2020-09-01
申请号:CN202010466033.0
申请日:2020-05-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种面向地铁视觉图像的轨道检测方法及系统,所述检测方法包括:采集地铁场景下的多个轨道图像,作为训练图像;通过基于卷积神经网络的特征提取网络,对训练图像进行特征提取,得到对应的图像特征;采用信息聚合算法,根据所述图像特征,得到基于轨道形状和分布特征的融合特征;根据所述融合特征,建立分类预测模型;根据所述分类预测模型,预测待处理轨道图像的各像素点的类别。本发明通过对训练图像特征提取,得到图像特征,进一步考虑轨道特殊的分布和形状特征,采用信息聚合算法,根据图像特征得到基于轨道形状和分布特征的融合特征;进而根据融合特征建立分类预测模型,可以准确、有效地预测出待处理轨道图像的各像素点的类别。
-
-
-
-
-
-
-
-
-