一种基于风险估计的强化学习自动驾驶安全可解释决策方法

    公开(公告)号:CN118396131A

    公开(公告)日:2024-07-26

    申请号:CN202410487199.9

    申请日:2024-04-23

    Abstract: 本发明属于强化学习与自动驾驶领域,涉及一种基于风险估计的强化学习自动驾驶安全可解释决策方法。本发明包括以下步骤:基于Gym库搭建仿真环境并设置状态和动作空间;根据约束马尔可夫决策过程建模以处理安全约束;设置奖励函数;构建独立的风险估计模块和预期奖励估计模块;使用一个动态权衡参数结合两个网络以选择符合安全约束的最优动作;对联合后的决策网络进行训练,得到训练好的安全自动驾驶决策网络;对驾驶过程中某一状态下的环境特征计算风险显著性度量,实现风险可解释;在验证环境中进行应用。相较于现有方法,本发明从风险角度解决了传统强化学习自动驾驶方法不可解释的问题,利用动态权衡参数实现了安全最优动作的选择。

    一种快速响应的甲醛荧光探针及其制备方法和应用

    公开(公告)号:CN109535147A

    公开(公告)日:2019-03-29

    申请号:CN201811573691.9

    申请日:2018-12-21

    Abstract: 一种快速响应的甲醛荧光探针及其制备方法和应用,其属于甲醛快速检测的技术领域。该探针采用香豆素母体,肼基为反应基团与甲醛反应,通过探针的荧光变化实现甲醛的快速检测。甲醛的响应时间低至220 s,在503 nm处荧光强度显著增强。该探针实现了水溶液中甲醛的快速和无损检测,甲醛的检测下限为5×10-6 mol/L。该探针能抗半胱氨酸、谷胱甘肽、L-精氨酸、柠檬酸钠、高半胱氨酸、苯丙氨酸、丙氨酸、谷氨酸、甘氨酸、甲硫氨酸、抗坏血酸钠、Ca2+、Na+、Mg2+、K+、过氧化氢的干扰,选择特异性好;该探针应用于食品和纺织品中甲醛含量的快速检测中,各项指标优异,完全达到快速检测要求。探针也可通过共聚焦荧光显微镜检测活细胞中的甲醛,并进行荧光成像。

    一种基于时序预测模型的视觉机器人控制方法

    公开(公告)号:CN118331052A

    公开(公告)日:2024-07-12

    申请号:CN202410441627.4

    申请日:2024-04-12

    Abstract: 本发明属于深度强化学习与机器人控制领域,公开一种基于时序预测模型的视觉机器人控制方法。本发明旨在具有环境背景动态干扰的场景下,实现高维观测图像中任务相关信息的提取,从而提高训练的样本效率和泛化性,以高效完成各种视觉机器人控制任务。包括以下步骤:弱增强视图生成;具有上下文意识的强增强视图生成;通过时序预测网络进行未来状态表征预测;计算辅助任务损失;计算强化学习损失并进行端到端联合训练;在验证环境中进行应用。通过本发明在高维图像输入控制任务场景下,模型可以提取高质量且鲁棒的状态表征,显著地提升视觉机器人训练时的样本效率,同时具有更强的泛化性,适用于未知动态干扰环境下的决策,以高效完成复杂控制任务。

    一种快速响应的甲醛荧光探针及其制备方法和应用

    公开(公告)号:CN109535147B

    公开(公告)日:2021-07-20

    申请号:CN201811573691.9

    申请日:2018-12-21

    Abstract: 一种快速响应的甲醛荧光探针及其制备方法和应用,其属于甲醛快速检测的技术领域。该探针采用香豆素母体,肼基为反应基团与甲醛反应,通过探针的荧光变化实现甲醛的快速检测。甲醛的响应时间低至220 s,在503 nm处荧光强度显著增强。该探针实现了水溶液中甲醛的快速和无损检测,甲醛的检测下限为5×10‑6 mol/L。该探针能抗半胱氨酸、谷胱甘肽、L‑精氨酸、柠檬酸钠、高半胱氨酸、苯丙氨酸、丙氨酸、谷氨酸、甘氨酸、甲硫氨酸、抗坏血酸钠、Ca2+、Na+、Mg2+、K+、过氧化氢的干扰,选择特异性好;该探针应用于食品和纺织品中甲醛含量的快速检测中,各项指标优异,完全达到快速检测要求。探针也可通过共聚焦荧光显微镜检测活细胞中的甲醛,并进行荧光成像。

    一种基于多智能体强化学习和上下文感知的多自动导引车路径规划方法

    公开(公告)号:CN120043529A

    公开(公告)日:2025-05-27

    申请号:CN202510116820.5

    申请日:2025-01-24

    Abstract: 一种基于多智能体强化学习和上下文感知的多自动导引车路径规划方法,属于机器学习与智能物流的交叉领域。本发提出的上下文感知信息充分利用AGV在训练过程中对环境的理解,通过自身的长时记忆针对当前AGV的观测信息产生用于辅助其它智能体决策的上下文感知信息。在进行多智能体通信强化学习时,利用AGV的局部特征信息来产生多样化的通信信息,之后结合AGV自身的局部特征信息,得到最终的决策动作概率分布结果。基于集中式训练、分布式执行的训练范式,多AGV系统能够很好的学习到一个高效、直接的路径规划解决方案,有效的提高了AGV在地图上的路径规划效率及准确率,同时也降低了AGV之间的碰撞冲突。

    一种检测生物硫醇新型荧光探针及其制备方法和应用

    公开(公告)号:CN110698401A

    公开(公告)日:2020-01-17

    申请号:CN201911046635.4

    申请日:2019-10-30

    Abstract: 一种检测生物硫醇新型荧光探针的制备方法及应用,其属于生物硫醇分析检测技术领域。探针采用蒽酰亚胺为荧光母体,丙烯基为反应基团与生物硫醇反应,通过探针的荧光变化实现生物硫醇的检测。荧光探针与半胱氨酸反应仅5 min即可达到最大响应值,在601 nm处荧光强度显著增强121倍;检测下限为1.0 x10-5mol/L;荧光探针和反应后的产物,在pH>6.5时荧光强度不受pH变化影响。检测时,观察到溶液颜色从无色至紫色,裸眼能直接判断有无生物硫醇存在。探针检测谷胱甘肽和同型半胱氨酸具有类似的效果。因此,所述荧光探针可用于检测生物硫醇,具有响应快速、灵敏度高、可在生理pH下工作的特点,在生物分子检测领域具有广阔的应用前景。

Patent Agency Ranking