一种基于风险估计的强化学习自动驾驶安全可解释决策方法

    公开(公告)号:CN118396131A

    公开(公告)日:2024-07-26

    申请号:CN202410487199.9

    申请日:2024-04-23

    Abstract: 本发明属于强化学习与自动驾驶领域,涉及一种基于风险估计的强化学习自动驾驶安全可解释决策方法。本发明包括以下步骤:基于Gym库搭建仿真环境并设置状态和动作空间;根据约束马尔可夫决策过程建模以处理安全约束;设置奖励函数;构建独立的风险估计模块和预期奖励估计模块;使用一个动态权衡参数结合两个网络以选择符合安全约束的最优动作;对联合后的决策网络进行训练,得到训练好的安全自动驾驶决策网络;对驾驶过程中某一状态下的环境特征计算风险显著性度量,实现风险可解释;在验证环境中进行应用。相较于现有方法,本发明从风险角度解决了传统强化学习自动驾驶方法不可解释的问题,利用动态权衡参数实现了安全最优动作的选择。

    一种基于知识蒸馏和对抗训练的三维体素图像分割方法

    公开(公告)号:CN112465111B

    公开(公告)日:2024-06-21

    申请号:CN202011289486.7

    申请日:2020-11-17

    Abstract: 本发明属于图像分割领域,提供了一种基于知识蒸馏和对抗训练的三维体素图像分割方法,分为两个部分:训练多个教师网络进行集成学习,多个教师网络将作为先验知识获得软目标用于学生网络的训练;对抗训练学生网络,使用教师网络的软目标和图像标签进行监督训练,使用教师网络中间特征图监督,加入判别器构建GANs损失监督训练。本发明使用知识蒸馏扩充了可使用的数据,并且使用知识蒸馏进行了知识迁移,实现了模型压缩。对于三维体素图像的深度学习模型来说,节省了参数,使其更容易部署。使用知识蒸馏和对抗训练结合,使正则化效果更明显了,一定程度上解决了三维体素图像因为数据量稀少而造成的过拟合问题。

    一种基于多任务优化算法的机械臂结构设计方法

    公开(公告)号:CN114218715A

    公开(公告)日:2022-03-22

    申请号:CN202111574118.1

    申请日:2021-12-21

    Abstract: 本发明公开一种基于多任务优化算法的机械臂结构设计方法,不同于传统多任务优化算法在全部任务中随机选择任务进行迁移的方式,而是根据任务表示特征的相似程度,将它们分为大小适中的小组,并在组内相似的任务间进行知识迁移。本发明增加有效知识迁移发生的概率,降低计算成本,更好地适用于任务规模较大的场景。在知识迁移的方式上,本发明在继承传统多任务优化算法中从最好的解决方案中进行知识迁移的策略基础上,引入从进步较快任务和任务更新轨迹信息中进行知识迁移的方式,并自适应地调整从这三种方式中迁移知识量的大小,充分发掘同组内相似任务之间有效知识的迁移潜力,促使机械臂在各个任务上得到收敛速度更快、表现更好的解决方案。

    基于D2D通信技术的移动群智感知可靠数据收集方法

    公开(公告)号:CN112153648B

    公开(公告)日:2022-03-22

    申请号:CN202010907337.6

    申请日:2020-09-02

    Abstract: 本发明属于数据处理技术领域,涉及基于D2D通信技术的移动群智感知可靠数据收集方法。步骤如下:步骤一,服务器通过基站发布任务tn及其所需传感数据的要求。步骤二,位于相应基站下的参与者们Wn={w1,w2,...,wM},参与任务tn并生成任务所需传感数据,参与者对收到的传感数据进行可靠性验证,并将验证信息上传至服务器。步骤三,服务器根据验证信息执行数据可靠性验证,计算获得各传感数据可靠率并将可靠率大于可信阈值的传感数据判定为可靠。步骤四,将被服务器选出的可靠数据上传至服务器执行移动群智感知任务tn。本发明在终端验证数据可靠性并只将可靠数据上传,能大量降低参与者上传成本、基站通信负担和服务器计算资源,更好的激励参与者参与移动群智感知任务。

    一种基于迁移学习和注意力机制的跨语料库情感识别方法

    公开(公告)号:CN113065344A

    公开(公告)日:2021-07-02

    申请号:CN202110330443.7

    申请日:2021-03-24

    Abstract: 本发明属于迁移学习、情感计算等技术领域,涉及一种基于迁移学习和注意力机制的跨语料库情感识别方法。本发明方法中使用编码‑解码在源语料库上进行训练,并通过循环卷积神经网络RNN提取上下文中的情感依赖和传递情况,将编码和上下文情感依赖等特征参数迁移到目标语料库的训练中,通过训练将迁移损失控制在一定范围内进而完成知识迁移,在目标语料库上借助迁移学习的知识进行编码‑上下文特征参数提取‑分类的操作,最终完成目标语料库上说话人情感状态判定的任务,能够有效解决小样本训练不充分的问题。

    一种基于知识蒸馏和对抗训练的三维体素图像分割方法

    公开(公告)号:CN112465111A

    公开(公告)日:2021-03-09

    申请号:CN202011289486.7

    申请日:2020-11-17

    Abstract: 本发明属于图像分割领域,提供了一种基于知识蒸馏和对抗训练的三维体素图像分割方法,分为两个部分:训练多个教师网络进行集成学习,多个教师网络将作为先验知识获得软目标用于学生网络的训练;对抗训练学生网络,使用教师网络的软目标和图像标签进行监督训练,使用教师网络中间特征图监督,加入判别器构建GANs损失监督训练。本发明使用知识蒸馏扩充了可使用的数据,并且使用知识蒸馏进行了知识迁移,实现了模型压缩。对于三维体素图像的深度学习模型来说,节省了参数,使其更容易部署。使用知识蒸馏和对抗训练结合,使正则化效果更明显了,一定程度上解决了三维体素图像因为数据量稀少而造成的过拟合问题。

    一种基于图神经网络的超大图像分类方法

    公开(公告)号:CN111738318A

    公开(公告)日:2020-10-02

    申请号:CN202010530337.9

    申请日:2020-06-11

    Abstract: 本发明属于图像分类领域,涉及一种基于图神经网络的超大图像分类方法。本发明针对不同的超大图像可采取不同子图像筛选方法,进一步调整了特征提取网络,使得子图像的特征提取更加准确;将超大图像构建成为图数据,并且在传统的图卷积神经网络上引入了可微分池化操作,不仅可以挖掘超大图像的全局信息,同时可微池化操作还可以在训练过程中挖掘隐藏层的特征信息,充分分析各个子图像之间在特征空间的关联性,可以更加准确地对超大图像进行分类。

    一种基于在线双填充准则的代理辅助的机器人形态优化方法

    公开(公告)号:CN119952698A

    公开(公告)日:2025-05-09

    申请号:CN202510054704.5

    申请日:2025-01-14

    Abstract: 本发明涉及机器人形态优化领域,提出一种基于在线双填充准则的代理辅助的机器人形态优化方法。传统优化方法依赖昂贵的评估,而本发明通过在线代理模型替代昂贵评估,并结合粒子群优化算法有效搜索形态空间。具体包括:采用双层循环框架,外层通过粒子群优化算法优化形态,内层利用代理模型评估形态。通过将部分昂贵评估数据两两拼接,扩展训练数据来训练代理模型。代理模型基于径向基神经网络,并集成多个神经网络来提高预测准确性。通过使用新颖度和适应度两种填充准则作为挑选粒子的标准,使用部分昂贵评估来在线更新训练数据。该发明大幅降低了计算成本,能够有效指导机器人在复杂任务中优化形态,并获得良好的任务执行效果。

    一种基于多任务优化算法的机械臂结构设计方法

    公开(公告)号:CN114218715B

    公开(公告)日:2024-09-17

    申请号:CN202111574118.1

    申请日:2021-12-21

    Abstract: 本发明公开一种基于多任务优化算法的机械臂结构设计方法,不同于传统多任务优化算法在全部任务中随机选择任务进行迁移的方式,而是根据任务表示特征的相似程度,将它们分为大小适中的小组,并在组内相似的任务间进行知识迁移。本发明增加有效知识迁移发生的概率,降低计算成本,更好地适用于任务规模较大的场景。在知识迁移的方式上,本发明在继承传统多任务优化算法中从最好的解决方案中进行知识迁移的策略基础上,引入从进步较快任务和任务更新轨迹信息中进行知识迁移的方式,并自适应地调整从这三种方式中迁移知识量的大小,充分发掘同组内相似任务之间有效知识的迁移潜力,促使机械臂在各个任务上得到收敛速度更快、表现更好的解决方案。

Patent Agency Ranking