一种基于双层融合模型的无人驾驶行为预测方法

    公开(公告)号:CN111178584B

    公开(公告)日:2021-12-07

    申请号:CN201911225102.2

    申请日:2019-12-04

    Abstract: 本发明公开了一种基于双层融合模型的无人驾驶行为预测方法,包括步骤1、数据采集系统获取当前汽车的驾驶记录数据,所述驾驶记录数据包括当前汽车行驶的状态与汽车过去行驶的数据记录;步骤2、对数据采集系统获取的数据进行处理,以符合训练驾驶行为预测模型的输入要求;步骤3、数据处理的结果输入驾驶行为预测模型,在改进后的VGG‑LSTM和FCN‑LSTM双任务网络架构上对图片进行训练;步骤4、车辆下一行为预测,根据车辆过去时刻的运动状态和所述驾驶行为预测模型训练的结果输出汽车在下一时刻的运动状态。本发明既不需要给无人驾驶汽车规定特定场景,也无需给出汽车驾驶的条件规则库,在给定汽车过去时刻运动状态的前提下实现下一时刻的行为预测。

    基于生成对抗网络和策略梯度的心电信号去噪方法

    公开(公告)号:CN111067507B

    公开(公告)日:2021-11-26

    申请号:CN201911362882.5

    申请日:2019-12-26

    Abstract: 本发明公开了一种基于生成对抗网络和策略梯度的心电信号去噪方法,包括对测试集中每条心电信号段中的所有样本点进行最大最小归一化;构建生成器和判别器构成的生成对抗网络,生成器建模为一个随机策略,同时也是一个行动者;将判别器建模为评论家,其角色是对生成器输出的样本进行打分;采用梯度下降训练生成器和判别器;设定训练信噪比提升阈值,当信噪比提升值大于训练信噪比提升阈值时停止训练;输出去噪信号。本发明采用强化学习中的策略梯度方法对生成对抗网络进行了优化,分别训练生成器和判别器达到纳什均衡点,此时得到了最好的去噪效果。

    一种用于知识图谱多跳问答的推理方法、装置及存储介质

    公开(公告)号:CN118503366A

    公开(公告)日:2024-08-16

    申请号:CN202410408540.7

    申请日:2024-04-07

    Abstract: 本发明公开了一种用于知识图谱多跳问答的推理方法,包括:在链接预测任务上训练知识图谱嵌入模型;使用深度学习语言模型识别问句主题实体;检索知识图谱中问句主题实体周围k跳邻居实体作为相关性子图;对相关性子图中所有实体节点进行剪枝操作得到候选答案集合;使用知识图谱嵌入评分函数以及链路评分函数对所有候选答案分别计算答案评分;根据知识图谱嵌入评分和链路评分对答案进行复合评分,排序后选择最优答案实体。本发明还公开了用于知识图谱多跳问答的推理装置以及计算机存储介质。本发明可针对不完整(缺失关系)知识图谱进行多跳问答推理,提高问答任务的准确率。

    基于强化学习和双线性卷积网络的车型识别方法

    公开(公告)号:CN111079851A

    公开(公告)日:2020-04-28

    申请号:CN201911371980.5

    申请日:2019-12-27

    Abstract: 本发明公开了一种基于强化学习和双线性卷积网络的车型识别方法,构建深度网络模型,设置细粒度分类网络的超参数并初始化网络;建立优化显著性特征的马尔科夫决策模型;对数据集进行尺度变换;优化注意力区域:在细粒度分类网络参数固定的情况下,将数据集输入细粒度分类网络,并采用强化学习算法优化显著性区域,选择最优的注意力区域;建立对细粒度分类网络参数进行更新的损失函数;融合特征后重复训练网络直到注意力区域不再变化为止;采用需要测试的车型图像输入到训练完成的模型中,获得相应的检测结果。本发明利用强化学习网络来提取底层的显著性特征,并通过双线性插值法来对高层语义特征和低层的显著性特征进行融合提高识别准确率。

    基于强化学习和双线性卷积网络的车型识别方法

    公开(公告)号:CN111079851B

    公开(公告)日:2020-09-18

    申请号:CN201911371980.5

    申请日:2019-12-27

    Abstract: 本发明公开了一种基于强化学习和双线性卷积网络的车型识别方法,构建深度网络模型,设置细粒度分类网络的超参数并初始化网络;建立优化显著性特征的马尔科夫决策模型;对数据集进行尺度变换;优化注意力区域:在细粒度分类网络参数固定的情况下,将数据集输入细粒度分类网络,并采用强化学习算法优化显著性区域,选择最优的注意力区域;建立对细粒度分类网络参数进行更新的损失函数;融合特征后重复训练网络直到注意力区域不再变化为止;采用需要测试的车型图像输入到训练完成的模型中,获得相应的检测结果。本发明利用强化学习网络来提取底层的显著性特征,并通过双线性插值法来对高层语义特征和低层的显著性特征进行融合提高识别准确率。

    基于高斯过程近似模型的小车上山系统自适应控制方法

    公开(公告)号:CN110531620B

    公开(公告)日:2020-09-18

    申请号:CN201910823151.X

    申请日:2019-09-02

    Abstract: 本发明公开了一种基于高斯过程近似模型的小车上山系统自适应控制方法,通过物理系统模拟器产生的在线样本来学习值函数和策略,在此过程中,利用这些在线样本同时学习一个基于高斯过程的环境动态性模型。在该环境动态性模型的精度满足一定精度时,能利用该基于高斯过程的模型进行离线的规划,与在线学习一起共同促进算法的收敛。本发明方法可更快地获取小车上山系统的最优控制方法。

    基于高斯过程近似模型的小车上山系统自适应控制方法

    公开(公告)号:CN110531620A

    公开(公告)日:2019-12-03

    申请号:CN201910823151.X

    申请日:2019-09-02

    Abstract: 本发明公开了一种基于高斯过程近似模型的小车上山系统自适应控制方法,通过物理系统模拟器产生的在线样本来学习值函数和策略,在此过程中,利用这些在线样本同时学习一个基于高斯过程的环境动态性模型。在该环境动态性模型的精度满足一定精度时,能利用该基于高斯过程的模型进行离线的规划,与在线学习一起共同促进算法的收敛。本发明方法可更快地获取小车上山系统的最优控制方法。

    基于上下文多臂赌博机的电商个性化推荐方法

    公开(公告)号:CN110189197A

    公开(公告)日:2019-08-30

    申请号:CN201910428730.4

    申请日:2019-05-22

    Abstract: 本发明公开了一种基于上下文多臂赌博机的电商个性化推荐方法,通过计算上下文信息与上下文多臂赌博机动作特征的相似度,将相似度与模型动作估计值结合为一个新的动作估计值,选择新的动作估计值最大的动作进行推荐。上下文赌博机模型利用的部分是选择相似度最大的动作,根据上下文信息进行推荐;探索的部分是选择估计值最大的动作,对应于推荐系统中的热门推荐,最后根据用户的反馈更新模型。本发明同时利用上下文信息和动作估计值进行动作选择,通过利用来最大化立即奖赏;通过探索发掘用户潜在偏好的信息,增加推荐内容的多样性。同时在上下文信息未知时,通过探索进行推荐,有效解决了推荐领域中的冷启动问题。

    基于多指标概率矩阵分解模型的美食推荐方法

    公开(公告)号:CN110110239A

    公开(公告)日:2019-08-09

    申请号:CN201910341461.8

    申请日:2019-04-26

    Abstract: 本发明公开一种基于多指标概率矩阵分解模型的美食推荐方法,包括如下步骤:(10)构建单指标评分矩阵:根据用户购买记录,构造用户-项目-单指标上下文评分矩阵;(20)构建多指标评分矩阵:根据用户购买记录,结合用户-项目-单指标上下文评分矩阵,构造多指标环境下用户-项目-多指标评分矩阵;(30)求解评分矩阵:求解用户-项目-多指标评分矩阵,得到多个评分值,选择评分值最大的信息进行推荐。本发明的基于多指标概率矩阵分解模型的美食推荐方法,对数据量依赖小、准确度高。

    基于多网络联合学习的驾驶行为决策方法

    公开(公告)号:CN114137967B

    公开(公告)日:2023-12-15

    申请号:CN202111392795.1

    申请日:2021-11-23

    Abstract: 本发明公开了一种基于多网络联合学习的驾驶行为决策方法,包括数据采集,数据包括状态数据及动作;数据正则化;由特征融合卷积网络提取状态特征;构建网络,其中生成对抗网络包括生成器和对抗网络,生成器采用策略网络生成样本,对抗网络用于鉴别生成器生成的样本和专家示例;隐变量估计网络估计策略网络中的隐变量,策略网络用于根据当前状态特征和隐变量生成动作;采用无监督学习和监督学习训练对抗网络和隐变量估计网络,采用策略梯度算法训练策略网络;当前在线数据经过训练后的策略网络,实现驾驶行为决策。本发明采用人工智能的方法,即不需要给智能体规定特定场景,也无需给出智能体的条件规则库就可以自动学习行为策略,具有更为广泛的应用性。

Patent Agency Ranking