-
公开(公告)号:CN117029825B
公开(公告)日:2025-02-18
申请号:CN202310976356.8
申请日:2023-08-04
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G01C21/20
Abstract: 本发明涉及密集人群环境里移动机器人的安全导航方法及装置。其中的方法包括:估计移动机器人和行人的联合状态,通过基于深度强化学习的价值网络,以获得安全状态约束,通过离散的广义速度障碍,获得安全动作约束,根据安全状态约束和安全动作约束,对安全过滤器求解优化问题,以获得对参考输入进行修正后的最优参考动作,当优化问题无可行解,通过添加局部导航目标作为软约束,并取消安全动作约束,重新求解新的优化问题,当优化问题仍然无可行解,则取消安全状态约束,重新求解新的优化问题,最终获得的修正后的最优参考动作输入到移动机器人中。本发明通过修正基于学习的导航方法求解的最优动作,提高基于学习的导航方法的安全性。
-
公开(公告)号:CN118611625A
公开(公告)日:2024-09-06
申请号:CN202410758052.9
申请日:2024-06-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H03H17/02 , G06N3/0499 , G06N3/048 , G06N3/084
Abstract: 本发明涉及基于自注意力和格轨迹分片线性近似的非线性滤波方法。其方法包括:获取非线性系统及其初始状态估计值,通过嵌入自注意力机制网络的卡尔曼滤波算法进行状态估计,其网络的训练包括:根据非线性系统和初始状态估计值构建状态轨迹,并利用格轨迹分片线性近似方法对原非线性模型进行近似,得到系统的格分片近似模型,根据非线性系统模型和随机生成的噪声构建训练数据集,根据系统的格分片近似模型和批量估计算法构建预训练数据集,根据预训练数据集对简化的自注意力机制网络进行批量预训练后保存网络权重,然后将其嵌入卡尔曼滤波框架中利用训练数据集进行端到端的正式训练。本发明的嵌入自注意力机制的卡尔曼滤波能获得更优滤波效果。
-
公开(公告)号:CN118349026A
公开(公告)日:2024-07-16
申请号:CN202410508761.1
申请日:2024-04-26
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及利用格模型近似显示模型预测控制的卫星姿态控制方法。其中的方法包括:建立卫星的姿态动力学模型;对模型进行线性化和离散化,以获得预测模型;建立目标函数,确定预测模型姿态控制的状态约束和输入约束,以建立模型预测控制的优化问题;将获得的优化问题转化为mpQP形式,以获得对应的KKT条件;在优化问题的状态可行域内生成采样点,利用KKT条件求解采样点对应的控制律;根据采样点的状态及其对应控制率,构建格分片线性模型;将格分片线性模型作为卫星的控制器,将测量得到的系统状态作为输入量,以获得输出量,进而进行卫星姿态控制。本发明在保证控制表现的基础上,可提升卫星姿态控制中的在线计算速度,以及有效节省燃料。
-
公开(公告)号:CN118629234B
公开(公告)日:2024-12-13
申请号:CN202410643565.5
申请日:2024-05-23
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及多路口交通信号灯协同控制方法及设备、可读存储介质。其方法包括:获取交通流信息,输入到基于多智能体强化学习算法的交通信号灯控制模型中,以获得并存储每个智能体的状态、动作和奖励函数;采用基于高效链接神经网络的可解释影响机制,求出不同交通路网上输入数据的重要性系数,并求出加权聚合后的交通流隐变量;采用偏置ReLU神经网络逼近actor‑critic强化学习算法中的价值函数和策略函数,以构造分片线性actor‑critic的框架;采用集中式训练分布式执行的方法,每个智能体的actor通过交通流信息训练得到各自的策略函数;集中式critic根据交通流隐变量,训练得到一个联合价值函数,获得多智能体强化学习算法的最优解。本发明可提高道路交通流的效率和安全性。
-
公开(公告)号:CN118551445A
公开(公告)日:2024-08-27
申请号:CN202410688494.0
申请日:2024-05-30
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F30/13 , G06F30/20 , G06F119/08 , G06F119/14
Abstract: 本发明涉及基于优先级的分布式能源分配方法。其方法包括:根据建筑物的材料和热性质,构建建筑物的热力学模型,将建筑物按照房间和/或楼层划分为多个区域,并确定每个区域优先级;按照优先级从高到低的顺序依次为各个区域编号;将一个区域设定为一个子系统,根据分布式能源分配方法构造分布式优化问题;设定全体子系统从比自身优先级高一级的子系统获得能源限额,或者,设定全体子系统从信息矩阵中根据自身优先级获得能源限额;全体子系统并行求解自己的优化问题;根据优化问题的解,将获得的能源限额作为下一时刻的能源限额,或者,更新所述信息矩阵。本发明可做到全体的子系统并行执行分配策略。
-
公开(公告)号:CN117029825A
公开(公告)日:2023-11-10
申请号:CN202310976356.8
申请日:2023-08-04
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G01C21/20
Abstract: 本发明涉及密集人群环境里移动机器人的安全导航方法及装置。其中的方法包括:估计移动机器人和行人的联合状态,通过基于深度强化学习的价值网络,以获得安全状态约束,通过离散的广义速度障碍,获得安全动作约束,根据安全状态约束和安全动作约束,对安全过滤器求解优化问题,以获得对参考输入进行修正后的最优参考动作,当优化问题无可行解,通过添加局部导航目标作为软约束,并取消安全动作约束,重新求解新的优化问题,当优化问题仍然无可行解,则取消安全状态约束,重新求解新的优化问题,最终获得的修正后的最优参考动作输入到移动机器人中。本发明通过修正基于学习的导航方法求解的最优动作,提高基于学习的导航方法的安全性。
-
公开(公告)号:CN118502433B
公开(公告)日:2025-04-15
申请号:CN202410574711.3
申请日:2024-05-10
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及动态场景中的移动机器人安全运动规划方法及装置。其中的方法包括:在动态环境里,通过定位模块获取移动机器人的状态信息,通过感知模块获取周围的动态障碍物的状态信息,根据当前的移动机器人的状态信息和动态障碍物的信息,结合控制障碍函数和模型预测控制构建避障约束,将避障约束转换为避障代价,加入到模型预测控制的代价方程中,根据避障约束相对于系统控制输入的相对度构建一步安全约束,以作为系统的安全保证约束,求解模型预测控制的优化问题,将该优化问题的最优解作为控制输入,发送到移动机器人的运动控制模块。本发明应用于在动态环境的仿真场景里,有利于保证移动机器人在安全的前提下,能够更加高效地到达目的地。
-
公开(公告)号:CN118611625B
公开(公告)日:2025-02-18
申请号:CN202410758052.9
申请日:2024-06-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H03H17/02 , G06N3/0499 , G06N3/048 , G06N3/084
Abstract: 本发明涉及基于自注意力和格轨迹分片线性近似的非线性滤波方法。其方法包括:获取非线性系统及其初始状态估计值,通过嵌入自注意力机制网络的卡尔曼滤波算法进行状态估计,其网络的训练包括:根据非线性系统和初始状态估计值构建状态轨迹,并利用格轨迹分片线性近似方法对原非线性模型进行近似,得到系统的格分片近似模型,根据非线性系统模型和随机生成的噪声构建训练数据集,根据系统的格分片近似模型和批量估计算法构建预训练数据集,根据预训练数据集对简化的自注意力机制网络进行批量预训练后保存网络权重,然后将其嵌入卡尔曼滤波框架中利用训练数据集进行端到端的正式训练。本发明的嵌入自注意力机制的卡尔曼滤波能获得更优滤波效果。
-
公开(公告)号:CN118629234A
公开(公告)日:2024-09-10
申请号:CN202410643565.5
申请日:2024-05-23
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及多路口交通信号灯协同控制方法、设备及可读存储介质。其方法包括:获取交通流信息,输入到基于多智能体强化学习算法的交通信号灯控制模型中,以获得并存储每个智能体的状态、动作和奖励函数;采用基于高效链接神经网络的可解释影响机制,求出不同交通路网上输入数据的重要性系数,并求出加权聚合后的交通流隐变量;采用偏置ReLU神经网络逼近actor‑critic强化学习算法中的价值函数和策略函数,以构造分片线性actor‑critic的框架;采用集中式训练分布式执行的方法,每个智能体的actor通过交通流信息训练得到各自的策略函数;集中式critic根据交通流隐变量,训练得到一个联合价值函数,获得多智能体强化学习算法的最优解。本发明可提高道路交通流的效率和安全性。
-
公开(公告)号:CN118537701A
公开(公告)日:2024-08-23
申请号:CN202410643564.0
申请日:2024-05-23
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/82 , G06V10/764 , G06N3/082 , G06N3/084 , G06N3/045 , G06N3/0464 , G06N3/0495
Abstract: 本发明涉及基于正交稀疏剪枝胶囊网络的图像分类方法。其中的方法包括:S在密集连接主胶囊层中,初始化一个剪枝胶囊层;对胶囊层中的所有胶囊进行重要性排序,识别出功能上重叠或冗余的胶囊;根据设定的相似度阈值,从排序最后的胶囊开始,剪除识别为重叠或冗余的胶囊,采用基于sparsemax的注意力路由生成注意力图,以优化胶囊之间的信息流动,通过简化的注意力路由,降低计算复杂度和模型参数,根据胶囊网络的参数冗余和模型表达力,确定需要正交化的目标矩阵,通过Householder正交分解法对目标矩阵进行正交化,以引入正交约束。本发明结合了剪枝、正交性和稀疏性来有效地减少冗余。
-
-
-
-
-
-
-
-
-