-
公开(公告)号:CN116364262A
公开(公告)日:2023-06-30
申请号:CN202211390344.9
申请日:2022-11-08
Applicant: 北京理工大学 , 北京电子工程总体研究所
Abstract: 本发明公开的一种基于聚合博弈的配送机器人充电调度方法,属于配送机器人充电调度领域。本发明选用带有线性映射关系的L‑BPNN神经网络构建智能配送机器人的分布式充电成本优化模型;选用聚合博弈求解分布式充电成本模型优化问题,有效利用特征数据变量间的非合作性与相互影响,提高充电调度精度和效率;在充电调度聚合博弈过程中,引入全局指导变量且各配送机器人根据全局指导变量同时更新自身的充电策略,显著缩短充电调度聚合博弈过程达到纳什均衡的所需时间,同时避免过度追求低成本引起的偏离问题;通过遗传算法迭代优化智能配送机器人分布式充电优化模型的L‑BPNN神经网络参数,提高智能配送机器人分布式充电优化模型的预测精度和效率。
-
公开(公告)号:CN116013479A
公开(公告)日:2023-04-25
申请号:CN202211395647.X
申请日:2022-11-08
Applicant: 北京理工大学 , 北京电子工程总体研究所
IPC: G16H40/20 , G06F30/27 , G06Q10/0631 , G06N3/006 , G06N3/048 , G06N3/0499 , G06N3/084 , G06F18/214 , G06F18/15 , G06F111/06 , G06F111/04
Abstract: 本发公开的一种基于多目标优化的智能配送机器人系统资源动态规划方法,属于智能配送机器人系统资源动态部署领域。本发明通过皮尔森卡方检验对有效样本数据进行相关性分析,筛选出对部署结果有影响的特征数据变量,并构建数据集;选用带有线性映射关系的L‑BPNN神经网络构建智能配送机器人的部署优化模型;选用粒子群算法求解智能配送机器人的部署模型优化问题,有效解决智能配送机器人部署的多目标耦合优化问题;通过遗传算法分别迭代优化智能配送机器人部署优化模型、充电桩数量优化模型和单层的充电桩选址模型的L‑BPNN神经网络参数,提高预测精度和效率,进而实现配送机器人高精度高效率资源规划,使智能配送机器人资源在不同工况下达到最优部署。
-
公开(公告)号:CN115952355A
公开(公告)日:2023-04-11
申请号:CN202211674562.5
申请日:2022-12-05
Applicant: 北京电子工程总体研究所 , 北京理工大学
IPC: G06F16/9535 , G06F16/9537 , G06N3/044
Abstract: 本发明公开了一种基于时空幂律注意力的下一兴趣点推荐系统,涉及推荐系统领域,本发明包括:短期偏好模块:利用循环神经网络,捕获用户签到序列的短期偏好ht;长期偏好模块,计算时间间隔幂律分布、地理距离幂律分布及时空幂律注意力,结合所述短期偏好ht计算用户的长期偏好下一兴趣点推荐模块:结合所述短期偏好ht、所述长期偏好及用户表示pu,通过神经网络预测下一兴趣点并推荐。有益效果是:所述系统利用各次签到之间的时间间隔和地理距离的幂律衰减性质提出时空幂律注意力建模用户的长期偏好,在建模中考虑非连续签到之间的时空关系,提高了下一兴趣点推荐的效果。
-
公开(公告)号:CN116629394A
公开(公告)日:2023-08-22
申请号:CN202310118653.9
申请日:2023-02-03
Applicant: 北京理工大学 , 北京电子工程总体研究所
Abstract: 本发明公开了一种基于网络化结构的多级保障选址方法。本发明引入了基于任务使命的多级选址方法。针对疫情背景下政府运营管理的实际需求,以不同保障层级任务使命为依据确定不同的选址目标,由此完成对疫情生活物资保障的三级选址模型的构建,提高了保障选址模型的真实性、可行性。而且,本发明根据低层级的节点选址情况,对上一保障层级的节点进行选址,形成稳定、便捷的网络化保障系统。此外,本发明还通过两阶段算法,将节点数庞大的第一级保障层的节点选址模型划分为两个阶段,针对需求量高的居民区引入基于启发式规则的二次选址,减少了第一阶段的求解的复杂性,有效提高了选址效率。
-
公开(公告)号:CN114030652B
公开(公告)日:2023-09-12
申请号:CN202111106974.4
申请日:2021-09-22
Applicant: 北京电子工程总体研究所
Abstract: 本发明实施例公开一种避障路径规划方法和系统,在一个实施例中,所述方法包括:S1、选取的状态量,根据无障碍条件下路径规划的目标函数,利用Radau伪谱法解算控制量,以完成无障碍条件下初始全局规划路径;S2、模型化障碍物轮廓,建立障碍物的伪距离与惩罚函数;S3、根据无障碍条件下初始全局规划路径与惩罚函数建立避障规划目标函数,根据避障规划目标函数完成避障路径规划;S4、完成避障机动后,在切换点停止避障机动,转而根据机器人当前状态、目标预测状态、根据无障碍条件下路径规划的目标函数重新全局规划的路径向目标进近。
-
公开(公告)号:CN115861711A
公开(公告)日:2023-03-28
申请号:CN202211674540.9
申请日:2022-12-05
Applicant: 北京电子工程总体研究所 , 北京理工大学
IPC: G06V10/764 , G06V10/774
Abstract: 本发明涉及一种非最优演示下基于决策置信度的模仿学习方法,属于自动驾驶强化学习技术领域。包括:从有标注示例数据集Dc和未标注示例数据集Du中分别进行采样,进行分类器g估计;利用所述Dc的置信度得分构成正则项,修正分类器g的损失函数L(g),对分类器g进行梯度下降优化;利用优化后的分类器g计算所述Du中状态动作对对应的置信度得分,并将标注置信度得分后的数据合并得到合并后的D′c;将D′c中的状态动作对的置信度得分转化为鉴别器与策略网络的权重φ,结合基于生成对抗的模仿学习方法,学习智能体专家策略。本发明能够学习得到一个为状态动作对赋置信分的分类器,为非最优专家演示得到的数据集赋予合适的权重进行模仿学习,并得到用于智能体自动驾驶任务的策略网络。
-
公开(公告)号:CN119521419A
公开(公告)日:2025-02-25
申请号:CN202411560454.4
申请日:2024-11-04
Applicant: 北京科技大学 , 北京电子工程总体研究所
Abstract: 本发明公开了一种基于深度强化学习的无人集群任务资源分配方法,属于人工智能技术领域,所述方法包括:基于无人集群任务资源分配架构,建立无人集群任务资源分配问题的马尔可夫模型;并设计状态表示方式,用图像来对系统状态进行描述;基于卷积神经网络设计图像状态输入卷积神经网络;以所述图像状态输入卷积神经网络作为DQN模型的当前网络和目标网络,并引入迁移学习方法,构建出迁移深度强化学习模型;基于所述马尔可夫模型以及系统状态的图像描述,采用所述迁移深度强化学习模型进行策略学习,实现无人集群任务资源分配。采用本发明的技术方案,能够减少总体任务资源分配延迟并避免资源浪费。
-
公开(公告)号:CN113987914B
公开(公告)日:2024-05-03
申请号:CN202111111744.7
申请日:2021-09-23
Applicant: 北京电子工程总体研究所
IPC: G06F30/27 , G06F119/10 , G06F119/14
Abstract: 本发明的一个实施例公开了一种面向冷气推进的空间机器人跟踪控制方法,包括:S1、建立空间机器人的动力学模型,并引入PID反馈控制,得到前馈反馈控制模型,根据前馈反馈控制模型得到空间机器人的期望推力值;S2、获得空间机器人携带的推力器的理论推力值;S3、采用PWM波方法将步骤S1得到的期望推力值转换成开关值,利用开关值控制电磁阀的通断来模拟推力大小的变化,从而跟踪期望推力值和期望路径,并利用理论推力值和期望推力值获得推力器接通时长topen;S4、在推进过程中利用传感器,通过递推最小二乘‑仿射投影符号算法的混合辨识方法辨识推力器的实际推力值,并利用得到的实际推力值更新步骤S3的理论推力值,进一步获得更新后的推力器接通时长topen。
-
公开(公告)号:CN115982477A
公开(公告)日:2023-04-18
申请号:CN202211552518.7
申请日:2022-12-05
Applicant: 北京电子工程总体研究所 , 北京理工大学
IPC: G06F16/9537 , G06F16/958 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于时空信息表示的下一兴趣点推荐方法,涉及推荐技术领域,包括:个性化签到时间戳的月、周、日、小时四种粒度的周期信息,采用注意力机制计算得到时刻t对于用户的时间个性化表示,根据所述时间个性化表示、时间编码表示及用户签到兴趣点的嵌入式表示,计算用户签到序列的嵌入式表示,并结合签到序列局部信息因果卷积增强后的嵌入式表示、空间关系的嵌入式表示计算新的签到序列表示,以此计算用户在时刻t对兴趣点的偏好。本发明设计了个性化的多粒度周期表示,计算签到之间的注意力时考虑时间间隔与地理距离的表示以在建模用户长期偏好时利用时空信息,利用因果卷积进行局部信息增强以提高下一兴趣点推荐性能。
-
公开(公告)号:CN114030652A
公开(公告)日:2022-02-11
申请号:CN202111106974.4
申请日:2021-09-22
Applicant: 北京电子工程总体研究所
Abstract: 本发明实施例公开一种避障路径规划方法和系统,在一个实施例中,所述方法包括:S1、选取的状态量,根据无障碍条件下路径规划的目标函数,利用Radau伪谱法解算控制量,以完成无障碍条件下初始全局规划路径;S2、模型化障碍物轮廓,建立障碍物的伪距离与惩罚函数;S3、根据无障碍条件下初始全局规划路径与惩罚函数建立避障规划目标函数,根据避障规划目标函数完成避障路径规划;S4、完成避障机动后,在切换点停止避障机动,转而根据机器人当前状态、目标预测状态、根据无障碍条件下路径规划的目标函数重新全局规划的路径向目标进近。
-
-
-
-
-
-
-
-
-