-
公开(公告)号:CN111242912A
公开(公告)日:2020-06-05
申请号:CN202010018495.6
申请日:2020-01-08
Applicant: 北京电子工程总体研究所
Abstract: 本发明公开了一种烟幕干扰效能获取方法,包括:分别获取测试场景在无烟幕环境下的第一红外图像和在烟幕环境下的第二红外图像;基于所述第一红外图像生成第一靶标阵列并基于所述第二红外图像生成第二标靶阵列;基于所述第一红外图像、所述第二红外图像、所述第一靶标阵列和第二靶标阵列生成计算模型,并计算烟幕有效遮蔽面积,以获取烟幕干扰效能。本发明将计算机图像处理的方式应用到外场烟幕干扰效能评估中,建立了基于红外图像的烟幕干扰效能的计算模型,实现了外场试验靶标的精确评估,具有烟幕干扰效能评估精度高,简单易操作,具有客观真实且全面评估烟幕干扰效能等优点。
-
公开(公告)号:CN115861711A
公开(公告)日:2023-03-28
申请号:CN202211674540.9
申请日:2022-12-05
Applicant: 北京电子工程总体研究所 , 北京理工大学
IPC: G06V10/764 , G06V10/774
Abstract: 本发明涉及一种非最优演示下基于决策置信度的模仿学习方法,属于自动驾驶强化学习技术领域。包括:从有标注示例数据集Dc和未标注示例数据集Du中分别进行采样,进行分类器g估计;利用所述Dc的置信度得分构成正则项,修正分类器g的损失函数L(g),对分类器g进行梯度下降优化;利用优化后的分类器g计算所述Du中状态动作对对应的置信度得分,并将标注置信度得分后的数据合并得到合并后的D′c;将D′c中的状态动作对的置信度得分转化为鉴别器与策略网络的权重φ,结合基于生成对抗的模仿学习方法,学习智能体专家策略。本发明能够学习得到一个为状态动作对赋置信分的分类器,为非最优专家演示得到的数据集赋予合适的权重进行模仿学习,并得到用于智能体自动驾驶任务的策略网络。
-
公开(公告)号:CN115952355A
公开(公告)日:2023-04-11
申请号:CN202211674562.5
申请日:2022-12-05
Applicant: 北京电子工程总体研究所 , 北京理工大学
IPC: G06F16/9535 , G06F16/9537 , G06N3/044
Abstract: 本发明公开了一种基于时空幂律注意力的下一兴趣点推荐系统,涉及推荐系统领域,本发明包括:短期偏好模块:利用循环神经网络,捕获用户签到序列的短期偏好ht;长期偏好模块,计算时间间隔幂律分布、地理距离幂律分布及时空幂律注意力,结合所述短期偏好ht计算用户的长期偏好下一兴趣点推荐模块:结合所述短期偏好ht、所述长期偏好及用户表示pu,通过神经网络预测下一兴趣点并推荐。有益效果是:所述系统利用各次签到之间的时间间隔和地理距离的幂律衰减性质提出时空幂律注意力建模用户的长期偏好,在建模中考虑非连续签到之间的时空关系,提高了下一兴趣点推荐的效果。
-
公开(公告)号:CN119521419A
公开(公告)日:2025-02-25
申请号:CN202411560454.4
申请日:2024-11-04
Applicant: 北京科技大学 , 北京电子工程总体研究所
Abstract: 本发明公开了一种基于深度强化学习的无人集群任务资源分配方法,属于人工智能技术领域,所述方法包括:基于无人集群任务资源分配架构,建立无人集群任务资源分配问题的马尔可夫模型;并设计状态表示方式,用图像来对系统状态进行描述;基于卷积神经网络设计图像状态输入卷积神经网络;以所述图像状态输入卷积神经网络作为DQN模型的当前网络和目标网络,并引入迁移学习方法,构建出迁移深度强化学习模型;基于所述马尔可夫模型以及系统状态的图像描述,采用所述迁移深度强化学习模型进行策略学习,实现无人集群任务资源分配。采用本发明的技术方案,能够减少总体任务资源分配延迟并避免资源浪费。
-
公开(公告)号:CN115982477A
公开(公告)日:2023-04-18
申请号:CN202211552518.7
申请日:2022-12-05
Applicant: 北京电子工程总体研究所 , 北京理工大学
IPC: G06F16/9537 , G06F16/958 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于时空信息表示的下一兴趣点推荐方法,涉及推荐技术领域,包括:个性化签到时间戳的月、周、日、小时四种粒度的周期信息,采用注意力机制计算得到时刻t对于用户的时间个性化表示,根据所述时间个性化表示、时间编码表示及用户签到兴趣点的嵌入式表示,计算用户签到序列的嵌入式表示,并结合签到序列局部信息因果卷积增强后的嵌入式表示、空间关系的嵌入式表示计算新的签到序列表示,以此计算用户在时刻t对兴趣点的偏好。本发明设计了个性化的多粒度周期表示,计算签到之间的注意力时考虑时间间隔与地理距离的表示以在建模用户长期偏好时利用时空信息,利用因果卷积进行局部信息增强以提高下一兴趣点推荐性能。
-
-
-
-