Patent search ap:("中国科学技术大学" OR "西安电子科技大学") AND inv:"王毅博" Page 1

1.

发明公开
电子对抗离线决策方法、系统、设备及存储介质审中-实审

公开(公告)号：CN119830989A

公开(公告)日：2025-04-15

申请号：CN202411893456.5

申请日：2024-12-20

Applicant: 中国科学技术大学 , 西安电子科技大学

Inventor： 王毅博 , 刘洵 , 胡自然 , 曾韦智 , 杨坚 , 姜晓枫 , 杨锋 , 何华森 , 王常龙 , 周峰

IPC: G06N3/092 , G01S7/38 , G06N3/04

Abstract: 本发明公开了一种电子对抗离线决策方法、系统、设备及存储介质，由于复杂电磁环境下，干扰方获取的雷达状态信息部分可观且带有偏差，一般决策方法求出的干扰策略部署到真实环境中时，因其局限性，性能往往难以保证，因此，本发明提供的方案，通过将电磁环境建模成对手智能体，干扰方智能体与对手智能体进行交互训练，得到最终的干扰方智能体，可以更好的进行雷达干扰决策，使干扰方在复杂电磁环境下的决策变得高效，安全。

2.

发明公开
电子对抗双层建模与决策优化方法、系统、设备及介质审中-实审

公开(公告)号：CN119805377A

公开(公告)日：2025-04-11

申请号：CN202510008840.0

申请日：2025-01-03

Applicant: 中国科学技术大学 , 西安电子科技大学

Inventor： 曾韦智 , 刘洵 , 胡自然 , 章耀辉 , 王毅博 , 杨坚 , 姜晓枫 , 杨锋 , 何华森 , 王常龙 , 周峰

IPC: G01S7/36 , G06N7/01 , G06F17/10

Abstract: 本发明公开了一种电子对抗双层建模与决策优化方法、系统、设备及介质，针对电子对抗场景，从不同时间尺度分别对电子对抗双方进行马尔可夫决策过程建模，以解决电子对抗过程中信号级参数在功能级参数变化频率的时间尺度下不具有马尔可夫性的问题，同时，还可以根据模型进行抗干扰方式和干扰样式的决策优化，提升对抗性能。

3.

发明公开
基于MCTS与自博弈的对抗效能评估方法、系统、设备及介质审中-实审

公开(公告)号：CN119849310A

公开(公告)日：2025-04-18

申请号：CN202411927670.8

申请日：2024-12-25

Applicant: 中国科学技术大学 , 西安电子科技大学

Inventor： 胡自然 , 刘洵 , 王毅博 , 曾韦智 , 杨坚 , 姜晓枫 , 杨锋 , 何华森 , 王常龙 , 周峰

IPC: G06F30/27 , G06N3/045 , G06N3/084 , G06N5/04 , G06F119/02

Abstract: 本发明公开了一种基于MCTS与自博弈的对抗效能评估方法、系统、设备及介质，通过结合蒙特卡洛树搜索和深度神经网络(智能体)，创新性地引入了自博弈机制，自博弈过程中，利用模拟真实对抗环境生成高质量的训练数据，不断优化智能体的策略网络和价值网络；本发明在大状态空间内有效搜索和评估，能够实时适应对手策略的快速变化和复杂反馈，通过多轮自博弈模拟，不仅提高了效能评估的精度和实时性，还为复杂对抗环境中的策略优化提供了可靠的技术支持。

4.

发明公开
部分不可观智能体博弈方法、系统、设备及存储介质审中-实审

公开(公告)号：CN117474100A

公开(公告)日：2024-01-30

申请号：CN202311450257.2

申请日：2023-11-02

Applicant: 中国科学技术大学

Inventor： 胡自然 , 杨坚 , 姜晓枫 , 何华森 , 刘洵 , 章耀辉 , 王毅博

IPC: G06N5/04 , G06N7/01

Abstract: 本发明公开了一种部分不可观智能体博弈方法、系统、设备及存储介质，相关方法包括：多智能体博弈过程中，每一智能体均各自保存博弈历史序列，并通过如下方式生成决策动作：利用保存博弈历史序列生成所有未知性能的有序效能矢量；从最近的效能评估历史序列中截取历史段，并基于所述所有未知性能的有序效能矢量确定历史段的优先性参考矢量，并生成参考点；从所有未知性能的有序效能矢量中查找当前时刻状态行动对应的次序，并结合参考点生成优先性效能；结合优先性效能通过部分可观马尔可夫决策过程生成决策动作。本发明提供的方案可以通过尝试使用具有更高优先级的行动来提高效果。

5.

发明公开
智能体博弈策略的性能界限分析方法、系统、设备及介质审中-实审

公开(公告)号：CN117313786A

公开(公告)日：2023-12-29

申请号：CN202311379732.1

申请日：2023-10-24

Applicant: 中国科学技术大学

Inventor： 王毅博 , 杨坚 , 姜晓枫 , 何华森 , 刘洵 , 胡自然 , 章耀辉

IPC: G06N3/008 , G06N3/094 , G06F18/20

Abstract: 本发明公开了一种智能体博弈策略的性能界限分析方法、系统、设备及介质，将对手状态不可完全观测的部分建模为有界参数马尔可夫决策过程，比一般的马尔可夫决策过程更真实地反映博弈过程中的不确定性，帮助智能体做出更加明智的决策。通过上下界迭代算法计算出性能的上下界，给性能分析提供了一个具体的分析对象。

6.

发明公开
一种智能体博弈训练方法、系统、设备及存储介质审中-实审

公开(公告)号：CN117669773A

公开(公告)日：2024-03-08

申请号：CN202311691789.5

申请日：2023-12-11

Applicant: 中国科学技术大学

Inventor： 章耀辉 , 杨坚 , 姜晓枫 , 何华森 , 刘洵 , 胡自然 , 王毅博

IPC: G06N20/00 , G06N3/084 , G06N5/01 , G06N7/01

Abstract: 本发明公开了一种智能体博弈训练方法、系统、设备及存储介质，克服了在非对称且非完全信息条件下，智能体对未知对手行为等高属性特征认知偏差带来的赢得值偏差的传递和放大。本发明以在线更新表征智能体所采策略的相对优势评分的动态赢得函数以及表征对手策略的状态估计网络的方式，解决多智能体博弈的中策略迁移导致的环境非平稳性，动态适应智能体的状态迁移，能够提升智能体的性能。

Patent Agency Ranking