基于Q-Learning和迁移学习的信号调制识别算法

    公开(公告)号:CN117040984A

    公开(公告)日:2023-11-10

    申请号:CN202310561806.7

    申请日:2023-05-18

    Inventor: 张承畅 李晓梦

    Abstract: 为了解决通信场景下小样本造成调制识别准确率下降的问题,使用迁移学习方法将已有的模型中最有用的信息迁移到设计的调制识别网络中。本发明提出一种基于Q‑Learning和迁移学习的调制识别算法。使用公开数据集RML2016.10a和RML2018.01a模拟两种通信场景,RML2016.10a为源域数据集,将该数据集随机划分多个子集,从RML2018.01a中抽取11000个与RML2016.10a调制识别方式相同的样本为目标域数据集。按照ε‑greedy策略选择子集输入源域模型训练,然后迁移某一网络层到目标域模型,迁移的网络层作为Q‑Learning中的状态,使用目标域数据集对目标域模型进行微调和性能验证得到识别准确率作为奖励函数,更新Q表。当Q表收敛,根据Q表选择迁移的参数。相比于其他使用参数迁移的调制识别算法,本发明实现了有用知识的最大化迁移。

Patent Agency Ranking