-
公开(公告)号:CN117236377A
公开(公告)日:2023-12-15
申请号:CN202311108823.1
申请日:2023-08-30
Applicant: 电子科技大学
IPC: G06N3/0442 , G06N3/092 , G06N3/042 , G06N3/0499 , G06N3/045 , G06N3/0495 , G06N3/082
Abstract: 本发明涉及多智能体协同技术,具体涉及一种基于参数稀疏共享的异构多智能体强化学习方法。包括训练多种智能体模型和智能体决策两个部分,在训练多智能体模型过程中,初始化一个过参数化的网络作为所有智能体共享的网络,训练共享网络得到基础网络参数;基于基础网络参数,通过二值掩码获取各智能体子网络的模型表示。在智能体决策过程中,各智能体获取自身观察信息,并将自身的观察信息输入到对应子网络中,获取子网络的输出作为决策依据。与现有技术相比,本发明采用稀疏共享机制,通过二值掩码获取各智能体子网络的模型表示,可以有效降低传统智能体模型参数共享导致的负迁移现象,提高多智能体系统的性能。
-
公开(公告)号:CN117235302A
公开(公告)日:2023-12-15
申请号:CN202311115967.X
申请日:2023-08-30
Applicant: 电子科技大学
IPC: G06F16/635 , G06N3/0464 , G06N3/045 , G06N3/08 , G06F16/9535 , G06F18/213 , G06F18/25 , G06F18/22 , G06F18/10
Abstract: 本发明涉及推荐系统领域,具体涉及一种基于辅助特征的个性化推荐方法。该方法基于预处理后的音乐数据建立并训练双塔模型,在双塔模型中,通过卷积神经网络对包含用户评论的数据进行特征提取和处理,得到用户对歌曲的原始评论信息表示向量;通过两个并行的神经网络提取出用户评论文本的质量特征、用户对目标歌曲进行评论的评论文本质量特征;通过一个隐层空间对两个并行神经网络输出的特征进行交叉融合,得到高阶的组合特征信息;合用户的隐式特征信息建立损失函数并采用梯度下降法训练,经过多次训练得到最优的模型作为线上推荐环节的算法模型。解决了现有技术中未能有效利用用户播放历史记录中的辅助特征进而导致用户特征建模质量较低的问题。
-