-
公开(公告)号:CN116720007B
公开(公告)日:2023-11-28
申请号:CN202311007379.4
申请日:2023-08-11
Applicant: 河北工业大学
IPC: G06F16/9535 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08 , G06N5/02 , G06F16/9538
Abstract: 本发明提供一种基于多维学习者状态和联合奖励的在线学习资源推荐方法,包括多维学习者状态、联合奖励和策略三个模块:将学习者作为马尔可夫决策过程中的主体,设计由知识信息、学习者行为序列和学习者交互信息组成的知识图谱来准确地表示学习者的多维学习状态;将学习资源之间的语义关联聚合起来,构建归纳网络来生成知识状态和推断知识状态;利用双向门控循环单元和注意力机制提取行为序列状态的关键信息,引入学习者交互信息,利用因子分解机对认知水平进行建模;构造序列奖励与知识奖励相结合的复合奖励函数,根据概率优化累计奖励并推荐学习资源。通过本发明,可以使推荐结果更精确,更具可解释性,满足学习者实际需求。
-
公开(公告)号:CN116720007A
公开(公告)日:2023-09-08
申请号:CN202311007379.4
申请日:2023-08-11
Applicant: 河北工业大学
IPC: G06F16/9535 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08 , G06N5/02 , G06F16/9538
Abstract: 本发明提供一种基于多维学习者状态和联合奖励的在线学习资源推荐方法,包括多维学习者状态、联合奖励和策略三个模块:将学习者作为马尔可夫决策过程中的主体,设计由知识信息、学习者行为序列和学习者交互信息组成的知识图谱来准确地表示学习者的多维学习状态;将学习资源之间的语义关联聚合起来,构建归纳网络来生成知识状态和推断知识状态;利用双向门控循环单元和注意力机制提取行为序列状态的关键信息,引入学习者交互信息,利用因子分解机对认知水平进行建模;构造序列奖励与知识奖励相结合的复合奖励函数,根据概率优化累计奖励并推荐学习资源。通过本发明,可以使推荐结果更精确,更具可解释性,满足学习者实际需求。
-