-
公开(公告)号:CN113139024B
公开(公告)日:2022-07-08
申请号:CN202110504970.5
申请日:2021-05-10
Applicant: 杭州电子科技大学
Abstract: 本发明属于信息技术领域,公开了一种面向MADDPG多智能体强化学习模型的可视分析方法,包括如下步骤:步骤1:选取一款合作类游戏作为MADDPG模型的运行环境,并定义相关的参数集合;步骤2:训练MADDPG模型,保存并计算重要的中间数据;步骤3:设计标签板,标识智能体和地标;步骤4:设计统计视图;步骤5:设计评论家行为视图,用于评估模型学习得到的评论家的性能;步骤6:设计交互视图。本发明提出了一种新的可视分析方法,能支持交互式地分析合作类环境中MADDPG模型的工作流程和内部原理。该发明设计了多个协同的视图,从不同角度揭示MADDPG模型的内部执行机制。
-
公开(公告)号:CN111428865A
公开(公告)日:2020-07-17
申请号:CN202010311320.4
申请日:2020-04-20
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种用于理解DQN模型的可视分析方法,包括如下步骤:步骤一,定义参数集合,选取DQN模型的运行环境;步骤二,训练所述DQN模型,测试训练好的所述DQN模型,保存中间数据;步骤三,设计Q值分布视图,展示不同的所述Q值数据对应的不同运行环境的情况,分析所述Q值数据的计算规律;步骤四,设计卷积层分析视图,用于呈现训练过程中感受野范围和影响所述智能体做出相应动作的重要因素;步骤五,设计时间序列视图,用于展示测试过程中的运行过程。
-
公开(公告)号:CN111428865B
公开(公告)日:2023-04-18
申请号:CN202010311320.4
申请日:2020-04-20
Applicant: 杭州电子科技大学
IPC: G06N3/0464 , G06N3/08 , G06V10/774 , G06F16/74
Abstract: 本发明公开了一种用于理解DQN模型的可视分析方法,包括如下步骤:步骤一,定义参数集合,选取DQN模型的运行环境;步骤二,训练所述DQN模型,测试训练好的所述DQN模型,保存中间数据;步骤三,设计Q值分布视图,展示不同的所述Q值数据对应的不同运行环境的情况,分析所述Q值数据的计算规律;步骤四,设计卷积层分析视图,用于呈现训练过程中感受野范围和影响所述智能体做出相应动作的重要因素;步骤五,设计时间序列视图,用于展示测试过程中的运行过程。
-
公开(公告)号:CN112395514A
公开(公告)日:2021-02-23
申请号:CN202011424833.2
申请日:2020-12-08
Applicant: 杭州电子科技大学
IPC: G06F16/9536 , G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本文发明属于推荐系统领域,具体为基于记忆网络的物品协同过滤推荐的方法,首先通过网站下载获取用户曾经交互过的物品和对物品的历史评分数据,进行预处理,转换数据格式,以用户历史曾经交互过的物品集合来标识该用户,并划分为训练集和测试集,额外剔除训练集中存在于用户历史交互过的物品集合中的目标物品,然后搭建记忆网络结构,初始化记忆网络的参数,再将训练集的数据输入到记忆网络中进行训练,直至网络收敛,通过对照实验调节网络中的超参数,获得最佳模型,最后通过测试集数据的预测来检验模型效果,得到用户对目标物品进行交互的概率。本发明的基于记忆网络的物品协同过滤推荐的方法,大大提高了物品协同过滤方法的预测准确性。
-
公开(公告)号:CN111798051B
公开(公告)日:2023-11-10
申请号:CN202010629347.8
申请日:2020-07-02
Applicant: 杭州电子科技大学
IPC: G06Q10/04 , G06N3/0442 , G06N3/08
Abstract: 本发明公开一种基于长短期记忆神经网络的空气质量时空预测方法。本发明整合实验站点及最近相邻站点的颗粒物浓度数据、同时期的气象数据及气态污染物数据,转换为监督学习的数据格式,对数据进行归一化处理,利用长短期记忆网络训练数据,得到空气质量浓度的预测序列。包括以下步骤:S1:获取历史空气质量数据和气象数据;S2:对历史空气质量进行数据预处理,包括异常值剔除、缺失值插值处理、相邻站点颗粒物浓度数据的提取以及数据归一化;S3:转换数据格式,从序列到输入和输出序列对;S4:划分数据集为训练集和测试集及初始化长短期记忆网络各种超参数;S5:通过在测试集上的预测检验模型效果。该发明方法能够提高空气质量数据的预测精度。
-
公开(公告)号:CN112395514B
公开(公告)日:2022-07-29
申请号:CN202011424833.2
申请日:2020-12-08
Applicant: 杭州电子科技大学
IPC: G06F16/9536 , G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本文发明属于推荐系统领域,具体为基于记忆网络的物品协同过滤推荐的方法,首先通过网站下载获取用户曾经交互过的物品和对物品的历史评分数据,进行预处理,转换数据格式,以用户历史曾经交互过的物品集合来标识该用户,并划分为训练集和测试集,额外剔除训练集中存在于用户历史交互过的物品集合中的目标物品,然后搭建记忆网络结构,初始化记忆网络的参数,再将训练集的数据输入到记忆网络中进行训练,直至网络收敛,通过对照实验调节网络中的超参数,获得最佳模型,最后通过测试集数据的预测来检验模型效果,得到用户对目标物品进行交互的概率。本发明的基于记忆网络的物品协同过滤推荐的方法,大大提高了物品协同过滤方法的预测准确性。
-
公开(公告)号:CN113139024A
公开(公告)日:2021-07-20
申请号:CN202110504970.5
申请日:2021-05-10
Applicant: 杭州电子科技大学
Abstract: 本发明属于信息技术领域,公开了一种面向MADDPG多智能体强化学习模型的可视分析方法,包括如下步骤:步骤1:选取一款合作类游戏作为MADDPG模型的运行环境,并定义相关的参数集合;步骤2:训练MADDPG模型,保存并计算重要的中间数据;步骤3:设计标签板,标识智能体和地标;步骤4:设计统计视图;步骤5:设计评论家行为视图,用于评估模型学习得到的评论家的性能;步骤6:设计交互视图。本发明提出了一种新的可视分析方法,能支持交互式地分析合作类环境中MADDPG模型的工作流程和内部原理。该发明设计了多个协同的视图,从不同角度揭示MADDPG模型的内部执行机制。
-
公开(公告)号:CN112782050A
公开(公告)日:2021-05-11
申请号:CN202011574282.8
申请日:2020-12-25
Applicant: 杭州电子科技大学
IPC: G01N15/06
Abstract: 本发明公开一种基于长短期记忆神经网络的生物气溶胶浓度预测方法,首先,整合多源异构数据集,包括过去时刻空气质量数据集、气象数据集和生物气溶胶采样数据集;其次,将整合后的数据集转换为监督学习的数据格式,并且划分数据集为训练集和测试集;再次,将训练集的数据作为输入,利用长短期记忆神经网络进行训练,提取数据的隐藏特征;最后,在测试集上实现生物气溶胶的浓度预测,并与真实数据进行比对,验证模型的有效性。本发明通过对生物气溶胶自身采样数据及对影响生物气溶胶的各种影响因子(空气质量数据、气象数据等)进行综合分析和处理,实现对其浓度的精准预测。
-
公开(公告)号:CN111798051A
公开(公告)日:2020-10-20
申请号:CN202010629347.8
申请日:2020-07-02
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种基于长短期记忆神经网络的空气质量时空预测方法。本发明整合实验站点及最近相邻站点的颗粒物浓度数据、同时期的气象数据及气态污染物数据,转换为监督学习的数据格式,对数据进行归一化处理,利用长短期记忆网络训练数据,得到空气质量浓度的预测序列。包括以下步骤:S1:获取历史空气质量数据和气象数据;S2:对历史空气质量进行数据预处理,包括异常值剔除、缺失值插值处理、相邻站点颗粒物浓度数据的提取以及数据归一化;S3:转换数据格式,从序列到输入和输出序列对;S4:划分数据集为训练集和测试集及初始化长短期记忆网络各种超参数;S5:通过在测试集上的预测检验模型效果。该发明方法能够提高空气质量数据的预测精度。
-
-
-
-
-
-
-
-