Patent search ap:("吉林大学") AND inv:"杨哲健" Page 1

1.

发明公开
基于灵活扩散卷积的图神经网络训练方法及相关设备审中-实审

公开(公告)号：CN119761446A

公开(公告)日：2025-04-04

申请号：CN202410879493.4

申请日：2024-07-02

Applicant: 吉林大学

Inventor： 赵松伟 , 陈贺昌 , 常毅 , 江原 , 杨哲健 , 杜昕祺

IPC: G06N3/084 , G06N3/042 , G06N3/0464

Abstract: 本申请公开了一种基于灵活扩散卷积的图神经网络训练方法及相关设备，该方法包括：获取包含节点标签的训练图数据；根据所述训练图数据的节点度信息确定每个节点的局部结构特征；利用扩散核函数处理所述局部结构特征得到每个节点的平滑特征；将所述平滑特征输入多层感知器得到每个节点的初步标签值，通过标签平滑处理所述初步标签值后得到每个节点的预测标签值；基于所述预测标签值和所述节点标签更新所述扩散核函数和所述多层感知器的参数，直至收敛或达到预定的训练轮数。本申请能够优化图神经网络模型的预测性能，提高鲁棒性和泛化性，提高对推荐系统等复杂图数据的标签预测准确率。

2.

发明公开
一种智能体训练方法、装置、存储介质及电子设备审中-实审

公开(公告)号：CN117540214A

公开(公告)日：2024-02-09

申请号：CN202311677765.4

申请日：2023-12-07

Applicant: 吉林大学

Inventor： 陈贺昌 , 杜昕祺 , 常毅 , 邢永恒 , 张斯诺 , 赵松伟 , 宋玖蔓 , 刘天一 , 杨哲健

IPC: G06F18/214 , G06N20/00 , G06F17/18 , G06F18/211

Abstract: 本说明书公开了一种智能体训练方法、装置、存储介质及电子设备，其中方法包括：获取环境向量、智能体的局部状态向量和动作向量进行拼接，得到智能体的全局向量，采用对比模块对全局向量进行计算，得到目标向量，采用集成评价网络对目标向量进行评价得到样本评分，对样本评分进行处理得到预估评分，计算对比模块、策略网络和集成评价网络的损失函数，基于损失函数对网络参数进行调整，直至损失函数指示收敛，得到训练完成的对比模块、策略网络和集成评价网络，采用本说明书，采用对比模块辅助评价网络进行训练增加额外的损失函数，提高目标向量的表示能力，并通过集成式评价网络减少预估时产生的误差，提高了智能体训练模型的样本训练效率。

3.

发明公开
一种空间对齐与选择性权重激活的持续离线强化学习方法审中-实审

公开(公告)号：CN119761454A

公开(公告)日：2025-04-04

申请号：CN202510248451.5

申请日：2025-03-04

Applicant: 吉林大学

Inventor： 陈贺昌 , 胡纪锋 , 张斯诺 , 黄思理 , 杨哲健 , 常毅

IPC: G06N3/092 , G06N3/04

Abstract: 本申请提供了一种空间对齐与选择性权重激活的持续离线强化学习方法，包括：针对持续学习任务序列中的每一个任务，使用该任务对应的数据集，利用量化空间对齐方法将状态空间和动作空间对齐，以得到相同空间下的状态序列和动作序列；获取单时间步奖励序列，并利用奖励函数计算出累积折扣奖励和序列；基于该任务的状态序列，将累积折扣奖励和序列作为扩散模型的条件信息，利用被激活的扩散模型生成给定状态序列，再利用逆动力学模型生成给定动作序列；将各任务累积的折扣奖励和的最大化作为目标，进行持续强化学习，以更新各任务对应的扩散模型参数，和逆动力学模型参数。该方法使各任务的强化学习过程在同样的空间上进行，并有效缓解了灾难性遗忘。

Patent Agency Ranking