Patent search ap:("东南大学" OR "鹏城实验室") AND inv:"操菁瑜" Page 1

1.

发明公开
一种基于信息预处理和强化学习的机器人避障导航方法审中-实审

公开(公告)号：CN116300909A

公开(公告)日：2023-06-23

申请号：CN202310185208.4

申请日：2023-03-01

Applicant: 东南大学 , 鹏城实验室

Inventor： 孙长银 , 操菁瑜 , 蒋坤 , 董璐 , 穆朝絮

IPC: G05D1/02

Abstract: 本发明公开了一种基于信息预处理和强化学习的机器人避障导航方法。该方法包括以下步骤：首先，利用不同类型的神经网络层组成信息预处理模块对机器人采集的多模数据进行信息预处理；其次，将无地图环境下的机器人避障导航过程描述为马尔可夫决策过程并引入强化学习框架在仿真环境中训练机器人，设计有关多维目标的奖励函数，实现仿真环境下的避障导航功能；最后，将训练好的信息预处理模块和动作网络移植到现实环境中完成机器人的避障导航任务。本发明通过多模信息预处理模块实现了对环境更完整的感知，端到端的强化学习方法无需关于环境的先验知识，提高了无地图环境下机器人的导航表现和算法在现实环境下的泛化性。

2.

发明授权
一种基于深度强化学习的智能电热水器保温档负荷控制方法有权

公开(公告)号：CN112510719B

公开(公告)日：2022-06-21

申请号：CN202011408553.2

申请日：2020-12-05

Applicant: 东南大学

Inventor： 操菁瑜 , 孙长银 , 陆科林 , 徐乐玏

IPC: H02J3/14 , F24H9/20 , F24H15/152 , F24H15/212 , F24H15/269 , F24H15/37 , F24H15/421 , F24H15/45

Abstract: 本发明公开了一种基于深度强化学习的智能电热水器保温档负荷控制方法，包括以下步骤：采用LSTM网络利用过去48小时电价预测未来24小时电价；采用基于DQN的深度强化学习算法，将电力消耗和用户满意度同时作为好策略的衡量标准，并根据用户自身的需求调节二者所占比重。根据所预测的电价训练电热水器保温档负荷控制智能体学习得到使得奖励值最高的策略，使其在高电价时选择较低功率，低电价时选择较高功率，在尽可能保证用户满意度的同时节省更多电力消耗，以获得一个性能优良且适用性较高的电热水器负荷控制智能体。

3.

发明公开
一种基于深度强化学习的智能电热水器保温档负荷控制方法有权

公开(公告)号：CN112510719A

公开(公告)日：2021-03-16

申请号：CN202011408553.2

申请日：2020-12-05

Applicant: 东南大学

Inventor： 操菁瑜 , 孙长银 , 陆科林 , 徐乐玏

IPC: H02J3/14 , F24H9/20

Abstract: 本发明公开了一种基于深度强化学习的智能电热水器保温档负荷控制方法，包括以下步骤：采用LSTM网络利用过去48小时电价预测未来24小时电价；采用基于DQN的深度强化学习算法，将电力消耗和用户满意度同时作为好策略的衡量标准，并根据用户自身的需求调节二者所占比重。根据所预测的电价训练电热水器保温档负荷控制智能体学习得到使得奖励值最高的策略，使其在高电价时选择较低功率，低电价时选择较高功率，在尽可能保证用户满意度的同时节省更多电力消耗，以获得一个性能优良且适用性较高的电热水器负荷控制智能体。

Patent Agency Ranking