基于深度强化学习中Actor-Critic框架的策略选择方法

    公开(公告)号:CN111766782B

    公开(公告)日:2021-07-13

    申请号:CN202010600847.9

    申请日:2020-06-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于深度强化学习中Actor‑Critic框架的策略选择方法,该方法通过在Actor中同时保持多个策略,在强化学习训练过程中使用Critic中的动作状态价值函数估计策略的价值期望,根据期望实时地选择或集成其中的优势策略进行输出或更新,其目的在于提升训练速度,并使得在训练中生成有效的局部策略。因此,本发明对于使用Actor‑Critic框架的基于策略梯度的强化学习算法有着提升采样效率,增加参数搜索空间等的技术效果。

    一种在线分类微服务的构建方法

    公开(公告)号:CN108573275B

    公开(公告)日:2020-08-25

    申请号:CN201810188057.7

    申请日:2018-03-07

    Applicant: 浙江大学

    Abstract: 本发明公开了一种在线分类微服务的构建方法,相对于传统基于批处理的分类方法(如SMO等)由于每次分类都要对所有训练样本进行计算,具有耗时大和部署困难的问题,不利于模型的在线修改。本发明在线分类微服务构建方法,可以利用实时获取的训练样本对分类器进行更新,同时提高了对数据处理的效率,利用微服务的架构可以对降低部署模型的复杂度,加快模型的上线迭代。

    一种基于分布参数编码的点云处理方法

    公开(公告)号:CN111768493B

    公开(公告)日:2022-08-05

    申请号:CN202010575561.X

    申请日:2020-06-22

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于分布参数编码的点云处理方法,该方法通过训练神经网络拟合点云的分布状态,表示出当前点云分布的概率密度函数,将此时的参数作为表示当前点云数据的特征,成功将大量的点云数据压缩到参数空间的量级。同时,本发明针对连续获得点云的情况,可以将点云参数作为神经网络中循环单元的输出,从而预测点云数据分布随外部环境改变而发生的变换趋势。

    一种基于分布参数编码的点云处理方法

    公开(公告)号:CN111768493A

    公开(公告)日:2020-10-13

    申请号:CN202010575561.X

    申请日:2020-06-22

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于分布参数编码的点云处理方法,该方法通过训练神经网络拟合点云的分布状态,表示出当前点云分布的概率密度函数,将此时的参数作为表示当前点云数据的特征,成功将大量的点云数据压缩到参数空间的量级。同时,本发明针对连续获得点云的情况,可以将点云参数作为神经网络中循环单元的输出,从而预测点云数据分布随外部环境改变而发生的变换趋势。

    基于深度强化学习中Actor-Critic框架的策略选择方法

    公开(公告)号:CN111766782A

    公开(公告)日:2020-10-13

    申请号:CN202010600847.9

    申请日:2020-06-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于深度强化学习中Actor-Critic框架的策略选择方法,该方法通过在Actor中同时保持多个策略,在强化学习训练过程中使用Critic中的动作状态价值函数估计策略的价值期望,根据期望实时地选择或集成其中的优势策略进行输出或更新,其目的在于提升训练速度,并使得在训练中生成有效的局部策略。因此,本发明对于使用Actor-Critic框架的基于策略梯度的强化学习算法有着提升采样效率,增加参数搜索空间等的技术效果。

    一种在线分类微服务的构建方法

    公开(公告)号:CN108573275A

    公开(公告)日:2018-09-25

    申请号:CN201810188057.7

    申请日:2018-03-07

    Applicant: 浙江大学

    Abstract: 本发明公开了一种在线分类微服务的构建方法,相对于传统基于批处理的分类方法(如SMO等)由于每次分类都要对所有训练样本进行计算,具有耗时大和部署困难的问题,不利于模型的在线修改。本发明在线分类微服务构建方法,可以利用实时获取的训练样本对分类器进行更新,同时提高了对数据处理的效率,利用微服务的架构可以对降低部署模型的复杂度,加快模型的上线迭代。

    一种基于SPI的令牌环组网方法

    公开(公告)号:CN108418739A

    公开(公告)日:2018-08-17

    申请号:CN201810133097.1

    申请日:2018-02-09

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于SPI的令牌环组网方法,利用SPI作为令牌环网通信协议,网络中有一个主设备和多个从设备,所有设备通过SPI输出输入线组成环状,所有从设备SPI时钟信号由主设备提供,所有从设备的SPI片选信号由主设备提供,并都使用同一片选信号,由主设备发起令牌的一轮转移,从设备根据令牌环内容判断是否处理信息。本发明令牌环组网方法可以只使用一个片选信号将多个从设备与主设备进行令牌环组网,从而进行令牌交换,实现从设备之间能相互通信,降低了SPI通信中主设备的引脚负担,特别适用于片上引脚资源不丰富的单片机进行组网。

Patent Agency Ranking