Patent search ap:("北京科技大学") AND inv:"徐诚" Page 1

1.

发明公开
一种基于深度强化学习算法的决策模型可视化方法及系统审中-实审

公开(公告)号：CN118656714A

公开(公告)日：2024-09-17

申请号：CN202410690420.0

申请日：2024-05-30

Applicant: 北京科技大学 , 北京科技大学顺德创新学院

Inventor： 陈丽萍 , 蒋柯 , 张恒 , 冯伊琳 , 段世红 , 徐诚

IPC: G06F18/2411 , G06N3/0464 , G06N3/042 , G06F18/214 , G06N3/092

Abstract: 本发明提供一种基于深度强化学习算法的决策模型可视化方法及系统，涉及深度强化学习技术领域。方法包括：获取复杂动态环境；通过图卷积网络，将复杂动态环境转化为环境图；通过独立容器化技术，根据图卷积网络，构建基于深度强化学习算法的决策模型；对决策模型进行训练；构建结构化的多级数据存储机制；通过多级数据存储机制，储存决策模型训练过程中的训练数据；根据训练数据，通过多维统计分析，构建多维决策视图；展示多维决策视图。本发明可以实现深度强化学习在复杂动态环境中实时、高效的决策，通过多维决策视图，使得理解和解释深度强化学习算法决策过程变得简单。

2.

发明公开
一种基于强化学习的Sim2Real模型构建方法及装置审中-公开

公开(公告)号：CN119669952A

公开(公告)日：2025-03-21

申请号：CN202411610785.4

申请日：2024-11-12

Applicant: 北京科技大学

Inventor： 张梦娇 , 朱博林 , 段世红 , 徐诚

IPC: G06F18/2433 , G06F18/214 , G06N3/092

Abstract: 本发明提供一种基于强化学习的Sim2Real模型构建方法及装置，涉及数据处理技术领域，方法包括：获取仿真环境与现实环境的评估指标；利用线性加权法，根据评估指标，量化仿真环境与现实环境指标之间的加权差异；搭建对仿真环境与真实环境之间的数据进行相互转换的Sim2Real模型；利用强化学习算法，以仿真环境与现实环境指标之间的加权差异最小为目标，对Sim2Real模型进行领域自适应训练，得到最终的Sim2Real模型。在本发明中，通过搭建对仿真环境和现实环境之间进行数据转换的Sim2Real模型，进行数据层面的调整，减少从仿真环境到真实环境的迁移误差。

3.

发明公开
一种基于区块链的可验证检索方法及系统有权转让

公开(公告)号：CN116860825A

公开(公告)日：2023-10-10

申请号：CN202310704485.1

申请日：2023-06-14

Applicant: 北京科技大学

Inventor： 王然 , 徐诚 , 张晓彤 , 董润时

IPC: G06F16/2458 , G06F16/22 , G06F16/27 , G06F21/64 , G06F16/28

Abstract: 本发明涉及区块链数据检索技术领域，特别是指一种基于区块链的可验证检索方法及系统。一种基于区块链的可验证检索方法包括：采集检索信息，获得检索关键字；根据检索关键字，通过数据索引结构进行检索，获得材料分类id集合以及元数据集合；将材料分类id集合，输入区块链背书节点，获得MPT树根哈希以及分类哈希表；根据MPT树根哈希以及分类哈希表，获得分类证明哈希表；根据分类证明哈希表以及元数据集合进行验证，获得检索结果以及验证结果。本发明是一种面对区块链的可验证高效检索方法。

4.

发明公开
一种基于约束粒子流的高斯聚合滤波协同定位追踪方法有权

公开(公告)号：CN114719857A

公开(公告)日：2022-07-08

申请号：CN202210384424.7

申请日：2022-04-13

Applicant: 北京科技大学

Inventor： 叶郁宸 , 徐诚 , 吴航 , 段世红

IPC: G01C21/16 , G01C21/20

Abstract: 本发明提供一种基于约束粒子流的高斯聚合滤波协同定位追踪方法，属于定位追踪技术领域。所述方法包括：在单目标运动追踪场景下，采用基于误差椭圆粒子流的高斯聚合滤波算法，对单个目标节点的动态状态进行估计；在多目标协同运动追踪场景下，采用基于误差椭圆粒子流的高斯聚合滤波融合距离约束的协同优化算法，完成多目标协同运动追踪。采用本发明，能够精准估计目标节点动态状态信息。

5.

发明授权
一种跨区域定位系统滤波算法的历史数据构建方法有权转让

公开(公告)号：CN104732089B

公开(公告)日：2017-10-20

申请号：CN201510131803.5

申请日：2015-03-24

Applicant: 北京科技大学

Inventor： 王然 , 何杰 , 徐诚 , 刘飞 , 王沁

IPC: G06F19/00

Abstract: 本发明提供了一种跨区域定位系统滤波算法的历史数据构建方法，包括：获取目标点与每一基站的实测距离；并获取目标点与第id号基站测得的信号强度；判断是否存储有目标点与第id号基站之间的距离历史数据，如果有则提取至少两条所述距离历史数据，并获取所述提取的每一历史数据值对应的信号强度值；然后根据所述历史数据进行卡尔曼滤波，并将滤波处理结果按顺序保存为滤波处理结果数组；判断是否有新的基站，如果有则通过新基站的坐标分别于目标点的最近的两条距离历史数据，计算目标点与新基站之间的距离历史数据；对得到的新基站的距离历史数据分别进行滤波处理，以作为所述目标点与新基站的滤波处理结果。

6.

发明授权
一种外罚法与最速下降法结合的车联网定位方法及系统有权转让

公开(公告)号：CN104965214B

公开(公告)日：2017-04-26

申请号：CN201510272194.5

申请日：2015-05-25

Applicant: 北京科技大学

Inventor： 王然 , 何杰 , 徐丽媛 , 徐诚 , 王沁

IPC: G01S19/48

Abstract: 本发明提供一种外罚法与最速下降法结合的车联网定位方法及系统，有助于提高GPS定位精度。所述方法包括：S1，通过GPS获取车辆的定位结果，并结合TOA节点间的测距值构造带约束条件的目标函数；S2，通过外罚法将带约束条件的目标函数转变为不带约束条件的目标函数；S3，通过最速下降法确定所述不带约束条件的目标函数的极小值相应的坐标值；S4，判断所述极小值及坐标值是否满足收敛条件，若满足，所述坐标值为最终优化坐标，否则，则利用所述坐标值，返回S2继续迭代。本发明适用于车联网定位技术领域。

7.

发明公开
一种姿态识别装置及方法有权转让

公开(公告)号：CN105997094A

公开(公告)日：2016-10-12

申请号：CN201610300730.2

申请日：2016-05-09

Applicant: 北京科技大学

Inventor： 蔡海飘 , 何杰 , 徐诚

IPC: A61B5/11

CPC classification number: A61B5/1116

Abstract: 本发明提供一种姿态识别装置及方法，能够提高姿态识别精度。所述装置包括：多个测试节点和一个主控节点；其中，每个测试节点，用于获取相应测量部位的状态信息，并将所述状态信息发送至所述主控节点；所述主控节点，用于根据接收的所述每个测试节点发送的所述状态信息提取状态特征值，还用于建立状态转移图与状态分类决策树，并根据建立的所述状态转移图与所述状态分类决策树构建状态转移决策树模型，且通过提取的所述状态特征值对所述状态转移决策树模型进行训练；其中，所述状态转移图表示人体在运动过程中，当前状态与前后状态之间的转移关系。本发明适用于姿态识别技术领域。

8.

发明公开
一种室内TOA测距值模拟生成方法及装置有权转让

公开(公告)号：CN105068067A

公开(公告)日：2015-11-18

申请号：CN201510456976.4

申请日：2015-07-29

Applicant: 北京科技大学

Inventor： 韩志帅 , 何杰 , 徐诚 , 王沁

IPC: G01S11/00

CPC classification number: G01S11/00

Abstract: 本发明提供一种室内TOA测距值模拟生成方法及装置，有助于提高测试效率和节约测试时间。所述方法包括：获取室内环境信息，并对所述室内环境信息进行处理输出射线追踪图；对输出的所述射线追踪图进行转换，模拟生成发射节点和接收节点之间的测距值。所述装置包括：射线追踪单元：用于获取室内环境信息，并对所述室内环境信息进行处理输出射线追踪图；测距值生成单元：用于对输出的所述射线追踪图进行转换，模拟生成发射节点和接收节点之间的测距值。本发明适用于定位技术领域。

9.

发明授权
一种基于强化学习补偿滤波的救援协同定位方法及系统有权转让

公开(公告)号：CN117271967B

公开(公告)日：2024-02-13

申请号：CN202311537570.X

申请日：2023-11-17

Applicant: 北京科技大学

Inventor： 王然 , 徐诚 , 孙敬 , 段世红 , 张晓彤

IPC: G06F17/18 , G06N3/045 , G06N3/048 , G06N7/01 , G01C21/20

Abstract: 本发明涉及协同定位技术领域，特别是指一种基于强化学习补偿滤波的救援协同定位方法及系统。一种基于强化学习补偿滤波的救援协同定位方法包括：通过微型无人机进行数据采集，获得自信息以及观测信息；通过扩展卡尔曼滤波算法，获得初步位置估计；采用强化学习方法对扩展卡尔曼滤波算法进行滤波增益补偿，获得局部定位结果；根据局部定位结果以及预设的策略网络，对中心评价网络进行更新，获得更新评价网络；通过更新评价网络以及预设的策略网络，获得更新动作；根据更新动作，对局部定位结果进行修正，获得精确定位结果；根据精确定位结果进行救援路线规划。本发明是一种基于强化学习补偿滤波的准确度高且鲁棒性强的救援协同定位方法。

10.

发明授权
一种基于深度蒙特卡洛树搜索的信源导航方法及装置有权

公开(公告)号：CN113139644B

公开(公告)日：2024-02-09

申请号：CN202110316103.9

申请日：2021-03-24

Applicant: 北京科技大学顺德研究生院

Inventor： 徐诚 , 何昊 , 段世红 , 殷楠

IPC: G01C21/20 , G06N3/0442 , G06N3/045 , G06N3/006 , G06N3/092 , G06N3/084 , G06N3/0464 , G06N5/01

Abstract: 本发明公开了一种基于深度蒙特卡洛树搜索的信源导航方法及装置，该方法包括：获取待导航智能体在历史时间步内的环境信息和执行的动作信息；通过预设的第一神经网络，基于历史时间步内的环境信息和动作信息，预测出智能体在当前时间步的各个方向的动作概率；以预测的动作概率作为蒙特卡洛树搜索算法的先验知识，选择智能体在当前时间步内的最佳执行动作；结合每一时间步的最佳执行动作，得到智能体移动至信源的最优路径。本发明提出在蒙特卡洛树中使用循环神经网络的集成规划路径框架，

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification