-
公开(公告)号:CN118656714A
公开(公告)日:2024-09-17
申请号:CN202410690420.0
申请日:2024-05-30
Applicant: 北京科技大学 , 北京科技大学顺德创新学院
IPC: G06F18/2411 , G06N3/0464 , G06N3/042 , G06F18/214 , G06N3/092
Abstract: 本发明提供一种基于深度强化学习算法的决策模型可视化方法及系统,涉及深度强化学习技术领域。方法包括:获取复杂动态环境;通过图卷积网络,将复杂动态环境转化为环境图;通过独立容器化技术,根据图卷积网络,构建基于深度强化学习算法的决策模型;对决策模型进行训练;构建结构化的多级数据存储机制;通过多级数据存储机制,储存决策模型训练过程中的训练数据;根据训练数据,通过多维统计分析,构建多维决策视图;展示多维决策视图。本发明可以实现深度强化学习在复杂动态环境中实时、高效的决策,通过多维决策视图,使得理解和解释深度强化学习算法决策过程变得简单。
-
公开(公告)号:CN119669952A
公开(公告)日:2025-03-21
申请号:CN202411610785.4
申请日:2024-11-12
Applicant: 北京科技大学
IPC: G06F18/2433 , G06F18/214 , G06N3/092
Abstract: 本发明提供一种基于强化学习的Sim2Real模型构建方法及装置,涉及数据处理技术领域,方法包括:获取仿真环境与现实环境的评估指标;利用线性加权法,根据评估指标,量化仿真环境与现实环境指标之间的加权差异;搭建对仿真环境与真实环境之间的数据进行相互转换的Sim2Real模型;利用强化学习算法,以仿真环境与现实环境指标之间的加权差异最小为目标,对Sim2Real模型进行领域自适应训练,得到最终的Sim2Real模型。在本发明中,通过搭建对仿真环境和现实环境之间进行数据转换的Sim2Real模型,进行数据层面的调整,减少从仿真环境到真实环境的迁移误差。
-
公开(公告)号:CN116860825A
公开(公告)日:2023-10-10
申请号:CN202310704485.1
申请日:2023-06-14
Applicant: 北京科技大学
IPC: G06F16/2458 , G06F16/22 , G06F16/27 , G06F21/64 , G06F16/28
Abstract: 本发明涉及区块链数据检索技术领域,特别是指一种基于区块链的可验证检索方法及系统。一种基于区块链的可验证检索方法包括:采集检索信息,获得检索关键字;根据检索关键字,通过数据索引结构进行检索,获得材料分类id集合以及元数据集合;将材料分类id集合,输入区块链背书节点,获得MPT树根哈希以及分类哈希表;根据MPT树根哈希以及分类哈希表,获得分类证明哈希表;根据分类证明哈希表以及元数据集合进行验证,获得检索结果以及验证结果。本发明是一种面对区块链的可验证高效检索方法。
-
公开(公告)号:CN114719857A
公开(公告)日:2022-07-08
申请号:CN202210384424.7
申请日:2022-04-13
Applicant: 北京科技大学
Abstract: 本发明提供一种基于约束粒子流的高斯聚合滤波协同定位追踪方法,属于定位追踪技术领域。所述方法包括:在单目标运动追踪场景下,采用基于误差椭圆粒子流的高斯聚合滤波算法,对单个目标节点的动态状态进行估计;在多目标协同运动追踪场景下,采用基于误差椭圆粒子流的高斯聚合滤波融合距离约束的协同优化算法,完成多目标协同运动追踪。采用本发明,能够精准估计目标节点动态状态信息。
-
公开(公告)号:CN104732089B
公开(公告)日:2017-10-20
申请号:CN201510131803.5
申请日:2015-03-24
Applicant: 北京科技大学
IPC: G06F19/00
Abstract: 本发明提供了一种跨区域定位系统滤波算法的历史数据构建方法,包括:获取目标点与每一基站的实测距离;并获取目标点与第id号基站测得的信号强度;判断是否存储有目标点与第id号基站之间的距离历史数据,如果有则提取至少两条所述距离历史数据,并获取所述提取的每一历史数据值对应的信号强度值;然后根据所述历史数据进行卡尔曼滤波,并将滤波处理结果按顺序保存为滤波处理结果数组;判断是否有新的基站,如果有则通过新基站的坐标分别于目标点的最近的两条距离历史数据,计算目标点与新基站之间的距离历史数据;对得到的新基站的距离历史数据分别进行滤波处理,以作为所述目标点与新基站的滤波处理结果。
-
公开(公告)号:CN104965214B
公开(公告)日:2017-04-26
申请号:CN201510272194.5
申请日:2015-05-25
Applicant: 北京科技大学
IPC: G01S19/48
Abstract: 本发明提供一种外罚法与最速下降法结合的车联网定位方法及系统,有助于提高GPS定位精度。所述方法包括:S1,通过GPS获取车辆的定位结果,并结合TOA节点间的测距值构造带约束条件的目标函数;S2,通过外罚法将带约束条件的目标函数转变为不带约束条件的目标函数;S3,通过最速下降法确定所述不带约束条件的目标函数的极小值相应的坐标值;S4,判断所述极小值及坐标值是否满足收敛条件,若满足,所述坐标值为最终优化坐标,否则,则利用所述坐标值,返回S2继续迭代。本发明适用于车联网定位技术领域。
-
公开(公告)号:CN105997094A
公开(公告)日:2016-10-12
申请号:CN201610300730.2
申请日:2016-05-09
Applicant: 北京科技大学
IPC: A61B5/11
CPC classification number: A61B5/1116
Abstract: 本发明提供一种姿态识别装置及方法,能够提高姿态识别精度。所述装置包括:多个测试节点和一个主控节点;其中,每个测试节点,用于获取相应测量部位的状态信息,并将所述状态信息发送至所述主控节点;所述主控节点,用于根据接收的所述每个测试节点发送的所述状态信息提取状态特征值,还用于建立状态转移图与状态分类决策树,并根据建立的所述状态转移图与所述状态分类决策树构建状态转移决策树模型,且通过提取的所述状态特征值对所述状态转移决策树模型进行训练;其中,所述状态转移图表示人体在运动过程中,当前状态与前后状态之间的转移关系。本发明适用于姿态识别技术领域。
-
公开(公告)号:CN105068067A
公开(公告)日:2015-11-18
申请号:CN201510456976.4
申请日:2015-07-29
Applicant: 北京科技大学
IPC: G01S11/00
CPC classification number: G01S11/00
Abstract: 本发明提供一种室内TOA测距值模拟生成方法及装置,有助于提高测试效率和节约测试时间。所述方法包括:获取室内环境信息,并对所述室内环境信息进行处理输出射线追踪图;对输出的所述射线追踪图进行转换,模拟生成发射节点和接收节点之间的测距值。所述装置包括:射线追踪单元:用于获取室内环境信息,并对所述室内环境信息进行处理输出射线追踪图;测距值生成单元:用于对输出的所述射线追踪图进行转换,模拟生成发射节点和接收节点之间的测距值。本发明适用于定位技术领域。
-
公开(公告)号:CN117271967B
公开(公告)日:2024-02-13
申请号:CN202311537570.X
申请日:2023-11-17
Applicant: 北京科技大学
Abstract: 本发明涉及协同定位技术领域,特别是指一种基于强化学习补偿滤波的救援协同定位方法及系统。一种基于强化学习补偿滤波的救援协同定位方法包括:通过微型无人机进行数据采集,获得自信息以及观测信息;通过扩展卡尔曼滤波算法,获得初步位置估计;采用强化学习方法对扩展卡尔曼滤波算法进行滤波增益补偿,获得局部定位结果;根据局部定位结果以及预设的策略网络,对中心评价网络进行更新,获得更新评价网络;通过更新评价网络以及预设的策略网络,获得更新动作;根据更新动作,对局部定位结果进行修正,获得精确定位结果;根据精确定位结果进行救援路线规划。本发明是一种基于强化学习补偿滤波的准确度高且鲁棒性强的救援协同定位方法。
-
公开(公告)号:CN113139644B
公开(公告)日:2024-02-09
申请号:CN202110316103.9
申请日:2021-03-24
Applicant: 北京科技大学顺德研究生院
IPC: G01C21/20 , G06N3/0442 , G06N3/045 , G06N3/006 , G06N3/092 , G06N3/084 , G06N3/0464 , G06N5/01
Abstract: 本发明公开了一种基于深度蒙特卡洛树搜索的信源导航方法及装置,该方法包括:获取待导航智能体在历史时间步内的环境信息和执行的动作信息;通过预设的第一神经网络,基于历史时间步内的环境信息和动作信息,预测出智能体在当前时间步的各个方向的动作概率;以预测的动作概率作为蒙特卡洛树搜索算法的先验知识,选择智能体在当前时间步内的最佳执行动作;结合每一时间步的最佳执行动作,得到智能体移动至信源的最优路径。本发明提出在蒙特卡洛树中使用循环神经网络的集成规划路径框架,
-
-
-
-
-
-
-
-
-