一种智能体最优策略获取方法及装置

    公开(公告)号:CN113128705A

    公开(公告)日:2021-07-16

    申请号:CN202110314960.5

    申请日:2021-03-24

    Abstract: 本发明公开了一种智能体最优策略获取方法及装置,该方法包括:将智能体在与环境交互过程中接收的全局奖励建模为单一智能体真实的局部奖励和不可观测环境状态引起的随机噪声信号之和,构建系统模型;利用卡尔曼滤波算法,从观测到的多智能体系统中智能体在与环境交互过程中接收的全局奖励中获得当前智能体对应的局部奖励;根据各智能体对应的局部奖励,通过预设的强化学习算法,对多智能系统中的各智能体进行训练,使得每一智能体分别学习到当前环境下的最优策略。本发明解决了不平稳环境下的多智能体系统信用分配问题,能提高多智能体系统在完成协作任务过程中计算的高效性和鲁棒性。

    JSON格式数据的相似度计算方法及装置、介质、设备

    公开(公告)号:CN118916717A

    公开(公告)日:2024-11-08

    申请号:CN202411411597.9

    申请日:2024-10-11

    Abstract: 本申请涉及计算机技术领域,具体公开了一种JSON格式数据的相似度计算方法及装置、介质、设备,该方法包括:获取第一JSON格式数据和第二JSON格式数据;通过相似度计算模型,将第一JSON格式数据和第二JSON格式数据转化为图结构,得到第一图结构和第二图结构;分别确定第一图结构对应的第一图向量和第二图结构对应的第二图向量,根据第一图向量和第二图向量,计算图级比较结果向量;根据第一图结构和第二图结构中每个节点对应的语义特征向量,计算节点级比较结果向量;将图级比较结果向量以及节点级比较结果向量进行拼接处理,根据拼接处理结果计算第一JSON格式数据和第二JSON格式数据之间的最终相似度。

    半结构化文档数据模式实时推荐方法

    公开(公告)号:CN116701710A

    公开(公告)日:2023-09-05

    申请号:CN202310764315.2

    申请日:2023-06-27

    Abstract: 本发明涉及数据库应用领域,具体的说是半结构化文档数据模式实时推荐方法,包括以下步骤:步骤S1:半结构化文档数据模式嵌入,将半结构化文档数据模式转化为低维的向量表示,并作为实时推荐的输入,步骤S2:实时推荐,根据用户正在创建的数据模式内容以及当前输入字段,预测用户接下来将要创建的内容并进行推荐,帮助用户快速创建高质量的数据模式。可减少用户创建数据模式的三分之二操作次数,大大减轻用户创建数据模式的负担,同时引导用户使用同质的数据模式,降低数据库数据模式的异构型,提升数据利用效率。

    JSON格式数据的相似度计算方法及装置、介质、设备

    公开(公告)号:CN118916717B

    公开(公告)日:2024-12-06

    申请号:CN202411411597.9

    申请日:2024-10-11

    Abstract: 本申请涉及计算机技术领域,具体公开了一种JSON格式数据的相似度计算方法及装置、介质、设备,该方法包括:获取第一JSON格式数据和第二JSON格式数据;通过相似度计算模型,将第一JSON格式数据和第二JSON格式数据转化为图结构,得到第一图结构和第二图结构;分别确定第一图结构对应的第一图向量和第二图结构对应的第二图向量,根据第一图向量和第二图向量,计算图级比较结果向量;根据第一图结构和第二图结构中每个节点对应的语义特征向量,计算节点级比较结果向量;将图级比较结果向量以及节点级比较结果向量进行拼接处理,根据拼接处理结果计算第一JSON格式数据和第二JSON格式数据之间的最终相似度。

    一种增强大语言模型在材料领域推理能力的方法及系统

    公开(公告)号:CN118504682A

    公开(公告)日:2024-08-16

    申请号:CN202410549292.8

    申请日:2024-05-06

    Abstract: 本发明涉及一种增强大语言模型在材料领域推理能力的方法及系统,方法包括:材料领域用户与大型语言模型LLM进行交互,提出问题,形成提问文本;将提问文本转换为提示向量;对提示向量与大型语言模型LLM的向量数据库预先存储的专家提示向量进行比较和提示增强补全,得到问题提示;根据问题提示和模型描述进行任务分解和调度,生成任务规划;调用任务规划中的数据处理任务,将问题提示包含的文本数据转换为格式化数据;根据任务规划选择相应的模型并执行;大型语言模型LLM整合任务结果并生成最终响应。本发明将LLM的语言理解能力与科学领域的专业知识相结合,使得模型能够更好地理解和处理科学领域的任务,解决了科学领域任务中的复杂性和多样性。

    一种智能体最优策略获取方法及装置

    公开(公告)号:CN113128705B

    公开(公告)日:2024-02-09

    申请号:CN202110314960.5

    申请日:2021-03-24

    Abstract: 性和鲁棒性。本发明公开了一种智能体最优策略获取方法及装置,该方法包括:将智能体在与环境交互过程中接收的全局奖励建模为单一智能体真实的局部奖励和不可观测环境状态引起的随机噪声信号之和,构建系统模型;利用卡尔曼滤波算法,从观测到的多智能体系统中智能体在与环境交互过程中接收的全局奖励中获得当前智能体对应的局部奖励;根据各智能体对应的局部奖励,通过预设的强化学习算法,对多智能系统中的各智能体进行训练,使得每一智能体分别学习到当前环境下的最优策略。本发明解决了不平稳

    一种基于深度蒙特卡洛树搜索的信源导航方法及装置

    公开(公告)号:CN113139644A

    公开(公告)日:2021-07-20

    申请号:CN202110316103.9

    申请日:2021-03-24

    Abstract: 本发明公开了一种基于深度蒙特卡洛树搜索的信源导航方法及装置,该方法包括:获取待导航智能体在历史时间步内的环境信息和执行的动作信息;通过预设的第一神经网络,基于历史时间步内的环境信息和动作信息,预测出智能体在当前时间步的各个方向的动作概率;以预测的动作概率作为蒙特卡洛树搜索算法的先验知识,选择智能体在当前时间步内的最佳执行动作;结合每一时间步的最佳执行动作,得到智能体移动至信源的最优路径。本发明提出在蒙特卡洛树中使用循环神经网络的集成规划路径框架,帮助提高导航控制的稳定性和性能,通过对时间动作序列数据的处理,解决连续空间中的路径规划问题。

Patent Agency Ranking