Patent search ap:("中国科学院自动化研究所") AND inv:"谷召振" Page 1

1.

发明公开
基于大语言模型的行动方案生成模型的训练方法及装置有权

公开(公告)号：CN118152528A

公开(公告)日：2024-06-07

申请号：CN202410222968.2

申请日：2024-02-28

Applicant: 中国科学院自动化研究所

Inventor： 徐博 , 张清扬 , 王燕娜 , 谷召振 , 张文圣 , 王媛媛 , 徐波

IPC: G06F16/332 , G06N3/045 , G06N3/08 , G06F18/214

Abstract: 本发明提供一种基于大语言模型的行动方案生成模型的训练方法及装置，其中方法包括：获取行动方案样本的背景信息，以及初始大语言模型；基于背景信息，以及通用大语言模型，构建行动方案样本的想定数据集；基于想定数据集，以及通用大语言模型，构建行动方案样本的问题数据集；基于问题数据集，以及通用大语言模型，构建行动方案样本的方案数据集；基于问题数据集以及方案数据集，对初始大语言模型进行训练，得到行动方案生成模型。本发明提供的方法，基于连续多阶段的数据集构建，提升了训练数据的全面性、准确性、可定制性。并通过构建得到的数据集对初始大语言模型进行微调训练，提升行动方案生成模型的准确性、可行性、实用性。

2.

发明授权
基于大语言模型的行动方案生成模型的训练方法及装置有权

公开(公告)号：CN118152528B

公开(公告)日：2024-12-06

申请号：CN202410222968.2

申请日：2024-02-28

Applicant: 中国科学院自动化研究所

Inventor： 徐博 , 张清扬 , 王燕娜 , 谷召振 , 张文圣 , 王媛媛 , 徐波

IPC: G06F16/332 , G06N3/045 , G06N3/08 , G06F18/214

Abstract: 本发明提供一种基于大语言模型的行动方案生成模型的训练方法及装置，其中方法包括：获取行动方案样本的背景信息，以及初始大语言模型；基于背景信息，以及通用大语言模型，构建行动方案样本的想定数据集；基于想定数据集，以及通用大语言模型，构建行动方案样本的问题数据集；基于问题数据集，以及通用大语言模型，构建行动方案样本的方案数据集；基于问题数据集以及方案数据集，对初始大语言模型进行训练，得到行动方案生成模型。本发明提供的方法，基于连续多阶段的数据集构建，提升了训练数据的全面性、准确性、可定制性。并通过构建得到的数据集对初始大语言模型进行微调训练，提升行动方案生成模型的准确性、可行性、实用性。

3.

发明公开
物资分配方法、装置、电子设备及存储介质无效

公开(公告)号：CN118014322A

公开(公告)日：2024-05-10

申请号：CN202410419736.6

申请日：2024-04-09

Applicant: 中国科学院自动化研究所

Inventor： 徐波 , 谷召振 , 宋国瑞 , 王燕娜 , 王媛媛 , 张文圣 , 徐博

IPC: G06Q10/0631 , G06Q10/083 , G06Q50/26

Abstract: 本发明提供一种物资分配方法、装置、电子设备及存储介质，应用于数据处理技术领域。该方法包括：获取物资属性、运输设备属性以及场所需求属性；根据所述物资属性、所述运输设备属性以及所述场所需求属性确定物资的预分配策略，并确定所述预分配策略中满足分配期望的目标策略，所述目标策略包括通过目标运输设备将目标物资运送至目标场所；根据所述目标策略生成物资运送指令。

4.

发明授权
一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品有权

公开(公告)号：CN117787668B

公开(公告)日：2024-08-13

申请号：CN202410206913.2

申请日：2024-02-26

Applicant: 中国科学院自动化研究所

Inventor： 徐博 , 张文圣 , 王媛媛 , 王燕娜 , 谷召振 , 徐波

IPC: G06Q10/0631 , G06F16/332

Abstract: 本发明涉及任务规划技术领域，提供一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品，所述方法包括：将需求分析提示文本输入至大语言模型，得到大语言模型输出的需求分析结果；基于需求分析结果，对目标任务进行分配，得到目标分配结果；基于目标分配结果，生成方案分析提示文本；将方案分析提示文本输入至大语言模型，得到大语言模型输出的方案分析结果；基于方案分析结果以及需求分析结果，生成方案描述提示文本；将方案描述提示文本输入至大语言模型，得到大语言模型输出的方案描述结果，方案描述结果用于描述目标任务的分配方案以及分配方案的评估结果。本发明能够根据用户需求精确进行目标分配。

5.

发明公开
基于知识引导的智能决策方法及装置审中-实审

公开(公告)号：CN118246528A

公开(公告)日：2024-06-25

申请号：CN202410344828.2

申请日：2024-03-25

Applicant: 中国科学院自动化研究所

Inventor： 徐博 , 王燕娜 , 王媛媛 , 谷召振 , 徐波

IPC: G06N5/01 , G06N3/006 , G06N3/092 , G06N5/02

Abstract: 本发明涉及智能决策技术领域，提供一种基于知识引导的智能决策方法及装置，所述方法包括：确定智能体的当前进程以及当前进程的目标参数；基于智能决策模型，应用当前进程以及目标参数，确定智能体在当前进程下的执行动作；智能决策模型基于样本进程、样本进程的样本目标参数、样本进程下的样本执行动作以及样本执行动作对应的奖励值训练得到；智能决策模型用于基于任务树，确定样本进程的候选执行动作，并基于样本目标参数从候选执行动作中确定样本执行动作，任务树用于描述不同进程下的任务以及各任务对应的执行动作。本发明通过将任务树作为知识约束，从而可以有效提高学习效率和能力，使智能体能够更好地应对复杂决策空间中的挑战。

6.

发明公开
一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品有权

公开(公告)号：CN117787668A

公开(公告)日：2024-03-29

申请号：CN202410206913.2

申请日：2024-02-26

Applicant: 中国科学院自动化研究所

Inventor： 徐博 , 张文圣 , 王媛媛 , 王燕娜 , 谷召振 , 徐波

IPC: G06Q10/0631 , G06F16/332

Abstract: 本发明涉及任务规划技术领域，提供一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品，所述方法包括：将需求分析提示文本输入至大语言模型，得到大语言模型输出的需求分析结果；基于需求分析结果，对目标任务进行分配，得到目标分配结果；基于目标分配结果，生成方案分析提示文本；将方案分析提示文本输入至大语言模型，得到大语言模型输出的方案分析结果；基于方案分析结果以及需求分析结果，生成方案描述提示文本；将方案描述提示文本输入至大语言模型，得到大语言模型输出的方案描述结果，方案描述结果用于描述目标任务的分配方案以及分配方案的评估结果。本发明能够根据用户需求精确进行目标分配。

Patent Agency Ranking