-
公开(公告)号:CN119631086A
公开(公告)日:2025-03-14
申请号:CN202280097902.4
申请日:2022-07-04
Applicant: 罗伯特·博世有限公司 , 清华大学
IPC: G06N3/08
Abstract: 本公开内容提供了一种用于多个任务的连续学习的计算机实现的方法,包括:由多个连续学习子网络并行地接收输入数据,所述输入数据与所述多个任务中的一个任务相关,所述多个连续学习子网络的数量是固定的并且与所述多个任务的数量无关;分别由所述多个连续学习子网络基于所述输入数据来生成多个特征表示;由特征集成子网络基于所述多个特征表示来生成与所述一个任务相关的预测;基于与所述一个任务相关的所述预测和与直到所述一个任务为止已经学习的任务相关的信息来生成连续学习损失值;以及基于所述连续学习损失值来更新所述多个连续学习子网络和所述特征集成子网络的可学习参数。
-
公开(公告)号:CN118918880A
公开(公告)日:2024-11-08
申请号:CN202410692168.7
申请日:2024-05-30
Abstract: 本申请提供了一种足式机器人的语音控制方法及系统、电子设备和存储介质。所述语音控制方法包括:语音控制系统基于预设时间周期采集来自用户的语音信号;根据语音信号生成语音控制信息;判断语音控制信息是否包括第一预设信息;在判断出语音控制信息包括第一预设信息的情况下,调整语音控制系统的状态为语音控制状态;在语音控制状态下,根据第一预设信息生成动作控制指令;根据动作控制指令,控制足式机器人的关节电机输出对应关节力矩,以使得足式机器人执行相应动作;其中,语音控制系统配置在足式机器人的本体中。
-
公开(公告)号:CN118915799A
公开(公告)日:2024-11-08
申请号:CN202410692161.5
申请日:2024-05-30
IPC: G05D1/49 , G05D109/12
Abstract: 本申请提供了一种足式机器人的运动控制方法及系统、电子设备和存储介质。所述运动控制方法包括:在预设仿真平台上配置预设仿真环境,预设仿真环境包括仿真模拟环境和仿真强化学习训练环境,仿真模拟环境包括足式机器人的模拟足式机器人的信息和模拟环境信息,仿真强化学习训练环境包括预设任务信息、训练参量信息和网络结构信息;在预设仿真环境中执行模型训练,以得到策略网络模型;将策略网络模型与足式机器人通信连接,以获取足式机器人的状态观测信息或者向足式机器人发送控制指令;基于策略网络模型确定出与状态观测信息对应的关节期望位置信息;根据关节期望位置信息确定关节控制量;基于关节控制量向足式机器人发送控制指令,使得足式机器人根据关节控制量执行相应的运动。
-
公开(公告)号:CN113344038B
公开(公告)日:2024-10-15
申请号:CN202110542475.3
申请日:2021-05-18
Applicant: 清华大学
IPC: G06F18/241 , G06F18/22 , G06N20/20
Abstract: 本发明提出了一种用于对小样本学习任务生成集成分类器的可视分析系统和方法,其中,系统包括:接收模块用于接收多个基学习器和多个样本;基学习器选择模块用于根据多个基学习器和多个样本,选择适合小样本学习任务的基学习器;样本选择模块用于根据选择的基学习器和多个样本,选择适合小样本学习任务的有标注样本;集成分类器生成模块用于根据选择的基学习器和选择的有标注样本,生成集成分类器;可视化模块用于显示集成分类器对多个样本的分类结果。
-
公开(公告)号:CN117312909A
公开(公告)日:2023-12-29
申请号:CN202311180684.3
申请日:2023-09-13
Applicant: 清华大学
IPC: G06F18/24 , G06F18/214 , G06N3/0464 , G06N3/09
Abstract: 本发明提供一种基于提示词微调的持续学习的任务处理方法及装置。该方法包括:获取待处理任务的输入数据;将所述输入数据发送至预设的提示词查询网络模型中的第一主干网络提取特征向量,并获得所述提示词查询网络模型中的任务分类器网络输出的任务标签;基于所述任务标签从预设的提示词池中确定与所述输入数据对应的提示词;将所述提示词与所述输入数据输入到预设的提示词微调网络模型中的第二主干网络提取特征向量,并获得所述提示词微调网络模型中类别分类器输出的预测结果。本发明提供的方法,能够通过仅使用微量参数进行提示词微调得到的网络模型进行任务处理,减少了所需的显存,提高了网络模型任务处理的适应能力和性能。
-
公开(公告)号:CN114912507A
公开(公告)日:2022-08-16
申请号:CN202210324008.8
申请日:2022-03-29
Applicant: 清华大学
IPC: G06K9/62
Abstract: 本申请公开了一种半监督分类方法及装置,该方法包括如下步骤:步骤一:获取训练数据集中的每个原始样本的趋势信息、每个原始样本对应的遮罩的预设值和预设的一致性损失函数;其中,所述原始样本包括时间序列数据;步骤二:根据每个原始样本、每个原始样本的趋势信息、以及每个原始样本对应的遮罩的预设值分别确定每个增广样本;步骤三:根据每个增广样本、每个原始样本、以及预设的一致性损失函数训练预设的深度学习模型;步骤四:优化每个原始样本对应的遮罩的预设值;使用优化后的值更新预设值;步骤五:重复步骤二至步骤四,直到得到训练完备的深度学习模型;步骤六:利用所述训练完备的深度学习模型对时间序列数据进行半监督分类。
-
公开(公告)号:CN113344038A
公开(公告)日:2021-09-03
申请号:CN202110542475.3
申请日:2021-05-18
Applicant: 清华大学
Abstract: 本发明提出了一种用于对小样本学习任务生成集成分类器的可视分析系统和方法,其中,系统包括:接收模块用于接收多个基学习器和多个样本;基学习器选择模块用于根据多个基学习器和多个样本,选择适合小样本学习任务的基学习器;样本选择模块用于根据选择的基学习器和多个样本,选择适合小样本学习任务的有标注样本;集成分类器生成模块用于根据选择的基学习器和选择的有标注样本,生成集成分类器;可视化模块用于显示集成分类器对多个样本的分类结果。
-
-
-
-
-
-