一种任务执行方法、装置、电子设备及存储介质

    公开(公告)号:CN118278421A

    公开(公告)日:2024-07-02

    申请号:CN202410471724.8

    申请日:2024-04-18

    Abstract: 本说明书公开了一种任务执行方法、装置、电子设备及存储介质,可以通过大语言模型基于用户输入的问题文本数据中包含的一部分文本的语义,预测用户输入的问题文本中的另一部分文本的内容,即,预测文本数据,进而可以根据大语言模型预测的预测文本数据所表达的文本内容和用户实际输入的另一部分文本内容进行匹配,若大语言模型预测的预测文本数据所表达的文本内容和用户实际输入的另一部分文本内容不一致,则可以确定用户输入的问题文本数据可能存在风险,此时,大语言模型可以按照预设的风险答复策略生成回复文本数据,进而可以提升大语言模型生成的回复文本数据的安全性。

    重新训练机器学习模型的方法和系统

    公开(公告)号:CN110956278A

    公开(公告)日:2020-04-03

    申请号:CN201911172318.7

    申请日:2019-11-26

    Abstract: 本申请涉及一种用于重新训练机器学习模型的方法,包括:在使用机器学习模型的过程中监控所述机器学习模型在一时间段内的一个或多个性能度量;基于所述一个或多个性能度量确定是否需要重新训练所述机器学习模型;如果确定需要重新训练所述机器学习模型,则至少基于所述时间段内的原始数据自动生成样本特征;以及至少使用所述自动生成的样本特征来重新训练所述机器学习模型。本申请还涉及相应的系统和计算机可读存储介质。本申请能够自动、高效地重新训练机器学习模型。

    模型训练方法、业务执行方法、装置、介质及电子设备

    公开(公告)号:CN119988973A

    公开(公告)日:2025-05-13

    申请号:CN202510090380.0

    申请日:2025-01-20

    Abstract: 本说明书公开一种模型训练方法、业务执行方法、装置、介质及电子设备,获取目标样本集,而后,针对目标样本集中的每个训练样本,根据该训练样本,确定该训练样本对应的输入信息以及输入信息所对应的引导信息,之后,将输入信息以及引导信息输入到待训练模型中,以使待训练模型根据输入信息以及引导信息,确定输出输入信息对应输出结果时所基于的初始逻辑信息,根据输入信息对应的标准输出结果,通过待训练模型对初始逻辑信息进行调整,得到调整后逻辑信息,根据调整后逻辑信息,确定待训练模型针对输入信息的输出结果,以根据输出结果,训练待训练模型。

    一种基于大语言模型的问题应答方法及装置

    公开(公告)号:CN117235226A

    公开(公告)日:2023-12-15

    申请号:CN202311227701.4

    申请日:2023-09-21

    Inventor: 熊文文 易灿

    Abstract: 本说明书一个或多个实施例公开了一种基于大语言模型的问题应答方法,该方法首先获取针对待查询的知识信息而输入的目标问题,其次对目标问题进行向量化处理,得到问题向量,然后基于问题向量,在预设的文档向量数据库中进行检索,得到与问题向量匹配的相关文档,文档向量数据库是针对与待查询的知识信息相关的知识库文档进行向量化处理所得到的数据库,最后基于目标问题检索得到的相关文档生成用于大语言模型的提示信息,并将提示信息输入大语言模型中,得到目标问题对应的答案。

    一种训练神经网络的方法、装置、设备及存储介质

    公开(公告)号:CN114692828A

    公开(公告)日:2022-07-01

    申请号:CN202210295134.5

    申请日:2022-03-23

    Abstract: 本说明书提供一种训练神经网络的方法、装置、设备及存储介质,所述神经网络为由第一神经网络和第二神经网络组成的孪生神经网络,且第一神经网络和第二神经网络具有相同的网络结构和网络参数;所述方法包括:获取预设训练数据集中所有的训练数据,训练数据包括有标签数据和无标签数据;将获取到的有标签数据和无标签数据成对输入所述孪生神经网络进行分类训练,其中,有标签数据被输入所述第一神经网络,无标签数据被输入所述第二神经网络;确定所述第一神经网络的第一目标网络参数;将所述第二神经网络的网络参数更新为第一目标网络参数;基于所述第一目标网络参数确定目标孪生神经网络。

    大语言模型的微调方法和装置
    8.
    发明公开

    公开(公告)号:CN119990183A

    公开(公告)日:2025-05-13

    申请号:CN202510199077.4

    申请日:2025-02-21

    Abstract: 本说明书实施例提供一种大语言模型的微调方法和装置。方法包括:获取预训练的大语言模型的权重矩阵,将权重矩阵分解为幅度向量和第一方向矩阵,并初始化第一低秩矩阵和第二低秩矩阵,第一低秩矩阵和第二低秩矩阵的乘积用于拟合第一方向矩阵的增量矩阵;保持第一方向矩阵不变,执行多轮微调,每轮微调包括:将训练文本输入大语言模型,进行损失函数的计算;基于损失函数更新幅度向量;确定损失函数相对于当前方向矩阵的第一梯度矩阵;根据第一梯度矩阵得到更新的第一低秩矩阵以及第二低秩矩阵;基于更新的第一低秩矩阵和第二低秩矩阵的乘积确定本轮增量矩阵,将本轮增量矩阵叠加在第一方向矩阵上,作为本轮更新后的方向矩阵。

    一种对象推荐模型优化的方法、装置及设备

    公开(公告)号:CN117271883A

    公开(公告)日:2023-12-22

    申请号:CN202311008807.5

    申请日:2023-08-10

    Inventor: 易灿 张天翼

    Abstract: 本说明书一个或多个实施例公开了一种对象推荐模型优化的方法、装置及设备。所述方法包括:根据目标用户的用户特征,得到所述目标用户被对象推荐模型推荐的包括至少一个推荐节点的对象序列,每个所述推荐节点对应一个向所述目标用户推荐的推荐对象;根据所述用户特征和所述推荐对象的对象特征,对所述对象序列进行资源损失状况和用户体验质量的评估处理,得到所述对象序列对应的累积奖励;基于所述对象序列对应的累积奖励,调整所述对象推荐模型的参数,直至调整后的所述对象推荐模型对所述目标用户推荐的对象序列对应的累积奖励满足预设条件,得到调整后的对象推荐模型。

Patent Agency Ranking