-
公开(公告)号:CN111538823A
公开(公告)日:2020-08-14
申请号:CN202010337359.3
申请日:2020-04-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/35 , G06F40/30 , G06F40/205 , G06F40/126 , G06N3/04 , G06N3/08
Abstract: 本说明书的一个或多个实施例公开了一种信息处理方法、模型训练方法、装置、设备及介质。信息处理方法包括:获取待应答语句;利用目标多分类模型,确定待应答语句的目标类别;其中,目标多分类模型是利用语料库中的多个样本语句及每个样本语句的类别对预定多分类模型训练得到,同一个类别的样本语句具有相同的语义;根据预定的类别与应答信息之间的对应关系,获取目标类别对应的目标应答信息。根据本说明书实施例,能够解决机器应答的速度比较慢的问题。
-
公开(公告)号:CN118278421A
公开(公告)日:2024-07-02
申请号:CN202410471724.8
申请日:2024-04-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/35 , G06F16/332 , G06F16/335 , G06F16/35 , G06F18/22
Abstract: 本说明书公开了一种任务执行方法、装置、电子设备及存储介质,可以通过大语言模型基于用户输入的问题文本数据中包含的一部分文本的语义,预测用户输入的问题文本中的另一部分文本的内容,即,预测文本数据,进而可以根据大语言模型预测的预测文本数据所表达的文本内容和用户实际输入的另一部分文本内容进行匹配,若大语言模型预测的预测文本数据所表达的文本内容和用户实际输入的另一部分文本内容不一致,则可以确定用户输入的问题文本数据可能存在风险,此时,大语言模型可以按照预设的风险答复策略生成回复文本数据,进而可以提升大语言模型生成的回复文本数据的安全性。
-
公开(公告)号:CN110956278A
公开(公告)日:2020-04-03
申请号:CN201911172318.7
申请日:2019-11-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请涉及一种用于重新训练机器学习模型的方法,包括:在使用机器学习模型的过程中监控所述机器学习模型在一时间段内的一个或多个性能度量;基于所述一个或多个性能度量确定是否需要重新训练所述机器学习模型;如果确定需要重新训练所述机器学习模型,则至少基于所述时间段内的原始数据自动生成样本特征;以及至少使用所述自动生成的样本特征来重新训练所述机器学习模型。本申请还涉及相应的系统和计算机可读存储介质。本申请能够自动、高效地重新训练机器学习模型。
-
公开(公告)号:CN110781174A
公开(公告)日:2020-02-11
申请号:CN201910978519.X
申请日:2019-10-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/215 , G06K9/62 , G06N20/00
Abstract: 本公开涉及一种使用pca和特征交叉的特征工程建模的方案,包括:对特征数据进行特征相关检测;使用独热编码对特征进行编码,并对经编码的特征执行pca算法,其中在执行独热编码的过程中,还可以对所述特征进行特征交叉;通过执行共线性选择和特征重要性选择对所述特征进行筛选;以及将筛选出的特征输出用于特征工程建模。
-
公开(公告)号:CN119988973A
公开(公告)日:2025-05-13
申请号:CN202510090380.0
申请日:2025-01-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06N5/04 , G06F16/334 , G06N3/045
Abstract: 本说明书公开一种模型训练方法、业务执行方法、装置、介质及电子设备,获取目标样本集,而后,针对目标样本集中的每个训练样本,根据该训练样本,确定该训练样本对应的输入信息以及输入信息所对应的引导信息,之后,将输入信息以及引导信息输入到待训练模型中,以使待训练模型根据输入信息以及引导信息,确定输出输入信息对应输出结果时所基于的初始逻辑信息,根据输入信息对应的标准输出结果,通过待训练模型对初始逻辑信息进行调整,得到调整后逻辑信息,根据调整后逻辑信息,确定待训练模型针对输入信息的输出结果,以根据输出结果,训练待训练模型。
-
公开(公告)号:CN117235226A
公开(公告)日:2023-12-15
申请号:CN202311227701.4
申请日:2023-09-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F18/214 , G06F18/21 , G06F18/22 , G06F40/30
Abstract: 本说明书一个或多个实施例公开了一种基于大语言模型的问题应答方法,该方法首先获取针对待查询的知识信息而输入的目标问题,其次对目标问题进行向量化处理,得到问题向量,然后基于问题向量,在预设的文档向量数据库中进行检索,得到与问题向量匹配的相关文档,文档向量数据库是针对与待查询的知识信息相关的知识库文档进行向量化处理所得到的数据库,最后基于目标问题检索得到的相关文档生成用于大语言模型的提示信息,并将提示信息输入大语言模型中,得到目标问题对应的答案。
-
公开(公告)号:CN114692828A
公开(公告)日:2022-07-01
申请号:CN202210295134.5
申请日:2022-03-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供一种训练神经网络的方法、装置、设备及存储介质,所述神经网络为由第一神经网络和第二神经网络组成的孪生神经网络,且第一神经网络和第二神经网络具有相同的网络结构和网络参数;所述方法包括:获取预设训练数据集中所有的训练数据,训练数据包括有标签数据和无标签数据;将获取到的有标签数据和无标签数据成对输入所述孪生神经网络进行分类训练,其中,有标签数据被输入所述第一神经网络,无标签数据被输入所述第二神经网络;确定所述第一神经网络的第一目标网络参数;将所述第二神经网络的网络参数更新为第一目标网络参数;基于所述第一目标网络参数确定目标孪生神经网络。
-
公开(公告)号:CN119990183A
公开(公告)日:2025-05-13
申请号:CN202510199077.4
申请日:2025-02-21
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种大语言模型的微调方法和装置。方法包括:获取预训练的大语言模型的权重矩阵,将权重矩阵分解为幅度向量和第一方向矩阵,并初始化第一低秩矩阵和第二低秩矩阵,第一低秩矩阵和第二低秩矩阵的乘积用于拟合第一方向矩阵的增量矩阵;保持第一方向矩阵不变,执行多轮微调,每轮微调包括:将训练文本输入大语言模型,进行损失函数的计算;基于损失函数更新幅度向量;确定损失函数相对于当前方向矩阵的第一梯度矩阵;根据第一梯度矩阵得到更新的第一低秩矩阵以及第二低秩矩阵;基于更新的第一低秩矩阵和第二低秩矩阵的乘积确定本轮增量矩阵,将本轮增量矩阵叠加在第一方向矩阵上,作为本轮更新后的方向矩阵。
-
公开(公告)号:CN117271883A
公开(公告)日:2023-12-22
申请号:CN202311008807.5
申请日:2023-08-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535
Abstract: 本说明书一个或多个实施例公开了一种对象推荐模型优化的方法、装置及设备。所述方法包括:根据目标用户的用户特征,得到所述目标用户被对象推荐模型推荐的包括至少一个推荐节点的对象序列,每个所述推荐节点对应一个向所述目标用户推荐的推荐对象;根据所述用户特征和所述推荐对象的对象特征,对所述对象序列进行资源损失状况和用户体验质量的评估处理,得到所述对象序列对应的累积奖励;基于所述对象序列对应的累积奖励,调整所述对象推荐模型的参数,直至调整后的所述对象推荐模型对所述目标用户推荐的对象序列对应的累积奖励满足预设条件,得到调整后的对象推荐模型。
-
公开(公告)号:CN116167347A
公开(公告)日:2023-05-26
申请号:CN202310329061.1
申请日:2023-03-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种表格型交易数据的深度学习方法及装置、介质、设备。方法包括:从表格型交易数据中提取出N个先验特征,将每一个所述先验特征转化为对应的特征向量;计算所述表格型交易数据对应的第一注意力得分矩阵;将每一个所述特征向量和对应的所述第一注意力得分向量进行融合,得到对应的第二注意力得分向量;根据由N个所述第二注意力得分向量形成的第二注意力得分矩阵,对所述表格型交易数据进行深度学习,以确定所述表格型交易数据中交易行为信息和标签信息之间的关系。本说明书实施例提供一种适合表格型的交易数据的深度学习方案,减少先验知识的丢失,提高深度学习结果的准确性。
-
-
-
-
-
-
-
-
-