-
公开(公告)号:CN115545002A
公开(公告)日:2022-12-30
申请号:CN202211509841.6
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/194 , G06F40/289 , G06F40/30
Abstract: 本说明书公开了一种模型训练和业务处理的方法、装置、存储介质及设备。该模型训练的方法包括,获取历史对话,从历史对话中确定目标语句,将历史对话输入待训练的特征提取模型中,以使特征提取模型根据历史对话中除目标语句外的其他语句,确定目标语句对应的语句特征,作为第一特征,以及,根据目标语句,确定目标语句对应的语句特征,作为第二特征,以最小化第一特征与第二特征之间的偏差为优化目标,对特征提取模型进行训练,其中,训练后的特征提取模型用于确定输入的每个对话语句对应的语句特征,并将输出的语句特征进行发送,以使接收端根据接收到的语句特征进行业务处理。
-
公开(公告)号:CN116701587A
公开(公告)日:2023-09-05
申请号:CN202310648035.5
申请日:2023-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N20/00
Abstract: 本说明书一个或多个实施例公开了一种基于机器学习的问答方法及装置。所述方法包括:获取与目标对象对应的对象描述信息,以及与目标对象对应的对象描述信息相关的第一样本问题和第一样本答案。将目标对象对应的对象描述信息、第一样本问题和第一样本答案输入预训练的第一问答模型中,得到第一样本问题对应的样本预测答案以及第一样本答案对应的样本预测问题。根据第一样本问题、样本预测答案、第一样本答案以及样本预测问题,生成对象描述信息对应的第一样本问答对。将对象描述信息及其对应的第一样本问答对输入待训练的第二问答模型中进行模型训练,得到训练后的第二问答模型。
-
公开(公告)号:CN116932752A
公开(公告)日:2023-10-24
申请号:CN202310849143.9
申请日:2023-07-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F18/23 , G06F40/289 , G06F18/22 , G06F18/214 , G06Q40/00 , G06Q20/40
Abstract: 本说明书实施例提供了一种风险识别方法和装置。该方法包括:得到在不同时间段收集的、与风险识别相关的多个文本;对每一个文本,得到该文本的向量表征;根据同一个时间段收集的多个文本的向量表征,对同一个时间段收集的多个文本进行聚类,得到每一个时间段内的至少一个文本聚类结果;根据不同时间段内的各个文本聚类结果,确定是否产生了新的风险类型。本说明书实施例能够快速地发现新的风险类型。
-
公开(公告)号:CN115545002B
公开(公告)日:2023-03-31
申请号:CN202211509841.6
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/194 , G06F40/289 , G06F40/30
Abstract: 本说明书公开了一种模型训练和业务处理的方法、装置、存储介质及设备。该模型训练的方法包括,获取历史对话,从历史对话中确定目标语句,将历史对话输入待训练的特征提取模型中,以使特征提取模型根据历史对话中除目标语句外的其他语句,确定目标语句对应的语句特征,作为第一特征,以及,根据目标语句,确定目标语句对应的语句特征,作为第二特征,以最小化第一特征与第二特征之间的偏差为优化目标,对特征提取模型进行训练,其中,训练后的特征提取模型用于确定输入的每个对话语句对应的语句特征,并将输出的语句特征进行发送,以使接收端根据接收到的语句特征进行业务处理。
-
公开(公告)号:CN115019786A
公开(公告)日:2022-09-06
申请号:CN202210561117.1
申请日:2022-05-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了模糊音识别模型的训练方法和装置以及语音含义的理解方法及装置。该训练方法包括:得到包括多个字符的具有语义的样本文本;对样本文本中的每一个字符,获取该字符的拼音;根据样本文本中的每一个字符的拼音,得到每一个字符对应的模糊音;利用样本文本、该样本文本中每一个字符对应的模糊音以及该样本文本的标签,训练所述模糊音识别模型。本说明书实施例能够更加准确地理解语音的含义。
-
公开(公告)号:CN117493564A
公开(公告)日:2024-02-02
申请号:CN202311407419.4
申请日:2023-10-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/289 , G06N5/022 , G06F16/36 , G06F40/216
Abstract: 本说明书实施例公开了一种聚类方法、装置、存储介质及电子设备,方法包括:对样本风险文本分别进行关键词提取处理,得到样本风险文本对应的第一关键词集合,然后以样本风险文本和第一关键词集合训练语言表征模型,得到初始语言表征模型,再根据样本风险文本对应的目标业务对第一关键词集合中的关键词进行过滤,得到各第二关键词集合,以样本风险文本和与第二关键词集合训练初始语言表征模型,得到目标语言表征模型;模型训练完成后,在对目标风险文本进行聚类时,将各目标风险文本分别输入至目标语言表征模型中,得到各目标风险文本分别对应的风险文本向量,最后对各风险文本向量进行聚类,得到各风险文本类别。
-
公开(公告)号:CN116932718A
公开(公告)日:2023-10-24
申请号:CN202310871334.5
申请日:2023-07-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/36 , G06F18/22 , G06N3/04 , G06N3/088
Abstract: 本说明书一个或多个实施例公开了一种问题生成模型的训练方法,该方法首先获取历史复杂问题及其对应的答案,以及与历史复杂问题对应的历史文档型知识库,且该历史文档型知识库中至少包括一个与历史复杂问题相关的历史文档;然后从历史文档中提取与历史复杂问题相关的实体词,基于实体词构建简单问题,并基于简单问题和历史复杂问题确定多个历史知识点;最后基于历史文档和多个历史知识点,通过预设的损失函数对问题生成模型进行训练,得到训练后的问题生成模型,其中,该问题生成模型用于生成历史文档对应的历史复杂问题。
-
公开(公告)号:CN115423485B
公开(公告)日:2023-03-21
申请号:CN202211369675.4
申请日:2022-11-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06Q30/012 , G06Q40/03 , G06F40/284 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取待检测的目标数据,并获取所述目标数据与每个候选用户意图对应的目标概率,所述目标数据包括人机交互过程中用户的输入数据;对所述目标数据进行划分,得到多个子数据,并基于预设梯度积分算法,获取每个所述子数据对所述目标数据属于每个所述候选用户意图的贡献度;基于所述目标数据与每个候选用户意图对应的目标概率,以及所述每个所述子数据对所述目标数据属于每个所述候选用户意图的贡献度,确定所述目标数据对应的目标用户意图。
-
公开(公告)号:CN115423485A
公开(公告)日:2022-12-02
申请号:CN202211369675.4
申请日:2022-11-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06Q30/00 , G06Q40/02 , G06F40/284 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取待检测的目标数据,并获取所述目标数据与每个候选用户意图对应的目标概率,所述目标数据包括人机交互过程中用户的输入数据;对所述目标数据进行划分,得到多个子数据,并基于预设梯度积分算法,获取每个所述子数据对所述目标数据属于每个所述候选用户意图的贡献度;基于所述目标数据与每个候选用户意图对应的目标概率,以及所述每个所述子数据对所述目标数据属于每个所述候选用户意图的贡献度,确定所述目标数据对应的目标用户意图。
-
-
-
-
-
-
-
-