-
公开(公告)号:CN120014685A
公开(公告)日:2025-05-16
申请号:CN202510088122.9
申请日:2025-01-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V40/16 , G06V10/75 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0895
Abstract: 本说明书提供了一种模型训练方法及同质人群筛选方法、装置,模型训练方法包括利用带噪声标签的样本数据集对第一、第二初始模型进行协同指导训练,并且对未利用到的样本数据生成标签数据,并基于这些样本数据进行模型训练得到第一、第二子模型。基于半监督学习思想,为协同指导训练未利用到的高噪声数据生成对应的标签数据,从而利用全量的样本数据对模型进行训练,极大提高样本数据的利用率,而且增大训练数据规模,进而提高模型训练效果和精度。
-
公开(公告)号:CN118427594A
公开(公告)日:2024-08-02
申请号:CN202410812587.X
申请日:2024-06-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/213 , G06F18/214 , G06F18/24 , G06F16/35 , G06N3/042 , G06N3/08
Abstract: 本说明书公开一种基于大语言模型的业务处理方法、装置及存储介质,包括:基于图表示学习方式对第一图关系数据进行特征提取,得到第一用户特征;第一图关系数据中的节点用于表征目标业务的用户,并包含有节点对应用户的用户信息。基于目标大语言模型对目标业务下样本用户与客服之间的第一沟通数据进行特征提取,得到第二用户特征。基于第一用户特征与第二用户特征之间的损失,对目标大语言模型的模型参数进行调整,以训练用户特征提取能力。基于目标大语言模型,对目标业务下目标用户与客服之间的第二沟通数据进行特征提取,得到第三用户特征;以及,基于目标大语言模型对第三用户特征进行业务预测,以执行与业务预测结果相匹配的业务处理决策。
-
公开(公告)号:CN117764038A
公开(公告)日:2024-03-26
申请号:CN202311751326.3
申请日:2023-12-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/166 , G06F16/35 , G06N3/0455 , G06N3/0895
Abstract: 本说明书实施例提供一种训练迁移模型的方法,进行文本风格迁移的方法和对应装置。其中迁移模型包括,编码解耦网络,重组网络和解码器。训练过程包括:将第一文本输入编码解耦网络,得到与内容相关的内容表征,以及与风格相关的第一风格表征;其中第一文本具有风格标签。通过重组网络,分别施加风格标签对应的正向风格向量和与之相反的反向风格向量,得到第二风格表征和第三风格表征。然后,将第二风格表征和第三风格表征分别与内容表征组合后进行解码,得到第二文本和第三文本。通过分类器得到第三文本的风格类别的预测结果。从而通过预测损失,更新迁移模型,预测损失包括,第一文本和第二文本之间的重构损失,以及第三文本的分类损失。
-
公开(公告)号:CN117290554B
公开(公告)日:2024-03-01
申请号:CN202311590588.6
申请日:2023-11-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供了一种基于图数据的业务规则确定方法及装置。图数据包括代表业务对象的节点以及节点之间的连接边,用来存储与业务数据相关的隐私数据。在该方法中,通过图神经网络确定图数据中的节点表征。将若干备选规则与匹配的实例子图进行结合,得到若干推理子图,备选规则包括推理条件和推理结果,任意一个推理子图包含推理条件数据和推理结果数据。接着,利用节点表征确定若干推理子图中各自的推理结果数据成立的概率评分,基于与任意一个备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度,基于若干备选规则的置信度对若干备选规则进行筛选,得到图数据的
-
公开(公告)号:CN117520927A
公开(公告)日:2024-02-06
申请号:CN202410014918.5
申请日:2024-01-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/241 , G06F18/243 , G06F18/213 , G06F18/22 , G06N3/042 , G06N3/09
Abstract: 本说明书实施例提供一种检测异常账户的方法和装置,方法包括:从目标图谱中提取目标账户对应的目标节点和其邻居节点构成的目标子图;将目标子图输入图神经网络模型,得到目标节点的节点表征向量;获取目标节点在目标图谱中对应的图结构特征的特征值;图结构特征包括节点特征和关系特征;节点特征用于反映目标节点在目标图谱中的重要程度或其归属子图的稠密程度,关系特征用于反映目标节点与目标图谱中的其他节点之间的相关性;将节点表征向量和特征值输入分类模型,得到目标账户是否属于异常账户的检测结果。该方法能够提升检测异常账户的准确率。
-
公开(公告)号:CN117520898A
公开(公告)日:2024-02-06
申请号:CN202311548634.6
申请日:2023-11-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/24 , G06F18/214 , G06N3/0464 , G06N3/09
Abstract: 本说明书的实施例提供了一种用于识别敏感样本的方法、模型训练方法和装置。在该用于识别敏感样本的方法中,获取待识别的样本数据集,其中,所述样本数据集中的各个样本数据包括特征数据;先利用样本分组模型根据各个样本数据的特征数据得到用于指示各个样本数据所属分组的分组信息;再利用因果预测模型根据各个样本数据的特征数据和对应的分组信息得到各个样本数据对应的在处理变量的各个取值下的结果预测值;根据所得到的各个分组中的样本数据对应的在处理变量的各个取值下的结果预测值,确定各个分组对应的敏感系数;将敏感系数最高的分组中的样本数据确定为敏感样本。
-
公开(公告)号:CN117077792B
公开(公告)日:2024-01-09
申请号:CN202311325368.0
申请日:2023-10-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于知识图谱生成提示数据的方法及装置。在该方法中,可以通过多种方式获取相互匹配的推理规则和实例子图,实例子图来自知识图谱,知识图谱中包含隐私数据。推理规则包括推理条件和推理结果。基于该推理规则构建问答模板,问答模板包括问题模板和答案模板,答案模板包括原因模板和结果模板。问题模板和结果模板通过对推理规则中的推理结果进行文本转换得到,原因模板通过对推理规则中的推理条件进行文本转换得到。基于问答模板和实例子图的结合可以生成目标文本,该目标文本则包括问题文本和答案文本,答案文本包括原因文本和结果文本。该目标文本作为提示数据可以用于调整语言模型。
-
公开(公告)号:CN117112803A
公开(公告)日:2023-11-24
申请号:CN202311077641.2
申请日:2023-08-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于知识图谱的实体关系预测方法和系统。其中,该方法包括:基于知识图谱,获取包括第一实体节点和第二实体节点在内的多跳子图;基于所述多跳子图,获取相关性表征;所述相关性表征包括第一实体节点和第二实体节点与其对应的多跳邻居节点的距离信息,不包括所述多跳邻居节点的属性特征;基于所述多跳子图,获取所述第一实体节点和第二实体节点的结构增强表征;基于所述相关性表征和所述结构增强表征,预测第一实体节点与第二实体节点之间存在目标边的可能性。
-
公开(公告)号:CN116932907A
公开(公告)日:2023-10-24
申请号:CN202310914336.8
申请日:2023-07-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种推荐模型的验证方法及装置。该方法包括:获取利用训练集和预先建立的知识图谱所训练的推荐模型,该训练集中的各个样本包括用户和业务对象,以及用户针对业务对象的行为标签,该知识图谱中的多个实体节点包括对应业务对象的节点;以及,获取具有阈值参数的预设指标,以及有待基于测试集进行的测试针对阈值参数设定的测试阈值,该预设指标的指标值依赖于推荐排名在阈值参数指示的数目之内的召回对象的命中情况。基于验证集和测试集的数据量,以及测试阈值,确定多个验证阈值。基于验证集确定推荐模型在多个验证阈值下针对预设指标的多个验证指标值;对该多个验证指标值进行加权求和处理,得到综合验证指标值。
-
公开(公告)号:CN116881400A
公开(公告)日:2023-10-13
申请号:CN202310876750.4
申请日:2023-07-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于知识图谱判定业务实体关联性的方法及装置,在基于知识图谱判定业务实体关联性过程中,考虑信息随着距离衰减的自然规律,将信息衰减规律引入知识图谱中的信息传播过程,即信息传递与信息源的强度正相关,与传播距离负相关。并且,以知识图谱中路径阶数描述传播距离,从而确定路径系数来描述信息衰减。进一步地,将路径系数和描述信息在路径上的各个节点的耗散的传递系数进行融合,确定相应路径的关联系数。然后,基于对各个路径的关联系数的融合,确定两个节点的相关系数,从而判定相应业务实体的关联性。如此,可以提高实体关联性判定的准确性。
-
-
-
-
-
-
-
-
-