-
公开(公告)号:CN113157941B
公开(公告)日:2023-04-18
申请号:CN202110377799.6
申请日:2021-04-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/36 , G06F40/126 , G06F40/30 , G06N3/0442 , G06N3/08
Abstract: 本说明书实施例公开了一种业务特征数据处理、文本生成方法、装置及电子设备,具体方案包括:接收目标用户的业务特征数据,利用所述业务特征数据运行利用专家规则构建的推导路径以得到所述业务特征数据命中的目标推导路径,对所述业务特征数据和目标推导路径进行编码以得到向量序列,利用所述向量序列运行文本生成模型以生成对所述目标用户进行文本描述的目标文本。
-
公开(公告)号:CN115827935A
公开(公告)日:2023-03-21
申请号:CN202310152553.8
申请日:2023-02-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/904 , G06F16/901 , G06F16/25 , G06F16/26 , G06F40/12 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06Q20/40 , G06Q50/26
Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取目标结构化数据,基于目标结构化数据,将目标结构化数据转换为图结构数据,将图结构数据划分为多个不同的子图数据,并基于图结构数据、多个不同的子图数据和对目标结构化数据进行预设的逻辑操作的数据,确定多个不同的子图数据中与预设的逻辑操作的数据相匹配的目标子图数据,预设的逻辑操作的复杂程度高于预设阈值;将目标结构化数据以序列化的方式输入到编码器中,得到目标结构化数据对应的编码序列,并基于编码序列、目标结构化数据对应的嵌入特征数据和目标子图数据,通过解码器生成目标结构化数据对应的群组描述文本,增加了群组成员逻辑操作,提升了文本生成的质量。
-
公开(公告)号:CN111507726B
公开(公告)日:2022-06-24
申请号:CN202010265783.1
申请日:2020-04-07
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种报文生成方法、装置及设备。该方案包括:利用报文生成模型中的编码器对用户特征向量序列进行编码得到编码向量序列;利用该报文生成模型中的第一权重向量计算层,根据预设转移概率矩阵,确定所述编码向量序列中的各个编码向量的第一权重向量,以便于该报文生成模型中的混合编码向量生成层根据所述编码向量序列及所述各个编码向量的第一权重向量去生成混合编码向量;该报文生成模型中的全连接层可以根据所述混合编码向量及解码器的上一刻输出向量,生成所述解码器的输入向量,以便于所述解码器对所述输入向量进行解码处理后得到报文。
-
公开(公告)号:CN111461225B
公开(公告)日:2022-04-01
申请号:CN202010252223.2
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/762 , G06V10/74 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种聚类系统及其方法,该聚类系统包括:样本特征层,用于获得样本的特征向量;编码层,使用包含注意力机制的神经网络模型实现,用于对所述样本的特征向量进行编码;相似度计算层,用于根据所述编码层输出的所述样本的特征向量的编码计算各样本两两之间的相似度;聚类划分层,用于根据所述各样本两两之间的相似度进行聚类划分,其中将相似度大于预定阈值的两个样本归于一类。
-
公开(公告)号:CN112836520A
公开(公告)日:2021-05-25
申请号:CN202110189542.8
申请日:2021-02-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于用户特征生成用户描述文本的方法和装置。方法包括:将目标用户的各项特征的特征名和其对应的特征值输入第一编码器,得到各初始用户特征向量;将各初始用户特征向量输入检索模型,进行K次迭代,以得到K个语句;其中,每次迭代包括,确定各项特征分别对应的本次迭代的各注意力系数,并根据各注意力系数对各初始用户特征向量进行加权求和,得到综合表征向量,再根据综合表征向量从人工知识库中检索出一个语句;将K个语句输入第二编码器,对K个语句基于注意力机制进行编码,得到语义表征向量;将各初始用户特征向量和语义表征向量输入生成模型,生成目标用户的用户描述文本。能够兼顾效率和文本质量。
-
公开(公告)号:CN110796240A
公开(公告)日:2020-02-14
申请号:CN201911050651.0
申请日:2019-10-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种训练方法、特征提取方法、装置及电子设备。训练方法包括:将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,其中,第一短期特征集中的各短期特征对应有相同的第一时间粒度。将第二短期特征集按照时间顺序组合成长期特征集,其中,长期特征集中的各长期特征对应有相同的第二时间粒度,第二时间粒度大于第一时间粒度。将长期特征集输入至卷积神经网络,得到目标对象对应所述目标分类下的目标特征集。将目标特征集输入至用于识别目标分类的分类模型,以基于所述分类模型针对样本对象的识别结果,对循环神经网络和卷积神经网络进行训练。
-
公开(公告)号:CN114118958B
公开(公告)日:2025-01-10
申请号:CN202111402681.0
申请日:2021-11-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种自动化审理方法和装置。该方法包括:得到主体数据特征;将所述主体数据特征输入预先训练的审理模型中,得到该审理模型输出的审理结果;其中,所述审理模型是利用第一人工专家经验训练得到的;将所述审理结果输入预先训练的报文生成模型中,得到该报文生成模型输出的审理结果报文;其中,所述报文生成模型是利用第二人工专家经验训练得到的;上报所述审理结果报文。本说明书实施例能够自动化实现对主体进行审理的审理业务。
-
公开(公告)号:CN118277248A
公开(公告)日:2024-07-02
申请号:CN202410160421.4
申请日:2024-02-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种数据的风险检测方法、装置及设备,该方法包括:获取针对预设风险构建的第一提示信息和与所述第一提示信息对应的待检测的业务数据,所述第一提示信息中至少包括所述预设风险的检测任务信息和所述预设风险的检测规则的信息,将所述第一提示信息输入到代码生成大模型中,得到用于检测所述业务数据是否存在所述预设风险的风险检测代码,基于所述风险检测代码和所述业务数据,构建针对所述业务数据的一项或多项不同的风险检测逻辑,并基于每项所述风险检测逻辑和所述业务数据,确定每项所述风险检测逻辑对应的检测结果,基于每项所述风险检测逻辑对应的检测结果,确定所述业务数据是否存在所述预设风险的检测结果。
-
公开(公告)号:CN116188023A
公开(公告)日:2023-05-30
申请号:CN202310202513.X
申请日:2023-02-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06F18/25 , G06N3/08 , G06N3/0464
Abstract: 在本说明书提供的风险识别模型训练的方法中,获取多模态数据的训练样本,确定所述训练样本的标注,通过风险识别模型的编码子网,将所述训练样本中各模态的数据分别转化为矩阵,得到各第一特征矩阵,根据各第一特征矩阵确定多通道的第二特征矩阵,将所述第二特征矩阵输入到该模型的三维卷积子网中进行特征融合,根据融合后得到特征融合矩阵,确定预测结果,并根据所述预测结果和所述训练样本的标注对该模型进行训练。上述方法可以看出,将不同模态的数据转化为矩阵后再进行融合,方便了多种模态数据的特征融合,融合后得到的特征融合矩阵并不单纯依赖其中任何一种模态的数据,而是一次性充分融合了各模态的数据,提高了数据融合的效果和效率。
-
公开(公告)号:CN115827935B
公开(公告)日:2023-05-23
申请号:CN202310152553.8
申请日:2023-02-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/904 , G06F16/901 , G06F16/25 , G06F16/26 , G06F40/12 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06Q20/40 , G06Q50/26
Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取目标结构化数据,基于目标结构化数据,将目标结构化数据转换为图结构数据,将图结构数据划分为多个不同的子图数据,并基于图结构数据、多个不同的子图数据和对目标结构化数据进行预设的逻辑操作的数据,确定多个不同的子图数据中与预设的逻辑操作的数据相匹配的目标子图数据,预设的逻辑操作的复杂程度高于预设阈值;将目标结构化数据以序列化的方式输入到编码器中,得到目标结构化数据对应的编码序列,并基于编码序列、目标结构化数据对应的嵌入特征数据和目标子图数据,通过解码器生成目标结构化数据对应的群组描述文本,增加了群组成员逻辑操作,提升了文本生成的质量。
-
-
-
-
-
-
-
-
-