-
公开(公告)号:CN116865765A
公开(公告)日:2023-10-10
申请号:CN202310748211.2
申请日:2023-06-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H03M7/30 , G06F40/126
Abstract: 本说明书实施例提供一种用于无损压缩编码的字典构建方法及装置,在构建方法中,预先从样本字符串的集合中提取长度为s的多个短串,并统计各个短串在集合中的出现频次,以及统计各个短串之间转移频次。之后,对于从样本字符串的集合中截取的各个长串,先确定该长串所包含的若干目标短串,并基于各个目标短串的出现频次、及其之间的转移频次,确定该长串的增益。之后,根据各个长串的增益,选取字典样本。
-
公开(公告)号:CN116484968A
公开(公告)日:2023-07-25
申请号:CN202310260194.8
申请日:2023-03-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06N3/0455 , G06F16/35
Abstract: 本说明书实施例提供一种训练生成模型、为文本分类器生成训练样本的方法及装置,在训练生成模型的方法中,针对第一文本样本分别进行第一处理和第二处理。其中,第一处理包括,通过第一编码器,确定第一文本样本的语义向量。通过文本分类器,基于语义向量,预测第一文本样本的第一类别,构建对应于第一类别的第一提示文本。第二处理包括,通过第二编码器,确定第一文本样本在目标向量空间中对应的第一离散向量。通过解码器,基于第一提示文本和第一离散向量,确定第一文本样本的重构文本。基于重构损失,训练生成模型,该重构损失基于第一文本样本和重构文本确定。
-
公开(公告)号:CN115688030A
公开(公告)日:2023-02-03
申请号:CN202211297065.8
申请日:2022-10-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2431 , G06F18/214 , G06Q10/04 , G06N5/00 , G06N20/00
Abstract: 本说明书提供一种时序数据的分类方法和时序数据的预测方法,其中时序数据的分类方法包括:获取时序数据,并提取出所述时序数据对应的时序特征,所述时序特征包括极值波动稳定性特征,所述极值波动稳定性特征用于表征所述时序数据包含的各极值点的波动稳定性;将所述时序特征输入时序分类模型,得到所述时序数据对应的时序类别,不同的时序类别用于区分所含极值点具有不同波动稳定性的时序数据。
-
公开(公告)号:CN115098247A
公开(公告)日:2022-09-23
申请号:CN202210629029.0
申请日:2022-06-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种资源分配方法和装置。根据该实施例的方法,首先获取各应用服务的流量时间序列,所述流量时间序列包括连续多个时间点的流量数据;然后对各应用服务的流量时间序列进行聚类,得到一个以上的分组;再分别针对各分组确定容量伸缩策略,所述容量伸缩策略用于分组对应的应用服务的容量资源分配。
-
公开(公告)号:CN114090315A
公开(公告)日:2022-02-25
申请号:CN202111311416.1
申请日:2021-11-08
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种根因定位的方法和装置。根据该实施例的方法,获取异常系统的关键指标集和候选指标集,关键指标集包含一个以上的关键指标,候选指标集包含多于一个的候选指标;然后依据关键指标与候选指标之间的对应关系,将各关键指标分别作为待预测关键指标执行:获取异常时段内的待预测关键指标时间序列以及对应的一个以上的候选指标时间序列;利用获取的时间序列训练线性回归模型,其中线性回归模型用以利用t时刻、t‑1时刻的候选指标值以及t‑1时刻的关键指标值,预测t时刻的关键指标值,t为异常时段内的各时刻;再对训练得到的各线性回归模型进行回归系数的筛选,利用符合预设条件的回归系数所对应的候选指标确定根因指标。
-
公开(公告)号:CN113988264B
公开(公告)日:2025-01-24
申请号:CN202111271139.6
申请日:2021-10-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/042 , G06N3/0464 , G06N3/044 , G06N3/045 , H04L43/0876 , G08G1/065
Abstract: 本说明书实施例中提供了一种获得用于执行流量预测业务的图神经网络的方法及装置。该方法包括:获取图结构中N个节点的流量数据序列,流量数据序列包括与T个时段相对应的T个流量数据集合,单个流量数据集合包含N个节点各自在对应时段的节点流量;确定N个节点各自的节点流量满足的约束条件;根据约束条件确定损失函数;根据流量数据序列和损失函数训练得到用于执行流量预测业务第一时空图神经网络。
-
公开(公告)号:CN119004107A
公开(公告)日:2024-11-22
申请号:CN202411123941.4
申请日:2024-08-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F16/332 , G06F16/33 , G06F40/126 , G06F40/30 , G06N3/0455 , G06N3/088
Abstract: 本说明书实施例提供了一种基于长文本训练大语言模型的方法,所述大语言模型包括预训练的目标解码器,该方法包括:对目标长文本进行文本分割,得到多个文本块。将各个文本块输入文本编码器进行编码,得到各文本块对应的编码表征。将各个编码表征输入映射网络进行处理,得到映射至目标解码器的嵌入空间的映射表征。将多个文本块的映射表征,以及第一提示文本对应的文本表征,输入目标解码器,得到第一答案文本,其中第一提示文本用于指示大语言模型,根据映射表征,重述目标长文本。根据第一答案文本与目标长文本,确定第一损失。根据预测损失,更新文本编码器和所述映射网络,其中预测损失包含第一损失。
-
公开(公告)号:CN117493879A
公开(公告)日:2024-02-02
申请号:CN202311371399.X
申请日:2023-10-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/21
Abstract: 本说明书一个或多个实施例提供一种模型微调方法及装置、电子设备及存储介质,所述方法包括:将多个任务的训练数据输入至待微调模型,得到所述待微调模型输出的每个任务的训练数据的预测结果;根据每个任务的训练数据的预测结果,以及对应的训练数据的标签,确定每个任务的训练损失;根据每个任务的训练损失和每个的任务的损失权重确定总损失,并根据所述总损失对待微调模型的参数进行微调,其中,每个任务的损失权重至少与所述任务的训练数据的数量相关。
-
公开(公告)号:CN117056166A
公开(公告)日:2023-11-14
申请号:CN202311031839.7
申请日:2023-08-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F11/30 , G06F18/2433
Abstract: 本说明书一个或多个实施例提供了一种数据异常检测方法、装置、存储介质及电子设备,涉及数据处理技术领域。该方法包括:确定目标微服务系统中的指标时序数据、日志时序数据和调用链时序数据,目标微服务系统中包括多个微服务;基于指标时序数据和日志时序数据,确定多个微服务对应的多个服务实例;基于调用链时序数据,确定多个服务实例之间的服务调用关系;基于多个服务实例以及多个服务实例之间的服务调用关系,生成具有时序关系的多个有向图;基于多个有向图,确定目标微服务系统对应的数据异常检测结果。
-
公开(公告)号:CN116894634A
公开(公告)日:2023-10-17
申请号:CN202310614890.4
申请日:2023-05-25
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种业务系统的异常处理方法、电子装置、设备及存储介质。方法包括:对业务系统的多个监控项进行异常检测,得到属于异常的目标异常检测样本集,其中,异常检测样本包含有监控项的异常检测数据。基于因果推理算法,构建得到目标异常检测样本对应的有向关系图,其中,有向关系图的节点表示监控项,有向关系图的有向边表示监控项之间的因果关系指向。基于预先设置的有向关系图中每个节点到指向的其他节点的转移概率,构建有向关系图对应的节点分布函数,并对函数进行多轮迭代,以将每个节点对应的分布概率确定为该节点的异常影响度。选取出异常影响度达到预设标准的目标监控项,并对目标监控项执行预设异常处理决策。
-
-
-
-
-
-
-
-
-