根因定位的方法和装置
    61.
    发明公开

    公开(公告)号:CN114090315A

    公开(公告)日:2022-02-25

    申请号:CN202111311416.1

    申请日:2021-11-08

    Abstract: 本说明书实施例提供了一种根因定位的方法和装置。根据该实施例的方法,获取异常系统的关键指标集和候选指标集,关键指标集包含一个以上的关键指标,候选指标集包含多于一个的候选指标;然后依据关键指标与候选指标之间的对应关系,将各关键指标分别作为待预测关键指标执行:获取异常时段内的待预测关键指标时间序列以及对应的一个以上的候选指标时间序列;利用获取的时间序列训练线性回归模型,其中线性回归模型用以利用t时刻、t‑1时刻的候选指标值以及t‑1时刻的关键指标值,预测t时刻的关键指标值,t为异常时段内的各时刻;再对训练得到的各线性回归模型进行回归系数的筛选,利用符合预设条件的回归系数所对应的候选指标确定根因指标。

    基于文本属性图生成答案的方法及装置

    公开(公告)号:CN120045679A

    公开(公告)日:2025-05-27

    申请号:CN202510207267.6

    申请日:2025-02-24

    Abstract: 本说明书实施例涉及基于文本属性图生成答案的方法及装置,方法包括:首先,获取问题文本和文本属性图,文本属性图中包含多个节点和关系边。然后,根据各个节点的节点信息,将问题文本与各个节点进行第一匹配,得到若干计划节点;节点信息至少包括节点名称。接下来,将问题文本与文本属性图中的各个关系序列进行第二匹配,得到若干计划关系序列;任意关系序列包括首尾相连的若干个关系边。最后,将问题文本和计划信息输入到智能体中,令智能体根据问题文本和计划信息在文本属性图中进行遍历,得到若干个结果节点,并根据结果节点生成答案;智能体基于第一大语言模型实现;计划信息包括计划节点和计划关系序列。

    大模型推理中的缓存优化方法及装置

    公开(公告)号:CN119847437A

    公开(公告)日:2025-04-18

    申请号:CN202411931981.1

    申请日:2024-12-25

    Abstract: 本说明书实施例提供一种大模型推理中的缓存优化方法,包括:在预填充阶段,针对大模型中的多个注意力层,逐层进行缓存操作,其中,针对任意第i层的缓存操作包括:获取第i层的目标注意力矩阵。分别根据目标注意力矩阵行数据和列数据的分布,确定第一指标值和第二指标值。根据第一指标值和第二指标值,确定第i层对应的第i偏好分数。根据第i偏好分数,确定在总缓存区中为第i层分配的目标缓存区域,并在其中存储输入文本中目标字符的注意力数据。根据第i偏好分数,更新在第i层之前的各个层的在先缓存区域,以及更新其中存储的字符的注意力数据。

    一种基于长文本训练大语言模型的方法及装置

    公开(公告)号:CN119004107A

    公开(公告)日:2024-11-22

    申请号:CN202411123941.4

    申请日:2024-08-15

    Abstract: 本说明书实施例提供了一种基于长文本训练大语言模型的方法,所述大语言模型包括预训练的目标解码器,该方法包括:对目标长文本进行文本分割,得到多个文本块。将各个文本块输入文本编码器进行编码,得到各文本块对应的编码表征。将各个编码表征输入映射网络进行处理,得到映射至目标解码器的嵌入空间的映射表征。将多个文本块的映射表征,以及第一提示文本对应的文本表征,输入目标解码器,得到第一答案文本,其中第一提示文本用于指示大语言模型,根据映射表征,重述目标长文本。根据第一答案文本与目标长文本,确定第一损失。根据预测损失,更新文本编码器和所述映射网络,其中预测损失包含第一损失。

    大模型推理引擎的参数调优方法及装置

    公开(公告)号:CN118940843A

    公开(公告)日:2024-11-12

    申请号:CN202411068588.4

    申请日:2024-08-05

    Abstract: 本说明书实施例披露一种大模型推理引擎的参数调优方法及装置,其中大模型推理引擎用于运行目标大模型以处理目标应用发起的推理请求。该方法包括:首先,获取多个观测样本,其中各观测样本包括一组配置参数,以及根据该组参数配置所述大模型推理引擎后,对所述目标应用的历史推理请求进行重放而确定的引擎性能指标;然后,利用所述多个观测样本初始化贝叶斯优化BO算法中的观测数据,以及,将所述BO算法中的目标函数定义为配置参数和引擎性能指标之间的映射关系,从而执行所述BO算法,得到使引擎性能指标发生优化的若干组配置参数。如此,可以实现利用BO算法适应不同上层应用关注的不同优化目标。

    训练预测模型以及预测资源使用量的方法及装置

    公开(公告)号:CN115712526B

    公开(公告)日:2024-08-16

    申请号:CN202211480620.0

    申请日:2022-11-24

    Abstract: 本说明书实施例提供一种训练预测模型,以及使用该模型预测资源使用量的方法。预测模型的过程可以包括,获取服务器集群中目标服务器在历史时段中对处理资源的目标使用量,以及该目标服务器中的多个数据副本对应的多条流量数据,其中任意数据副本对应的流量数据包括,对应租户在所述历史时段中访问与该数据副本对应的数据而产生的流量信息。将各条流量数据输入预测模型,得到各个数据副本对所述处理资源的预测使用量;将各个预测使用量之和,作为预测总使用量。根据目标使用量和所述预测总使用量,确定预测损失,以预测损失最小化为目标,更新所述预测模型。

    一种业务场景分类的方法、装置、存储介质及电子设备

    公开(公告)号:CN115795342B

    公开(公告)日:2024-02-06

    申请号:CN202211430256.7

    申请日:2022-11-15

    Abstract: 在本说明书提供的业务场景分类的方法中,针对历史上通过待分析接口接收的每个历史调用流量,确定该历史调用流量调用的各子应用,进而确定该历史调用流量对应的调用拓扑图,以各历史调用流量对应的调用拓扑图为依据,对各历史调用流量进行聚类,聚类的出的每一个类别可看作每一个业务场景类别。从上述方法可以看出,本说明书不再将同一个接口接收到的调用流量归为同一个业务场景类别,而是确定每个通过待分析接口接收的历史调用流量所调用的各子应用,并据此来绘制各历史调用流量对应的调用拓扑图,进而对各历史调用流量进行聚类,聚类出的每一个类别就代表一个业务场景类别,从而达到将同一个接口接收到的调用流量划分为不(56)对比文件赵季红 等.面向多业务场景的端到端网络切片安全部署算法《.电子与信息学报》.2022,第44卷(第4期),第1421-1428页.

    模型微调方法及装置、电子设备及存储介质

    公开(公告)号:CN117493879A

    公开(公告)日:2024-02-02

    申请号:CN202311371399.X

    申请日:2023-10-20

    Abstract: 本说明书一个或多个实施例提供一种模型微调方法及装置、电子设备及存储介质,所述方法包括:将多个任务的训练数据输入至待微调模型,得到所述待微调模型输出的每个任务的训练数据的预测结果;根据每个任务的训练数据的预测结果,以及对应的训练数据的标签,确定每个任务的训练损失;根据每个任务的训练损失和每个的任务的损失权重确定总损失,并根据所述总损失对待微调模型的参数进行微调,其中,每个任务的损失权重至少与所述任务的训练数据的数量相关。

Patent Agency Ranking