无线网络模型的token表征方法及网络设备

    公开(公告)号:CN118828628A

    公开(公告)日:2024-10-22

    申请号:CN202311315793.1

    申请日:2023-10-11

    Abstract: 一种无线网络模型的token表征方法及网络设备,该方法包括:获取无线网络模型的网元数据,所述网元数据用于表征网元的状态;对所述网元数据进行分割,并对分割后的网元数据进行高维表征,获得所述无线网络模型的对应的网元快照;确定所述网元快照作为所述无线网络模型建模的token;其中,一个所述token用于指示一个网元在预设时间段内的状态。本申请基于网元数据获得无线网络模型的对应的网元快照,将网元快照作为无线网络模型的token,每个token均是原始信息的高维表征,其物理机理清晰,在不同文本中是通用且稳定的。得到token后,可以设计符合网络结构化数据的专有模型,提升无线网络模型的准确率。

    模型训练方法、文本识别方法、电子设备及计算机程序产品

    公开(公告)号:CN118823794A

    公开(公告)日:2024-10-22

    申请号:CN202410199845.1

    申请日:2024-02-22

    Abstract: 本发明公开了一种模型训练方法、文本识别方法、电子设备及计算机程序产品。模型训练方法包括:获取训练样本集;训练样本集中的训练样本包括以下一项或多项:第一状态参数、动作参数、奖励参数和第二状态参数;其中,第一状态参数表征样本图像中的文本检测框内的第一图像特征,动作参数表征第二模型针对第一状态参数输出的用于调整文本检测框的调整动作,第二状态参数表征基于调整动作调整后的文本检测框内的第二图像特征,奖励参数表征基于第二图像特征的文本识别结果输出的奖励值;基于训练样本集训练第一模型,在设定训练步长后,将第一模型的参数复制给第二模型,以更新第二模型的参数,第二模型用于根据文本检测框的状态参数输出调整动作。

    一种视觉问答方法、装置、计算机设备和存储介质

    公开(公告)号:CN118820413A

    公开(公告)日:2024-10-22

    申请号:CN202410225100.8

    申请日:2024-02-28

    Abstract: 本发明公开了一种视觉问答方法、装置、计算机设备和存储介质。所述方法包括:获得目标图像和/或目标视频,以及获得所述目标图像和/或目标视频对应的问题文本;通过预训练完成的多个视觉模型分别提取所述目标图像和/或目标视频中的视觉特征,对多个视觉特征进行拼接,获得多维特征向量;其中,所述多个视觉模型至少包括下列一项或多项:分类模型、目标检测模型、分割模型和图像描述模型;将所述问题文本进行编码,获得第一向量,利用预训练完成的对齐模型对所述多维特征向量和所述第一向量进行融合,获得第二向量;通过语言模型对所述第二向量进行处理,获得所述问题文本的回答文本。

    流量权重处理方法、装置、设备、存储介质及计算机程序产品

    公开(公告)号:CN118802526A

    公开(公告)日:2024-10-18

    申请号:CN202410205430.0

    申请日:2024-02-23

    Abstract: 本申请公开了一种流量权重处理方法、装置、设备、存储介质及计算机程序产品。其中,流量权重处理方法包括:采集针对目标服务的服务请求数据;所述目标服务包括至少两个灰度发布版本;基于所述服务请求数据,确定各所述灰度发布版本的当前流量权重对应的第一信息;所述第一信息表征每分钟内每秒查询率;基于所述第一信息,预测各所述灰度发布版本的当前流量权重对应的第二信息;所述第二信息表征服务请求失败率预测值;基于所述第二信息,确定各所述灰度发布版本的目标流量权重;基于所述目标流量权重,对所述当前流量权重进行调整,直至权重比例满足设定第一条件。

    视频生成方法、装置、设备及介质

    公开(公告)号:CN118799460A

    公开(公告)日:2024-10-18

    申请号:CN202410016562.9

    申请日:2024-01-05

    Abstract: 本发明提供一种视频生成方法、装置、设备及介质。本发明的方法,包括:针对第一视频中的帧图像,将帧图像、第一目标外貌图像和多帧第一稠密姿态图像输入至视频生成模型,获得第一噪声;其中,第一目标外貌图像为具有第一目标外貌的人物图像,多帧第一稠密姿态图像包括连续多帧与第一目标姿态相关的人物图像,视频生成模型包括训练后的第一噪声预测模型和训练后的第二噪声预测模型,训练后的第一噪声预测模型用于捕捉目标姿态,训练后的第二噪声预测模型用于恢复目标外貌;对第一噪声进行去噪处理,获得去噪后的帧图像;根据去噪后的帧图像,生成第二视频。本发明的方法能够大大提升了生成视频的视觉质量。

    基于参数微调的模型训练方法、装置、设备及存储介质

    公开(公告)号:CN118798381A

    公开(公告)日:2024-10-18

    申请号:CN202311587650.6

    申请日:2023-11-24

    Abstract: 本申请公开了一种基于参数微调的模型训练方法、装置、设备及存储介质。该方法包括:确定待微调的目标模型的微调参数;基于微调参数,确定目标模型的每一网络层的增量矩阵;对每一网络层的增量矩阵进行拼接,得到张量化的增量张量;基于设定的数据集分批次地训练目标模型,直至得到训练好的目标模型;其中,每批次的训练基于增量张量的张量奇异值分解进行微调参数的更新学习。由于将每一网络层的增量矩阵拼接后得到张量化的增量张量,并在此基础上进行张量分解和更新学习,可以显著减少计算量,使得目标模型的微调过程更加高效,能够在保持模型性能的同时,有效降低计算成本。

    任务型对话模型训练方法、装置及设备

    公开(公告)号:CN118796987A

    公开(公告)日:2024-10-18

    申请号:CN202311246875.5

    申请日:2023-09-26

    Abstract: 本发明提供一种任务型对话模型训练方法、装置及设备。所述方法包括:根据历史对话训练集,构建关键词C对应的回复簇;所述回复簇包括多个以关键词C为意图‑槽的去词汇化回复;去词汇化回复根据历史对话训练集中的训练数据进行去词汇化处理后获得;对回复簇中的多个去词汇化回复分别在回复簇中进行采样,获得多个去词汇化回复分别对应的采样伪回复;将采样伪回复作为伪标签,回复簇中的多个去词汇化回复作为训练数据,对任务对话转述模型进行训练,获得任务回复模型。采用该方法,能够解决现有技术任务型对话系统,造成回复信息缺失以及需要额外标注,导致成本消耗和系统迁移性能差的问题。

    一种模型训练方法、装置、计算机设备及存储介质

    公开(公告)号:CN118796547A

    公开(公告)日:2024-10-18

    申请号:CN202311780670.5

    申请日:2023-12-22

    Abstract: 本申请提供了一种模型训练方法、装置、计算机设备及存储介质,其中,所述训练方法包括:在模型训练过程中,每一次迭代完成模型状态更新之后,根据当前迭代次数选择备份计算节点,并将当前的模型状态信息存储至所述备份计算节点;当模型训练中断时,获取中断之前最近一次迭代的次数;再根据所述最近一次迭代的次数,从对应的备份计算节点中获取模型状态信息;根据所获取的模型状态信息进行接续训练。本申请通过设置备份计算节点对每一次模型训练中间状态进行保存,实现了在不影响训练任务的前提下对模型状态的连续备份,使得当训练过程异常中断时也能以最新迭代的参数恢复,从而节约了模型训练时间,提高了模型训练效率。

Patent Agency Ranking