相似性检测方法、装置、设备及介质

    公开(公告)号:CN119474895A

    公开(公告)日:2025-02-18

    申请号:CN202411150245.2

    申请日:2024-08-21

    Abstract: 本发明提供一种相似性检测方法、装置、设备及介质,包括:获取用于相似性检测的第一汇编代码和第二汇编代码;将所述第一汇编代码和所述第二汇编代码进行编码,得到所述第一汇编代码对应的第一向量和所述第二汇编代码对应的第二向量;将所述第一向量和所述第二向量输入相似性检测模型中,确定所述第一向量和所述第二向量的相似度。该方法用以解决相关技术中计算数据量较为庞大,存在数据丢失的状况,致使相似性检测需要消耗大量资源的同时相似性检测精度较低,进而导致检测的成本显著上升的问题,通过使用相似性检测模型来判断汇编代码之间的相似性,大幅降低了检测的时间和计算成本,且检测的精度显著提高。

    基于注意力蒸馏的大模型连续微调方法及装置

    公开(公告)号:CN119204161A

    公开(公告)日:2024-12-27

    申请号:CN202411182762.8

    申请日:2024-08-27

    Abstract: 本发明提供一种基于注意力蒸馏的大模型连续微调方法及装置,方法包括:基于当前任务的训练样本和回放缓存,微调Transformer模型;其中包括:将当前任务的训练样本输入Transformer模型中计算自回归损失,以更新模型参数;将当前任务的回放缓存输入Transformer模型中计算回放损失、预测蒸馏损失和注意力蒸馏损失,以再次更新模型参数,得到更新后的Transformer模型;根据当前任务的训练样本,更新回放缓存,得到下一任务的回放缓存;基于下一任务的训练样本和下一任务的回放缓存,再次微调更新后的Transformer模型。通过上述方法,解决大模型训练过程中,需要借助大量的回放样本来缓解连续微调后大模型在旧任务上严重的性能下降的问题,避免了在模型训练过程需要存储大量的回放样本。

    一种基于GPU拓扑结构的容器调度方法、装置、介质及设备

    公开(公告)号:CN118656177B

    公开(公告)日:2024-12-03

    申请号:CN202411153824.2

    申请日:2024-08-21

    Inventor: 胡卓 刘鹏 王金桥

    Abstract: 本发明公开了一种基于GPU拓扑结构的容器调度方法、装置、介质及设备,其中的方法首先接收容器发起的虚拟GPU使用请求,并从集群中获取所有节点的虚拟GPU分配信息和物理GPU之间的拓扑信息;然后根据所述节点的虚拟GPU分配信息与所述虚拟GPU资源申请量之间的关系,筛选出空闲虚拟GPU资源能够满足虚拟GPU使用请求的节点,接着根据可调度节点中的物理GPU之间的拓扑信息筛选出目标计算节点;最后将目标容器绑定至所述目标计算节点,并将所述目标计算节点中的各个空闲虚拟GPU资源挂载至所述目标容器中。本发明可以实现更精准的分配资源,充分挥多卡GPU之间的数据交换性能,从而提升GPU的整体性能和使用率。

    长文档视觉问答方法、装置及电子设备

    公开(公告)号:CN119046442A

    公开(公告)日:2024-11-29

    申请号:CN202411526272.5

    申请日:2024-10-30

    Abstract: 本发明涉及计算机视觉技术领域,尤其涉及一种长文档视觉问答方法、装置及电子设备,方法包括:获取长文档页面的多模态特征;为多模态特征配置预设数量的页面令牌,页面令牌用于存储长文档中各个页面的页面信息;根据每一页面令牌与文档问题的相关程度,为每一页面令牌分配权重;并根据分配权重后的页面令牌,获取长文档的文档信息;通过训练完成的多模态大语言模型,获取文档信息在文档问题下的文档答案。本发明通过采用上述方法,解决相关技术中处理多页的长文档场景时,视觉问答任务的处理效果不佳的问题。

    芯片布局模型训练及运用方法、装置、电子设备及存储介质

    公开(公告)号:CN118378094B

    公开(公告)日:2024-09-17

    申请号:CN202410824680.2

    申请日:2024-06-25

    Abstract: 本发明提供一种芯片布局模型训练及运用方法、装置、电子设备及存储介质,属于人工智能技术领域,训练方法包括:按顺序控制智能体序列的每个智能体执行基于所有智能体在当前时刻的状态信息确定的预测动作并获取执行信息,遍历智能体序列后,根据所有执行信息计算策略网络和价值网络的损失函数值,以对芯片布局模型中策略网络和价值网络的结构参数进行更新。本发明在芯片布局模型仅设置一个策略网络和价值网络的情况下,按顺序控制智能体执行预测动作,在所有智能体均执行一次预测动作之后,依据每次执行预测动作获取的所有执行信息更新模型结构参数,使得训练完成的芯片布局模型能够适用于器件数量各不相同的芯片布局,提高了模型泛化性能。

    一种掩码视频图像模型的快速训练方法

    公开(公告)号:CN118379375A

    公开(公告)日:2024-07-23

    申请号:CN202410378507.4

    申请日:2024-03-29

    Abstract: 本发明提供一种掩码视频图像模型的快速训练方法,方法包括:获取样本图像对,样本图像对包含历史视频帧图像以及未来视频帧图像;基于未来视频帧图像中的各子区域,分别对未来视频帧图像进行掩码;基于初始掩码图像模型、将历史视频帧图像的历史图像特征作为键值对,将各掩码图像的掩码图像特征作为查询,预测得到各掩码图像对应的补全图像;基于各补全图像以及自洽机制,对初始掩码图像模型进行参数迭代得到掩码图像模型。本发明提供的方法,通过视频中的图像对参与模型训练,提升样本数据的利用率,通过自洽机制保证各未来帧的补全图像趋于一致,可以迅速收敛,同时使得模型充分学习样本数据各区域之间时间维度上的联系,以提升模型的训练效率。

    芯片布局模型训练及运用方法、装置、电子设备及存储介质

    公开(公告)号:CN118378094A

    公开(公告)日:2024-07-23

    申请号:CN202410824680.2

    申请日:2024-06-25

    Abstract: 本发明提供一种芯片布局模型训练及运用方法、装置、电子设备及存储介质,属于人工智能技术领域,训练方法包括:按顺序控制智能体序列的每个智能体执行基于所有智能体在当前时刻的状态信息确定的预测动作并获取执行信息,遍历智能体序列后,根据所有执行信息计算策略网络和价值网络的损失函数值,以对芯片布局模型中策略网络和价值网络的结构参数进行更新。本发明在芯片布局模型仅设置一个策略网络和价值网络的情况下,按顺序控制智能体执行预测动作,在所有智能体均执行一次预测动作之后,依据每次执行预测动作获取的所有执行信息更新模型结构参数,使得训练完成的芯片布局模型能够适用于器件数量各不相同的芯片布局,提高了模型泛化性能。

Patent Agency Ranking