一种图像分割方法、设备、程序产品及介质

    公开(公告)号:CN118674731A

    公开(公告)日:2024-09-20

    申请号:CN202411132770.1

    申请日:2024-08-19

    Abstract: 本申请公开了一种图像分割方法、设备、程序产品及介质,涉及计算机视觉技术领域。该方法包括:构建基于预设卷积神经网络的基础图像分割模型;利用多尺度卷积操作对用于进行图像分割的数据集进行特征提取,以得到不同尺度的特征;基于预设深度学习模型架构构建线性注意力机制并利用高斯误差线性单元激活函数作为所述线性注意力机制的构造函数,将所述特征通过所述线性注意力机制进行特征融合,以得到多尺度融合特征图;对所述多尺度融合特征图进行上采样与拼接操作,并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型,以便利用所述目标图像分割模型进行图像分割。通过本申请的技术方案,可以显著提升整体图像分割性能。

    一种数据传输方法、装置、设备及存储介质

    公开(公告)号:CN116708301A

    公开(公告)日:2023-09-05

    申请号:CN202310868402.2

    申请日:2023-07-14

    Abstract: 本申请公开了一种数据传输方法、装置、设备及存储介质,涉及计算机技术领域。应用于智能网卡的数据发送端,该方法包括:确定当前网络状态;获取原始数据精度的待传输数据,并根据当前网络状态确定与原始数据精度的待传输数据对应的数据传输策略;基于数据传输策略确定进行数据传输时对应的目标数据精度,并基于原始数据精度的待传输数据确定目标数据精度的待传输数据;将目标数据精度的待传输数据发送至数据接收端,以便数据接收端根据目标数据精度,确定与目标数据精度的待传输数据对应的数据处理逻辑。通过本申请的技术方案,可以根据网络状态决定数据传输精度,将网络状态检测与判断、数据精度检测与转换等操作在智能网卡中实现。

    一种深度学习模型的FPGA加速执行方法及相关装置

    公开(公告)号:CN111736986B

    公开(公告)日:2023-06-23

    申请号:CN202010471493.2

    申请日:2020-05-29

    Abstract: 本申请公开了一种深度学习模型的FPGA加速执行方法,包括:FPGA云服务器根据模型计算量和FPGA板卡计算量对待执行的深度学习模型进行拆分处理,得到深度学习模型中所有卷积核的拆分配置数据;根据拆分配置数据将深度学习模型中的卷积核部署至对应的FPGA板卡,得到多个待执行FPGA板卡;控制多个待执行FPGA板卡执行深度学习模型计算操作。通过将深度学习模型中的所有卷积核拆分至对应的FPGA板卡中进行计算操作,实现将模型拆分计算,而不是在少数几个FPGA板卡中加载过多的计算功能,避免产生硬件浪费,提高硬件性能的利用率。本申请还公开了一种深度学习模型的FPGA加速执行装置、服务器以及计算机可读存储介质,具有以上有益效果。

    一种基于FPGA的神经网络运算方法、装置及设备

    公开(公告)号:CN111860810A

    公开(公告)日:2020-10-30

    申请号:CN202010614610.6

    申请日:2020-06-30

    Abstract: 本申请公开了一种基于FPGA的神经网络运算方法、装置、设备及存储介质。该方法的步骤包括:获取神经网络模型;统计多个FPGA对应的片上内存容量;根据各FPGA的片上内存容量,将神经网络模型拆分为具有相应数据量的子模型;其中,各子模型的数据量不大于所对应的FPGA的片上内存容量;将子模型分配至对应FPGA的片上内存;根据各子模型之间的执行顺序设定相应各FPGA之间的数据流向,并根据执行顺序依次控制各FPGA基于相应的子模型执行神经网络运算。确保了基于FPGA执行神经网络模型的推理运算的整体效率。此外,本申请还提供一种基于FPGA的神经网络运算装置、设备及存储介质,有益效果同上所述。

    一种应答信息生成方法、设备、介质及计算机程序产品

    公开(公告)号:CN119884332A

    公开(公告)日:2025-04-25

    申请号:CN202510387245.2

    申请日:2025-03-31

    Abstract: 本发明公开了一种应答信息生成方法、设备、介质及计算机程序产品,涉及人工智能技术领域,针对预训练语言模型的并行推理计算的一个批次中,根据所在设备执行预填充任务的算力利用率确定预填充任务的词元预算数量和解码任务的词元预算数量,使解码任务的词元预算数量占比与预填充任务的算力利用率成负相关,根据该根据词元预算数量将对应的待处理序列输入预训练语言模型进行并行推理计算,使得并行推理计算获得吞吐量和延迟的均衡,从而可以解决相关技术中并行推理调度中存在的设备压力与生成性能矛盾的问题,达到提升预训练语言模型的并行推理性能的技术效果,提升了人工智能问答任务的执行性能。

    一种图像生成方法、装置、设备及介质

    公开(公告)号:CN116701692B

    公开(公告)日:2023-11-03

    申请号:CN202310974784.7

    申请日:2023-08-04

    Abstract: 本发明公开了一种图像生成方法、装置、设备及介质,应用于图像生成技术领域,包括:将第一输入数据输入至目标扩散模型进行推理,并在推理过程中获取每次迭代的输出结果;第一输入数据包括第一噪声和第一文本信息;基于相邻两次迭代的输出结果计算散度,得到散度序列;对所述散度序列进行分组以得到散度组,并依次对每个散度组对应的推理阶段中的目标扩散模型进行参数量化;推理阶段为散度组中各散度对应的迭代次数所对应的推理阶段;基于第二输入数据以及参数量化后的目标扩散模型生成图像;所述第二输入数据包括第二噪声和第二文本信息。能够解决模型推理速度慢的问题,提升模型推理速度,进而提升图像的生成效率。

    一种深度学习模型的FPGA加速执行方法及相关装置

    公开(公告)号:CN111736986A

    公开(公告)日:2020-10-02

    申请号:CN202010471493.2

    申请日:2020-05-29

    Abstract: 本申请公开了一种深度学习模型的FPGA加速执行方法,包括:FPGA云服务器根据模型计算量和FPGA板卡计算量对待执行的深度学习模型进行拆分处理,得到深度学习模型中所有卷积核的拆分配置数据;根据拆分配置数据将深度学习模型中的卷积核部署至对应的FPGA板卡,得到多个待执行FPGA板卡;控制多个待执行FPGA板卡执行深度学习模型计算操作。通过将深度学习模型中的所有卷积核拆分至对应的FPGA板卡中进行计算操作,实现将模型拆分计算,而不是在少数几个FPGA板卡中加载过多的计算功能,避免产生硬件浪费,提高硬件性能的利用率。本申请还公开了一种深度学习模型的FPGA加速执行装置、服务器以及计算机可读存储介质,具有以上有益效果。

    一种图像数据的分类方法、装置以及介质

    公开(公告)号:CN115620074A

    公开(公告)日:2023-01-17

    申请号:CN202211411839.5

    申请日:2022-11-11

    Abstract: 本申请公开了一种图像数据的分类方法、装置以及介质,应用于模型蒸馏技术领域。本申请预先构建扩散模型,并使用原始数据集训练得到用于生成图像数据图像生成器,然后构建模型蒸馏框架以获得待蒸馏的图像分类模型;最后将图像生成器生成的图像数据作为参数训练图像分类模型,以得到蒸馏后的目标模型。本方案在模型蒸馏的训练过程中,使用这些生成的数据来代替原始数据集,保留高精度的前提下有效压缩了模型的大小,保证了模型蒸馏过程正常进行。将扩散模型应用在模型蒸馏的机制中,替换传统模型蒸馏中必需的原始数据集,大幅提升了生成图像的品质,在保持模型蒸馏准确度的前提下,进一步减少了参与模型蒸馏所需要的生成图像的规模。

    一种数据传输方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN118694765B

    公开(公告)日:2024-12-27

    申请号:CN202411187773.5

    申请日:2024-08-28

    Abstract: 本发明公开了一种数据传输方法、装置、设备及计算机可读存储介质,涉及计算机应用技术领域,包括:利用发送端智能网卡接收浮点型模型训练数据集,并进行量化操作,分别对得到的各量化后模型训练数据进行损失度计算;利用发送端智能网卡将损失度计算结果满足预设损失度允许范围的量化后模型训练数据发送给接收端智能网卡,并将损失度计算结果超出预设损失度允许范围的量化后模型训练数据对应的浮点型模型训练数据发送给接收端智能网卡;利用接收端智能网卡对量化后模型训练数据进行反量化,将各浮点型模型训练数据均上传至接收端。本发明解决了数据量化速度慢,数据传输耗时长等问题,较大地提高了数据量化速度,降低了传输耗时。

    一种图像分割方法、设备、程序产品及介质

    公开(公告)号:CN118674731B

    公开(公告)日:2024-12-03

    申请号:CN202411132770.1

    申请日:2024-08-19

    Abstract: 本申请公开了一种图像分割方法、设备、程序产品及介质,涉及计算机视觉技术领域。该方法包括:构建基于预设卷积神经网络的基础图像分割模型;利用多尺度卷积操作对用于进行图像分割的数据集进行特征提取,以得到不同尺度的特征;基于预设深度学习模型架构构建线性注意力机制并利用高斯误差线性单元激活函数作为所述线性注意力机制的构造函数,将所述特征通过所述线性注意力机制进行特征融合,以得到多尺度融合特征图;对所述多尺度融合特征图进行上采样与拼接操作,并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型,以便利用所述目标图像分割模型进行图像分割。通过本申请的技术方案,可以显著提升整体图像分割性能。

Patent Agency Ranking