一种带噪声标签的长尾分布图像分类方法

    公开(公告)号:CN113516207A

    公开(公告)日:2021-10-19

    申请号:CN202111059448.7

    申请日:2021-09-10

    Abstract: 本发明公开了一种带噪声标签的长尾分布图像分类方法,通过样本依赖的松弛间隔损失进行学习,并辅以抗噪声的数据增强策略,用于解决同时具有长尾特征与噪声标签的图像分类问题。根据数据噪声特征,在计算样本函数间隔时引入样本依赖的松弛变量以放宽间隔约束,再根据样本间隔分类计算样本依赖的光滑松弛损失;根据数据长尾特征,实施分阶段调整的数据增强策略,对样本分别进行强增强和弱增强,并在正式训练阶段提供基于松弛损失的样本筛选机制用于筛除噪声数据。本发明实现方法简便,手段灵活,在长尾数据、噪声数据以及同时具有二者特征的训练数据上都取得显著的分类效果的提升。

    一种基于嵌入特征正则化的知识蒸馏方法和系统

    公开(公告)号:CN117009830B

    公开(公告)日:2024-02-13

    申请号:CN202311278779.9

    申请日:2023-10-07

    Abstract: 一种基于嵌入特征正则化的知识蒸馏方法和系统,其方法包括:收集与识别任务相关的标注图像数据,计算教师模型在整个训练集上的各个类别的中心特征;将学生模型的嵌入特征投影到类别中心方向,将教师模型的嵌入特征旋转到类别中心方向,通过正则化学生模型的投影特征和教师模型的旋转特征,构建特征正则化损失:增大学生模型的特征范数,约束学生模型的特征的方向与类别中心方向一致;将特征正则化损失插入到现有的知识蒸馏框架中,训练学生模型;将训练好的学生模型部署到终端设备,根据终端设备接收的新数据,预测概率向量,进而完成相

    一种基于嵌入特征正则化的知识蒸馏方法和系统

    公开(公告)号:CN117009830A

    公开(公告)日:2023-11-07

    申请号:CN202311278779.9

    申请日:2023-10-07

    Abstract: 一种基于嵌入特征正则化的知识蒸馏方法和系统,其方法包括:收集与识别任务相关的标注图像数据,计算教师模型在整个训练集上的各个类别的中心特征;将学生模型的嵌入特征投影到类别中心方向,将教师模型的嵌入特征旋转到类别中心方向,通过正则化学生模型的投影特征和教师模型的旋转特征,构建特征正则化损失:增大学生模型的特征范数,约束学生模型的特征的方向与类别中心方向一致;将特征正则化损失插入到现有的知识蒸馏框架中,训练学生模型;将训练好的学生模型部署到终端设备,根据终端设备接收的新数据,预测概率向量,进而完成相关识别任务。本发明通过增大学生特征的范数,和约束方向一致于类别中心,知识蒸馏性能更优。

    一种计算机视觉深度学习模型的优化部署方法与装置

    公开(公告)号:CN116048542B

    公开(公告)日:2023-10-31

    申请号:CN202310098795.3

    申请日:2023-02-11

    Abstract: 本发明公开了一种计算机视觉深度学习模型的优化部署方法与装置,所述方法和装置核心为模型优化服务和模型部署服务两个模块。模型优化服务模块可将训练好的模型通过IR中间表示)转换为适配目标推理引擎及硬件设备的框架格式,提升推理性能。模型部署服务模块支持本地部署和在线部署两种方式,其中本地部署是指将待部署模型文件封装为SDK,下载至本地设备进行端侧推理;在线部署是指将待部署模型文件在云端服务器部署,开放接口供用户调用推理服务,本发明通过构建完整的模型优化和部署服务流程与装置,降低深度学习模型部署的复杂度,对多种模型网络架构、推理引擎的扩充兼容,使本公开实施例更具灵活性和可拓展性。

    一种层级聚类约束的多标签细粒度术后并发症预测装置

    公开(公告)号:CN116434968B

    公开(公告)日:2023-08-25

    申请号:CN202310699832.6

    申请日:2023-06-14

    Abstract: 本发明公开了一种层级聚类约束的多标签细粒度术后并发症预测装置,属于医疗数据挖掘领域,包括:根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;构建预测模型,包括底层网络、次层网络、中间网络、预测网络;构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;基于损失函数对预测模型进行参数优化;利用优化的预测模型进行术后并发症预测。该装置通过引入层级聚类图构建网络架构,进而预测精准度。

    一种多码率的行人识别视觉特征编码压缩方法和装置

    公开(公告)号:CN115471875B

    公开(公告)日:2023-03-03

    申请号:CN202211341654.1

    申请日:2022-10-31

    Abstract: 本发明一种多码率的行人识别视觉特征编码压缩方法和装置,所述方法包括下列步骤:1)行人视觉特征提取;2)行人视觉特征压缩编码;3)视觉特征编码解压重建;4)行人重识别。通过在智能安保系统的终端设备部署步骤1)、2),在智能安保服务的中心设备部署步骤3)、4),同时利用网络作为传输媒介从终端设备传输特定码率的内容到服务的中心设备,可以实现智能安保系统中的行人重识别任务,提高安保工作的效率,提高识别精度,减少人工需求。

    基于梯度和区域亲和力优化的弱监督语义分割方法及装置

    公开(公告)号:CN115512169A

    公开(公告)日:2022-12-23

    申请号:CN202211395308.1

    申请日:2022-11-09

    Abstract: 本发明公开了基于梯度和区域亲和力优化的弱监督语义分割方法及装置,本方法提出的基于视觉Transformer的弱监督语义分割框架,可以保留精确的图像结构信息,反映像素间长距离语义关联。本发明从自注意力模块中提取梯度加权的类相关物体定位图和区域亲和度关联图,用于优化通过Transformer分类网络生成的类激活图,可以有效扩大激活区域,并使用显著性约束提高激活区域的边界质量,缓解边界被错误划分现象,为分割模型提供高质量的物体定位图;在类激活图中广泛使用的二值交叉熵(BCE)损失使CAM中每个像素可以响应于同一感受野中出现的多个类别,是造成像素标注错误的重要原因。

    基于混合批归一化的长尾学习图像分类、训练方法及装置

    公开(公告)号:CN114863193B

    公开(公告)日:2022-12-02

    申请号:CN202210794485.0

    申请日:2022-07-07

    Abstract: 本发明公开了基于混合批归一化的长尾学习图像分类、训练方法及装置,训练方法通过构建混合标准化分支和分裂标准化分支,得到对应标准化后的特征向量,再通过双分支学习框架,将经强增强和弱增强的样本图像输入标准化分支后,进行图像分类,通过分类结果计算两个分支分类预测的相似性最大化损失以及用平衡交叉熵损失来计算分类损失,优化双分支框架对应的网络参数。混合标准化分支能够更全面地对特征空间进行建模,减轻头部类的主导地位,分裂标准化分支能够多样化估计高斯分布,使高斯分布更全面地拟合尾部类别的训练样本,图像分类方法及装置则是利用训练好的混合标准化分支进行图像分类。

    一种轻量级的显著性物体检测系统及方法

    公开(公告)号:CN114663774B

    公开(公告)日:2022-12-02

    申请号:CN202210565928.9

    申请日:2022-05-24

    Abstract: 本发明公开了一种轻量级的显著性物体检测系统及方法,用以解决对实时性要求较高或者计算资源有限的场景下的显著性物体检测问题。基于轻量级设计原则,该方法采用自主设计的主干网络和简单的特征融合方式以及上下文信息提取结构来构造低计算能力设备场景下的轻量级显著性物体检测模型。为提升模型的精度和鲁棒性,该方法提出适用于显著性物体检测的马赛克数据增广方式和周期性多尺度训练方法,采用知识蒸馏方式对主干网络在分类任务场景下进行预训练,用以提高模型的泛化能力。为了进一步压缩模型,本发明还采用模型剪枝算法和模型量化算法对所设计模型进行压缩,可以在原有模型精度没有损失的条件下提升推理速度。

    基于数据组合和通道相关性的动作视频分类方法和装置

    公开(公告)号:CN115082840B

    公开(公告)日:2022-11-15

    申请号:CN202210980779.2

    申请日:2022-08-16

    Abstract: 本发明公开了基于数据组合和通道相关性的动作视频分类方法和装置,包括以下步骤:步骤S1:从输入视频中提取连续采样视频帧;步骤S2:利用数据组合操作构建融合视频帧;步骤S3:利用所提出的网络模型提取视频深度特征;步骤S4:利用视频深度特征计算通道相关性矩阵;步骤S5:将通道相关性矩阵作用于视频深度特征并进行特征融合,得到融合后特征;步骤S6:所述融合后特征经过全连接层进行分类,再通过均匀融合得到输入视频的分类结果。本发明通过数据组合操作将相邻视频帧信息进行融合,从而巧妙利用视频中的2D空域卷积实现了短时运动建模。此外本发明通过计算各特征通道之间的相关性,实现了各通道之间的信息交互,达到了更好地建模效果。

Patent Agency Ranking