一种基于参数共享的Vision Transformer简化方法

    公开(公告)号:CN119625500A

    公开(公告)日:2025-03-14

    申请号:CN202411844156.8

    申请日:2024-12-15

    Abstract: 本发明公开了一种基于参数共享的Vision Transformer简化方法,步骤一:精简视觉骨干模型;步骤二:预训练图像分类模型;步骤三:训练目标检测和语义分割模型;本发明设计了一种新的参数共享MLP结构来减少ViT模型的参数,通过对线性层的镜像结构进行参数共享来减少MLP块的一半参数,将其与提出的轻量级注意力块相结合,构建一个高效的PSM‑Former模型。

    一种基于去噪高效图压缩的图增量学习方法

    公开(公告)号:CN119600364A

    公开(公告)日:2025-03-11

    申请号:CN202411743520.1

    申请日:2024-11-30

    Abstract: 本发明公开了一种基于去噪高效图压缩的图增量学习方法,本方法为保留每个任务的原始图的整体语义,通过分布匹配方法压缩成一个小图作为记忆回放的内存。并在压缩图过程中添加了相关熵损失,有效避免原始图数据中的噪声影响。本方法还提出平衡训练目标,有效克服了新任务图和重放图之间的数据不平衡问题。与现有的图增量学习方法相比,基于去噪高效图压缩的图增量学习能提高分类准确率并且节约回放内存空间。

    基于视觉语义提示协作的泛化零样本学习方法

    公开(公告)号:CN119580001A

    公开(公告)日:2025-03-07

    申请号:CN202411743524.X

    申请日:2024-11-30

    Abstract: 本发明公开了基于视觉语义提示协作的泛化零样本学习方法,借助类语义信息识别可见和不可见类别的图像,其中类属性和文本描述被广泛用于将知识从可见类转移到新颖类;包括步骤一:浅层的弱提示融合;步骤二:深层的强提示融合;步骤三:视觉提示发散损失和语义蒸馏损失优化;该方法设计视觉提示来整合内部视觉信息以进行判别特征学习,并设计一种语义提示来整合外部语义形成以进行视觉语义对齐。针对网络中的不同层次设计了弱提示融合机制和强提示融合机制,通过视觉提示和语义提示的协作,可以获得语义丰富的特征,用于广义零样本图像识别。大量实验表明,该方法框架在传统零样本学习和广义的零样本学习基准中始终取得优异的性能。

    一种基于隐属性增强网络的小样本类增量学习方法

    公开(公告)号:CN119251548A

    公开(公告)日:2025-01-03

    申请号:CN202411243579.4

    申请日:2024-09-05

    Abstract: 本发明公开了一种基于隐属性增强网络的小样本类增量学习方法,本方法将隐属性应用到小样本图像数据的泛化中,运用自注意力机制和隐属性记忆模块,对图像中的可泛化信息进行捕捉,将此信息作为可学习的隐属性。之后构建隐属性记忆池,运用从基类中学习到的隐属性,实现对新类图像识别的泛化。与现有的小样本类增量学习方法相比,基于隐属性增强网络的小样本类增量学习方法能提高分类准确率并且提高识别新类的泛化能力,对于新类的泛化能力优于传统的小样本类增量学习方法。

    基于球面测度表示和深度学习的球面图像压缩方法及装置

    公开(公告)号:CN118864620A

    公开(公告)日:2024-10-29

    申请号:CN202410820879.8

    申请日:2024-06-24

    Abstract: 公开一种基于球面测度表示和深度学习的球面图像压缩方法及装置,能够解决传统球面压缩方法效率低的问题,同时考虑局部窗口感受野的扩大和局部及非局部相关性的捕捉,提高熵模型的准确性。方法包括:(1)通过基于球面测度的球面图像重采样来均匀采样球面图像;(2)构建球面图像学习的基本组件;(3)集成球面卷积和自注意力的球面transformer,基于球面熵模型的码率建模;其中步骤(2)包括:(2.1)获取球面块;(2.2)进行球面卷积;(2.3)在基于学习的平面图像压缩中,下采样通过步幅大于2的卷积实现;在图像解码过程中,通过上采样来增加图像的分辨率以进行重建;(2.4)建立球面transformer模型。

    一种基于子超图和自蒸馏的交通预测方法

    公开(公告)号:CN118747552A

    公开(公告)日:2024-10-08

    申请号:CN202410763286.2

    申请日:2024-06-13

    Abstract: 本发明提出了一种基于子超图和自蒸馏的交通预测方法。本发明首先根据不同的交通特征对整个数据进行聚类来构建子超图。随后,利用这些子超图构建教师网络,提取数据中蕴含的不同属性特征。同时,基于整体数据和交通道路拓扑结构构建学生网络,学习交通路网的全局结构特征。最后,利用自蒸馏方法将教师网络学习到的数据特征迁移到学生网络的训练过程中,得到最终的预测结果。本发明在几个真实世界交通数据集上进行了评估。实验结果证明了本发明的有效性,减小了预测误差。

    一种面向图像分类任务的多层字典学习方法

    公开(公告)号:CN111709442B

    公开(公告)日:2024-08-23

    申请号:CN202010377838.8

    申请日:2020-05-07

    Abstract: 一种面向图像分类任务的多层字典学习方法,其能够解除多个字典之间关系定义的局限性,提升字典学习应用于分类问题的精度。这种面向图像分类任务的多层字典学习方法,用于提取图像样本中的类别信息,包括:(1)将多层字典之间的依赖关系定义为残差学习,基于多层残差判别字典学习框架来学习多层字典及分类器;(2)基于步骤(1)学习的多层字典依次计算待分类数据的多轮编码向量,再利用相应的分类器进行分类,加和各分类器预测值得到最终识别结果。

Patent Agency Ranking