一种基于类激活区域偏移度量的连续学习性能评估方法

    公开(公告)号:CN117237765A

    公开(公告)日:2023-12-15

    申请号:CN202311270683.8

    申请日:2023-09-28

    Abstract: 该发明公开了一种基于类激活区域偏移度量的连续学习性能评估方法,属于深度神经网络模型的类增量连续学习领域。本发明在进行图像处理任务时,深度神经网络模型需要对图像中待处理的物体进行提取和重点关注,以完成后续的下游任务;在连续学习场景下,模型在后续任务的学习中灾难性遗忘可能会导致其对之前任务中的目标失去提取和关注能力。本方案提出了使用Grad‑cam类别激活映射谱在不同任务阶段的变化情况来衡量连续学习算法遏制灾难性遗忘的有效性,主要给出了量化的关注区域稳定度评价指标,并结合分类准确度形成了偏离度和相关度指标,最后综合DV和RL作为DR评价指标来衡量连续学习算法的整体表现。

    一种基于多核奈斯特隆方法的自适应滤波方法

    公开(公告)号:CN115567038A

    公开(公告)日:2023-01-03

    申请号:CN202211125103.1

    申请日:2022-09-13

    Abstract: 该发明公开了一种基于多核奈斯特隆方法的自适应滤波方法,涉及核自适应滤波领域。多核奈斯特隆方法结合了多个核函数,这些核函数不仅仅只包括高斯核还可以用其他不同的核函数,可以将原始数据映射到多个不同的独立特征空间中。多核奈斯特隆方法相较传统的单核奈斯特隆方法有更优秀的滤波精度,而且对核参数的选择变得不敏感。相比多核自适应滤波方法则可以显著减小计算复杂度,减少时间和内存消耗。随后本发明首次将提出的多核奈斯特隆方法引入到核自适应滤波器中,实验表明此算法在比较小的计算复杂度下可以达到比目前先进的核自适应滤波算法更好的滤波精度。

    一种基于视觉语言知识引入的零样本多模态第一视角行为识别方法

    公开(公告)号:CN119203019A

    公开(公告)日:2024-12-27

    申请号:CN202411024976.2

    申请日:2024-07-29

    Abstract: 该发明公开了一种基于视觉语言知识引入的零样本多模态第一视角行为识别方法,属于多模态行为识别领域。本发明首先将视觉模态输入预训练的CLIP视觉编码器提取视觉特征,将经过STFT变换的加速度计模态、陀螺仪模态频谱图提取对应的特征,文本通过预训练的CLIP文本编码器提取到文本特征。然后将视觉特征传入到适配器模块,将零样本知识与新的自适应特征知识进行动态结合,得到最终的视觉特征。加速度计模态、陀螺仪模态通过惯性传感器融合模块得到最终的惯性传感器特征。最后将文本、视觉、惯性传感器特征一同输入多模态融合模块,充分考虑不同模态间对齐的问题,有效地提升模态融合的效果。该方法在零样本多模态第一视角行为识别任务上表现令人满意。

Patent Agency Ranking