-
公开(公告)号:CN119964204A
公开(公告)日:2025-05-09
申请号:CN202510150928.6
申请日:2025-02-11
Applicant: 厦门大学
Abstract: 一种基于属性语义相似匹配的行人属性识别方法,涉及计算机视觉技术领域。首先设计一个自适应的语义查询模块,使用与视觉特征结合的自适应查询来学习特定于属性的空间分布,并捕获每个属性的语义信息。此外,将行人属性识别重构为语义匹配任务,使用属性文本特征作为语义锚点,根据查询的语义信息与锚点间的距离来预测行人属性。最后,提出动态负语义学习策略,通过将属性的空间先验信息与可学习参数相结合,来生成属性的负语义信息,以约束语义查询模块对属性的关注区域,实现更加准确的行人属性识别。
-
公开(公告)号:CN118607591A
公开(公告)日:2024-09-06
申请号:CN202410736279.3
申请日:2024-06-07
Applicant: 厦门大学
IPC: G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/084 , G06N3/096 , G06F18/25 , G06F18/22 , G06N3/048
Abstract: 本发明公开了一种结合视觉‑语言预训练和提示学习的域泛化方法。所述方法基于一训练完成的多模态模型以及植入该模型的至少一个域提示生成器,所述多模态模型包括至少一个图像编码器、至少一个文本编码器;获取多域文本数据集及多域图像数据集,并利用模型从多域文本数据集提取每条文本数据对应的第一文本特征,以及,从多域图像数据集提取每张图像数据对应的第一图像特征;在图像编码器中嵌入可学习向量,并利用嵌入后的图像编码器提取多域图像数据集中每张图像数据对应的第二图像特征;将每张图像数据对应的第二图像特征输入域提示生成器,得到每个域对应的总体语言提示等。本发明能够提高模型在未见领域的准确性和效率,解决现有技术中存在的问题。
-
公开(公告)号:CN113903053A
公开(公告)日:2022-01-07
申请号:CN202111129224.9
申请日:2021-09-26
Applicant: 厦门大学
Abstract: 基于统一中间模态的跨模态行人重识别方法,涉及计算机视觉技术领域。包括以下步骤:1)将两种模态图像分别输入到两个编码器中进行编码;2)将编码得到的两种特征输入到两个非线性激活函数中用于加深其非线性表达能力;3)将非线性激活后的两种特征输入到一个共享的解码器中,并解码到一个统一的中间图像空间中,得到中间模态图像;4)将得到的中间模态图像与原始图像一起输入到网络中进行优化,完成跨模态行人重识别。可降低模态差异,进一步地拉近两种中间模态图像之间的距离,提升跨模态行人重识别模型的性能。
-
公开(公告)号:CN119963847A
公开(公告)日:2025-05-09
申请号:CN202510150715.3
申请日:2025-02-11
Applicant: 厦门大学
IPC: G06V10/30 , G06V10/764 , G06V10/52 , G06N3/0464 , G06N3/047 , G06N3/048 , G06V10/20 , G06V10/40
Abstract: 一种基于双重净化动态图网络的鲁棒模型拟合方法,涉及计算机视觉技术领域。针对含噪声与离群点的数据集,通过尺度不变特征变换生成初始对应集,并引入动态图网络进行处理。提出一种双重动态净化模块,包括区域通道偏好块和整体空间一致块,分别从局部与全局视角实现逐步采样和离群点剔除,获取净化后的候选对应集及内点概率集。区域通道偏好块通过偏好注意力机制强化局部特征,整体空间一致块通过一致注意力机制捕获长程依赖关系。利用净化后的候选对应集拟合模型参数,并结合内点概率集计算模型估计损失与点分类损失。充分利用动态图网络特性与偏好一致策略,在抗噪性和拟合精度方面显著优于现有技术。
-
公开(公告)号:CN118658199A
公开(公告)日:2024-09-17
申请号:CN202410686731.X
申请日:2024-05-30
Applicant: 厦门大学 , 上海人工智能创新中心
Abstract: 一种基于边缘指导运动信息提升网络的小样本行为识别方法,涉及计算机视觉技术。A.给定视频数据集,将每个视频随机抽取T帧构成新的视频帧序列。B.视频帧序列输入特征提取器获得视频帧特征。同时,将采样后的视频帧序列输入边缘信息提取器获得边缘信息特征。C.将步骤B生成的视频帧特征和边缘信息特征分别输入运动信息提升模块,获得提升后的视频帧特征和提升后的边缘信息特征。D.将步骤C提升后的两种特征融合,输入预测器得到类别预测结果,产生类别损失。E.将步骤C提升后的边缘信息特征输入预测器,得边缘损失,与步骤D产生的类别损失共同组成网络的损失函数。与当前主流的小样本行为识别方法相比,分类性能有所提升。
-
公开(公告)号:CN117079068A
公开(公告)日:2023-11-17
申请号:CN202310784489.5
申请日:2023-06-29
Applicant: 厦门大学
IPC: G06V10/774 , G06V10/764 , G06V10/771
Abstract: 本发明公开了一种基于二维度量的两阶段样本选择方法,包括:将数据样本根据其观测标签的类别进行分离归类,得到若干同类数据样本构成的子数据集;计算每个子数据集中的数据样本在标签空间维度和特征空间维度的数据分布;计算每个子数据集中的数据样本在标签空间维度和特征空间维度的均值和方差,确定数据样本最优分离维度;根据数据样本在最优分离维度的差异性,将数据样本分离为干净样本集合和噪声样本集合。实现了对尾部类数据样本中的干净样本和噪声样本的高效分离,从而使得分类模型能够更好的关注尾部类数据样本。
-
公开(公告)号:CN115688939A
公开(公告)日:2023-02-03
申请号:CN202211396784.5
申请日:2022-11-09
Applicant: 厦门大学
IPC: G06N20/00 , G06N3/045 , G06N3/08 , G06F21/62 , G06F18/2431 , G06F18/23213
Abstract: 本发明公开了一种基于对抗式特征增广的长尾数据个性化联邦学习方法,包括:在服务器端将整个全局模型分成全局特征提取器g和全局分类器f并将其发给若干个客户端;通过随机采样平衡若干个客户端本地样本数据分布,利用伯努利分布构建若干对源大类样本ys和目标小类样本yt标签对;获取源大类样本特征hs和目标小类样本特征并得到采样平衡样本特征集Dbal和生成平衡样本特征集利用所述采样平衡样本特征集Dbal和生成平衡样本特征集训练所述全局分类器f,结合全局特征提取器g,得到本地个性化模型。能够解决全局长尾数据分布下的数据异构问题。
-
公开(公告)号:CN119540999A
公开(公告)日:2025-02-28
申请号:CN202411646026.3
申请日:2024-11-18
Applicant: 厦门大学
Abstract: 基于图像‑属性和频域‑空间域双重协同学习的行人属性识别方法,涉及计算机视觉技术领域。提出一个图像‑属性协同学习框架,集成视觉信息和属性标签,以感知对行人属性更精细的语义理解;通过可学习的属性提示获取属性向量表示,将行人图像输入图像编码器以获得视觉向量表示,将属性向量表示和视觉向量表示映射联合图像‑属性协同空间中,通过对比学习损失学习图像和属性之间的语义关联。提出一个频域‑空间域协同学习模块,利用涉及频域幅度谱分量和相位谱分量的交叉注意机制进行交互式引导学习,与空间信息协同学习。全面探索和利用行人图像中的频率‑空间双域信息,获得更稳健的视觉特征。在提高行人属性识别任务性能方面具有显著优势。
-
公开(公告)号:CN119314018A
公开(公告)日:2025-01-14
申请号:CN202411351462.8
申请日:2024-09-26
Applicant: 厦门大学 , 上海人工智能创新中心
IPC: G06V10/82 , G06V20/40 , G06V10/44 , G06V10/77 , G06V10/52 , G06V10/62 , G06V10/764 , G06N3/0464 , G06N3/045
Abstract: 一种基于运动引导注意力机制的类脑小样本行为识别算法,涉及深度学习任务的小样本行为识别技术领域。基于注意力机制的类脑归纳推理机制算法模块模仿人脑识别机制,主要包括自注意力运动特征引导模块、视频级全局感知模块和交叉注意力运动特征引导模块,自注意力运动特征引导模块用以捕获每个视频帧间与动作相关区域的关键特征;视频级感知模块对整个视频的关键动作相关区域特征进行持续关注;交叉注意力运动特征引导模块比较不同视频间的动作相关区域的关键特征,建立运动相关区域之间的关联;对比现有的一些经典方法,构建的模型能够显著提高小样本行为识别的检测精度,达到最优的结果。
-
公开(公告)号:CN308811262S
公开(公告)日:2024-08-30
申请号:CN202330821834.9
申请日:2023-12-13
Applicant: 之江实验室
Abstract: 1.本外观设计产品的名称:电子设备的查看化学信息的图形用户界面。
2.本外观设计产品的用途:用于一种电子设备以显示化学信息以及进行界面信息交互。
3.本外观设计产品的设计要点:在于图形用户界面。
4.最能表明设计要点的图片或照片:主视图。
5.图形用户界面的用途:在主视图中,左侧工具栏包含多个查看化学信息的选项,中间区域分别展示:化学信息关系网络图、数据展示区域以及数据占比展示区域。
在主视图中,当用户选择左侧工具栏 “Home”选项,在数据展示图以及数据占比展示图中显示相关数据。
在主视图中,当用户将光标悬停在化学信息关系网络图中大圆形上时,界面会以交互文本框的形式显示该大圆形对应化学物质的化学信息,如界面变化状态图1所示;在界面变化状态图1中,当用户点击化学信息关系网络图中大圆形时,在界面中会重点标注出用户点击的大圆形对应化学物质的化学信息关系网络,如界面变化状态图2所示;在界面变化状态图2中,当用户将光标悬停在化学信息关系网络图中小圆形上时,在界面中会显示该小圆形对应化学反应的化学反应式,如界面变化状态图3所示;在界面变化状态图3中,当用户点击在化学信息关系网络图中小圆形时,在界面中会重点标注用户点击的小圆形对应化学反应的化学信息关系网络,如界面变化状态图4所示。
-
-
-
-
-
-
-
-
-