基于注意力机制的轻量级多分支行人重识别方法及系统

    公开(公告)号:CN111931624A

    公开(公告)日:2020-11-13

    申请号:CN202010767119.7

    申请日:2020-08-03

    Inventor: 钟福金 朱逸成

    Abstract: 本发明涉及行人重识别系统领域,具体涉及一种基于注意力机制的轻量级多分支行人重识别方法及系统,包括:获取带有行人的图片集合作为数据集,对数据集进行预处理;将预处理后的数据集输入到主干网络中通过多个轻量级模块对全局特征提取以构建全局支路;将全局特征支路提取的特征分享到局部分支中,构建局部分支,进行局部特征提取;联合全局分支损失和局部分支损失进行交叉熵损失求解,并将损失之和回传给神经网络进行迭代训练;训练完成后,将包含行人的图像输入到训练好的神经网络模型中,按照相似度进行排序得到行人重识别结果,并对行人图片进行可视化。本发明计算成本较低,精度高,便于在移动端部署,增加了相关产品的适用性。

    一种基于多步加权的单样本部分遮挡人脸识别方法

    公开(公告)号:CN109902581A

    公开(公告)日:2019-06-18

    申请号:CN201910077715.X

    申请日:2019-01-28

    Inventor: 钟福金 闫硕 于洪

    Abstract: 本发明涉及单样本部分遮挡人脸识别,特别涉及一种基于多步加权的单样本部分遮挡人脸识别方法,包括提取图像的关键点,并对图像进行分块处理;提取具有关键点的图像块的SILBP描述符,计算图像块中的关键点个数,并将处理后的关键点个数作为权重对描述符加权;通过描述符加权匹配的方式获取匹配部位图像块之间的度量距离;求所有度量距离的平均值并用匹配关键点个数的倒数对平均值加权,最终的这个加权度量距离作为两图像之间的匹配度量距离,将具有最小度量距离的标签作为人脸识别的标签;本发明利用加权描述符匹配的方法省去了图像分块方法所需要的人脸预对齐处理,同时提出了一种通过关键点个数加权来选择未遮挡图像块进行匹配的方法。

    一种基于深度自主学习的铅浮选泡沫图像分类方法及系统

    公开(公告)号:CN119600339A

    公开(公告)日:2025-03-11

    申请号:CN202411643708.9

    申请日:2024-11-18

    Abstract: 本发明涉及计算机视觉技术,特别涉及一种基于深度自主学习的铅浮选泡沫图像分类方法及系统,方法包括构建以EfficientNetB6和Transformer网络结构融合的图像分类网络,获取带有分类标签的图像数据和无标签的图像数据,并对图像进行预处理;从带有分类标签的图像数据中采样m个样本对图像分类网络进行初始化训练;通过自主学习从无标签的图像数据中选出n个信息量最大的数据进行手动标注;利用选择的数据对初始化训练的数据进行进一步训练,得到完成训练的图像分类网络。本发明显著提升了模型的训练速度和复杂泡沫图像分类的能力,减少了标注所需的样本数量,从而降低了人力和时间成本。

    一种基于多任务学习的显隐式协同过滤推荐方法

    公开(公告)号:CN114662010B

    公开(公告)日:2024-10-11

    申请号:CN202210261079.8

    申请日:2022-03-16

    Abstract: 本发明请求保护一种基于多任务学习的显隐式协同过滤推荐方法,具体涉及推荐系统领域。在现实的推荐场景中,显式反馈和隐式反馈都会被系统收集。现有的许多推荐算法都是使用单一的反馈构建推荐系统进行推荐,而显式反馈和隐式反馈存在着互补的关系。本发明使用显式反馈和隐式反馈进行建模,所述方法使用两个辅助任务分别处理显式反馈和隐式反馈,主任务用于融合显式反馈和隐式反馈。由于多任务学习模型的底层参数共享,底层参数将会由所有任务联合更新,这使得显式反馈和隐式反馈的知识共享,从而提高推荐的准确性。

    一种基于有限状态机的自动驾驶决策方法

    公开(公告)号:CN117348415A

    公开(公告)日:2024-01-05

    申请号:CN202311485787.0

    申请日:2023-11-08

    Abstract: 本发明属于自动驾驶技术领域,具体涉及一种基于有限状态机的自动驾驶决策方法;该方法包括:将密集交通场景下的驾驶任务分解为三种驾驶子任务,包括变道、保持和姿态调整;对三种驾驶子任务分别进行马尔可夫建模;使用DQN算法求解马尔可夫决策过程,得到三种驾驶子任务的驾驶动作策略;根据驾驶过程中的任务切换过程构建有限状态机模型;根据有限状态机模型和驾驶动作策略得到驾驶决策并执行;本发明可解决DRL在自动驾驶决策任务中存在的稀疏回报问题,提高自动驾驶车在多样化驾驶环境中的适应能力,从而增强自动驾驶的可靠性和安全性。

    一种基于多特征融合的遮挡行人再识别方法

    公开(公告)号:CN116978061A

    公开(公告)日:2023-10-31

    申请号:CN202310940241.3

    申请日:2023-07-28

    Abstract: 本发明涉及一种基于多特征融合的遮挡行人再识别方法,包括:获取行人图像数据集并构建障碍样本集,从障碍样本集中随机选择一个障碍样本;对训练集中的无遮挡行人图像动态生成遮挡区域,更改障碍样本的大小为遮挡区域大小,将障碍样本粘贴至无遮挡行人图像的遮挡区域得到遮挡行人图像;对遮挡行人图像和无遮挡行人图像进行相同的图像增强处理,利用增强处理后的图像对训练基于ViT神经网络的行人再识别模型;将遮挡的目标行人图像和无遮挡的目标行人图像作为图像对输入训练好的行人再识别模型输出目标行人的识别结果;本发明能够实现在复杂的遮挡场景下对遮挡的行人图像进行识别检索,同时保证了高精度的行人识别,使其具有良好的经济效益。

    嵌入高阶信息的轻量级无约束人脸表情识别方法及系统

    公开(公告)号:CN112801040B

    公开(公告)日:2022-09-23

    申请号:CN202110249304.1

    申请日:2021-03-08

    Inventor: 钟福金 周睿丽

    Abstract: 本发明涉及无约束人脸表情识别领域,特别涉及一种嵌入高阶信息的轻量级无约束人脸表情识别方法及系统,所述方法包括对输入的数据进行预处理以及图像增强,并输入到轻量级特征提取网络中,提取出人脸表情图像的深层特征图;将深层特征图输入二阶有效通道注意力模块的输入,统计深层表情特征的二阶信息并捕获跨通道特征间的相互依赖关系;使用交叉熵损失和中心损失联合优化网络模型;将待测的人脸表情图像输入到训练好的网络模型中,分类器根据人脸表情特征输出最终预测表情类别;本发明的网络模型具有较少的参数量,较低的显存需求和计算量,并且没有使用额外的数据预训练模型,精度较高,相关产品的适用性较强。

    一种基于卷积神经网络的非受控人脸检测方法及系统

    公开(公告)号:CN112926506B

    公开(公告)日:2022-08-12

    申请号:CN202110313634.2

    申请日:2021-03-24

    Abstract: 本发明属于人脸检测领域,涉及一种基于卷积神经网络的非受控人脸检测方法及系统;所述方法包括获取人脸图像集合,并对其进行预处理输入到卷积神经网络中进行特征提取;利用特征金字塔将提取到的不同层级的特征图进行融合;从主分支中获取特征图中的特征点以及该特征图的第一回归结果;对特征点按照混合vMF分布建模,从主分支中得到该特征图的第一分类结果;融合第一回归结果的边界特征后,采用与主分支相同的方式得到辅助分支的第二回归结果与第二分类结果,对卷积神经网络进行迭代训练直至收敛;将待测人脸图像输入到训练完成的卷积神经网络中,输出检测结果;本发明能够精准的提取出任意人脸图像中的人脸位置。

    一种基于多级监督图卷积的视频三维人体姿态估计方法及系统

    公开(公告)号:CN114694261A

    公开(公告)日:2022-07-01

    申请号:CN202210387182.7

    申请日:2022-04-14

    Abstract: 本发明属于人体姿态估计领域,涉及一种基于多级监督图卷积的视频三维人体姿态估计方法及系统;该方法包括:获取待估计的视频数据,将视频数据输入到训练好的基于多级监督图卷积的视频三维人体姿态估计模型中,输出三维人体姿态估计结果;本发明提出了一种利用图卷积捕捉空间特征的方法,并利用多级监督的策略,在堆叠的图卷积和时间卷积模块后粗略地得到中间的预测结果,并将多级特征在网络最后进行融合,实现由粗到细的预测;本发明的估计精度高,对给定输入长度的视频帧,模型能实现高精度的推理,得到平滑的视频三维人体姿态运动结果,具有良好的经济效益。

Patent Agency Ranking