-
公开(公告)号:CN108446661B
公开(公告)日:2021-11-19
申请号:CN201810280026.4
申请日:2018-04-01
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于数据扩增的深度学习并行化人脸识别方法,所述方法通过将人脸数据集进行数据扩增得到一个大规模的人脸数据集来提高人脸识别的准确率;然后将得到的大规模人脸数据集输入到改进的残差网络中进行深度学习,从而将人脸图像的特征转换为二进制哈希码以加快识别的效率;模型训练是在基于caffeonspark的分布式平台上进行的,从而减少模型训练时间;最后将得到的模型在LFW数据集上进行人脸验证来检验模型的泛化能力以及改进的残差网络的可行性。本发明能够提高人脸识别的准确率及识别效率。
-
公开(公告)号:CN114648781B
公开(公告)日:2024-04-05
申请号:CN202210321494.8
申请日:2022-03-30
Applicant: 桂林电子科技大学
IPC: G06V40/10 , G06N3/0464 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种人体姿态估计方法及存储介质,所述方法包括:构建OKDL2S网络模型,获取目标图片并输入到OKDL2S网络模型中获得人体姿态信息。所述方法使用最新的知识蒸馏理念、经典的人体姿态估计算法、深度学习有关技术来设计更轻量化、更精简高效的网络模型,以提高关键点检测的准确度、增强模型的泛化能力,减小模型部署代价,减少模型参数以加快检测速度,使得模型的检测速度,检测准确率、模型参数之间取得更好的平衡,并将其实际应用于人体姿态估计领域。
-
公开(公告)号:CN114648781A
公开(公告)日:2022-06-21
申请号:CN202210321494.8
申请日:2022-03-30
Applicant: 桂林电子科技大学
IPC: G06V40/10 , G06N3/04 , G06K9/62 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种人体姿态估计方法及存储介质,所述方法包括:构建OKDL2S网络模型,获取目标图片并输入到OKDL2S网络模型中获得人体姿态信息。所述方法使用最新的知识蒸馏理念、经典的人体姿态估计算法、深度学习有关技术来设计更轻量化、更精简高效的网络模型,以提高关键点检测的准确度、增强模型的泛化能力,减小模型部署代价,减少模型参数以加快检测速度,使得模型的检测速度,检测准确率、模型参数之间取得更好的平衡,并将其实际应用于人体姿态估计领域。
-
公开(公告)号:CN110222558A
公开(公告)日:2019-09-10
申请号:CN201910325729.9
申请日:2019-04-22
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于深度学习的手部关键点检测方法,所述方法包括了CPMs卷积神经网络和GoogLeNet神经网络模型。所述CPMs卷积神经网络中,保留stage1中的数据层和最后七个卷积层,将stage1中的其他层剔除掉。所述GoogLeNet神经网络模型中,选用其前13网络层,并删除其中的数据层和inception(3b)后面的max pool层。将所述CPMs卷积神经网络和所述GoogLeNet神经网络模型结合起来,修改每一层的bottom属性、top属性的名称,使得层与层之间能够链接起来。本发明改进了网络模型结构,提高了关键点检测的准确度和减小了模型训练的代价(训练时间等),减少了模型参数得以加快检测速度。
-
公开(公告)号:CN114168784B
公开(公告)日:2024-11-01
申请号:CN202111511008.0
申请日:2021-12-10
Applicant: 桂林电子科技大学
IPC: G06F16/583 , G06F16/33 , G06N3/045 , G06N3/0475 , G06N3/048 , G06N3/094 , G06N3/084
Abstract: 本发明公开了一种分层监督跨模态图文检索方法,所述的方法包括步骤如下:S1:构建用于提取图像特征和文本特征的特征提取网络;S2:利用特征提取网络提取图像和文本特征,分别得到图像和文本的初步高维特征值;S3:构建模态对抗网络,将图像和文本的初步高维特征值输入模态对抗网络进行对抗学习,使得含有相同语义的不同模态在公共空间中的距离最近;S4:构建哈希码生成网络,并利用哈希码生成网络约束特征提取网络的最后一层全连接层,使得通过最后一层全连接层的图像和文本的初步高维特征值,生成最优哈希码,实现对跨模态数据检索。本发明能实现对具有分层监督跨模态数据的检索,提升跨模态检索效率。
-
公开(公告)号:CN118747226A
公开(公告)日:2024-10-08
申请号:CN202410889007.7
申请日:2024-07-04
Applicant: 桂林电子科技大学
IPC: G06F16/532 , G06F16/583 , G06V10/40 , G06F18/213 , G06F18/22 , G06F16/332 , G06F16/383
Abstract: 本发明公开了一种目标级跨模态图文检索方法及存储介质,所述方法构建了图像‑目标信息成对数据,并在特征提取过程中将目标的位置信息集成到文本标题特征中,有效学习了图像中目标和文本的关联关系,提升了图文检索的准确性和可解释性;通过将跨模态鸿沟分布添加到图像特征中并结合鸿沟余弦损失函数最大化图像特征和目标特征的相似性,解决了图文数据的模态鸿沟问题;利用二次训练模块对错误检索数据进一步训练,获得训练完备的一种目标级跨模态图文检索模型,进一步提升了模型的性能。
-
公开(公告)号:CN117854108A
公开(公告)日:2024-04-09
申请号:CN202410024047.5
申请日:2024-01-08
Applicant: 桂林电子科技大学
IPC: G06V40/10 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种轻量化可实现多人全身关键点的检测方法以及装置,包括如下步骤:从MPII人体姿态数据集中获取脸部关键点、手部关键点以及脚部关键点的预测坐标,并将所述预测坐标与身体关键点坐标相结合形成真实标签,利用上述标记好的个人数据形成全身关键点检测数据集;将残差50卷积块注意力网络的前22层设计为全身关键点检测网络的主干网络,使其与N个轻量级强大的关键点检测子网络相结合形成全身关键点检测网络;然后将上述检测网络在所述全身关键点检测数据集上进行训练,并使用两种损失函数标签损失和蒸馏损失进行辅助训练,训练后的模型部署后进行实时检测和识别。本发明的检测方法具有高准确度、低参数量的检测性能。
-
公开(公告)号:CN108446661A
公开(公告)日:2018-08-24
申请号:CN201810280026.4
申请日:2018-04-01
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于数据扩增的深度学习并行化人脸识别方法,所述方法通过将人脸数据集进行数据扩增得到一个大规模的人脸数据集来提高人脸识别的准确率;然后将得到的大规模人脸数据集输入到改进的残差网络中进行深度学习,从而将人脸图像的特征转换为二进制哈希码以加快识别的效率;模型训练是在基于caffeonspark的分布式平台上进行的,从而减少模型训练时间;最后将得到的模型在LFW数据集上进行人脸验证来检验模型的泛化能力以及改进的残差网络的可行性。本发明能够提高人脸识别的准确率及识别效率。
-
公开(公告)号:CN119538937A
公开(公告)日:2025-02-28
申请号:CN202411688518.9
申请日:2024-11-25
Applicant: 桂林电子科技大学
IPC: G06F40/30 , G06F18/213 , G06F18/22 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/0499 , G06N3/09
Abstract: 本发明公开了一种基于RoBERTa‑wwm‑ext‑large预训练模型的中文语义匹配方法,所述方法通过预训练模型RoBERTa‑wwm‑ext‑large获取匹配文本的初始向量表示,利用特征注意力加强两个文本向量之间的语义交互;接着将文本向量送入卷积神经网络提取更多特征信息后,再输出到长短期记忆网络这些特征信息的时间序列依赖性,通过自注意力丰富文本向量的上下文信息;建立微调表示模型去处理初始文本连接向量,获得微调过的文本对连接向量。最后将这些文本向量输入到多层感知机网络,计算文本匹配结果。与现有的基于预训练模型的文本匹配算法比较,本发明具有较高的准确度和较好的泛化性。
-
公开(公告)号:CN118708675A
公开(公告)日:2024-09-27
申请号:CN202410742517.1
申请日:2024-06-11
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于空间预测型视觉语言预训练模型的跨模态图文检索方法及存储介质,所述方法通过将局部语义预测视觉空间位置引入到视觉语言预训练模型中,使预训练模型能够学习到更有效的高级语义,有效提升下游跨模态图文检索任务的性能;利用基于空间预测型视觉语言预训练模型对下游图文检索数据进行特征提取,构建四元组损失函数并执行有监督跨模态图文检索;利用四元组构造模块挖掘与正样本具有强语义关联假负例样本,减少了假负例样本对图文检索的影响。
-
-
-
-
-
-
-
-
-