-
公开(公告)号:CN114648781B
公开(公告)日:2024-04-05
申请号:CN202210321494.8
申请日:2022-03-30
Applicant: 桂林电子科技大学
IPC: G06V40/10 , G06N3/0464 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种人体姿态估计方法及存储介质,所述方法包括:构建OKDL2S网络模型,获取目标图片并输入到OKDL2S网络模型中获得人体姿态信息。所述方法使用最新的知识蒸馏理念、经典的人体姿态估计算法、深度学习有关技术来设计更轻量化、更精简高效的网络模型,以提高关键点检测的准确度、增强模型的泛化能力,减小模型部署代价,减少模型参数以加快检测速度,使得模型的检测速度,检测准确率、模型参数之间取得更好的平衡,并将其实际应用于人体姿态估计领域。
-
公开(公告)号:CN116701582A
公开(公告)日:2023-09-05
申请号:CN202310468927.7
申请日:2023-04-27
Applicant: 中国电子科技集团公司第五十四研究所 , 桂林电子科技大学
IPC: G06F16/332 , G06F16/335 , G06F16/9535 , G06F40/35 , G06F40/279 , G06F40/211 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种智能问答方法,所述方法包括基于所选专业领域问题的问答数据构建意图识别数据集和语义匹配数据集,基于意图识别数据集构建意图识别模型以及基于语义匹配数据集构建语义匹配模型。本发明采用对比学习技术拉近正样本对之间的距离并拉远负样本对之间的距离,提高了意图识别的准确性;采用图卷积神经网络技术将句法特征与BERT获得的文本特征进行融合,提升了模型对问题文本的语义表征能力,提高了语义匹配效果。
-
公开(公告)号:CN112561824B
公开(公告)日:2023-04-07
申请号:CN202011519696.0
申请日:2020-12-21
Applicant: 中国科学院自动化研究所 , 桂林电子科技大学
Abstract: 本发明涉及一种2D激光与深度图像融合的数据对齐修复方法及系统,所述数据对齐修复方法包括:提取在相同时刻对相同目标采集的2D激光数据和深度图像数据;确定在2D激光数据与深度图像数据中相似度值最高的序列数据;根据相似度值最高的序列数据,确定所述序列数据中的空洞区域和/或毛刺区域,并基于所述序列数据修复空洞区域和/或毛刺区域。本发明基于时间戳提取相同时刻2D激光数据和深度图像数据,筛选出相似度值最高的序列数据,利用序列数据的相关性将有效序列的变化趋势移植到另一模态的无效数据区间,得到新的修复序列,修复的序列能够增强2D激光地图和深度图像的可视化效果,使两种传感器数据得以互相弥补。
-
公开(公告)号:CN115563316A
公开(公告)日:2023-01-03
申请号:CN202211322568.6
申请日:2022-10-27
Applicant: 桂林电子科技大学
IPC: G06F16/43 , G06F16/45 , G06F16/483
Abstract: 本发明提供了一种跨模态检索方法以及检索系统,所述检索方法包括:采用CLIP预训练模型对特征进行编码,获得包括原始图像以及文本的原始模态特征;将所述原始模态特征进行注意力对齐处理得到模态对齐数据以实现原始模态互相之间的语义相关;将上述步骤形成的所述模态数据通过权重共享的多层感知机以保持模态的不变性;利用Arc4cmr损失函数将最终得到的特征数据分布到归一化超球面上进行类别边界约束。本发明的跨模态检索方法使得成对的图像与文本的公共表示尽可能相近,实现同时增强类内紧性和类间差异性。
-
公开(公告)号:CN114648781A
公开(公告)日:2022-06-21
申请号:CN202210321494.8
申请日:2022-03-30
Applicant: 桂林电子科技大学
IPC: G06V40/10 , G06N3/04 , G06K9/62 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种人体姿态估计方法及存储介质,所述方法包括:构建OKDL2S网络模型,获取目标图片并输入到OKDL2S网络模型中获得人体姿态信息。所述方法使用最新的知识蒸馏理念、经典的人体姿态估计算法、深度学习有关技术来设计更轻量化、更精简高效的网络模型,以提高关键点检测的准确度、增强模型的泛化能力,减小模型部署代价,减少模型参数以加快检测速度,使得模型的检测速度,检测准确率、模型参数之间取得更好的平衡,并将其实际应用于人体姿态估计领域。
-
公开(公告)号:CN112561824A
公开(公告)日:2021-03-26
申请号:CN202011519696.0
申请日:2020-12-21
Applicant: 中国科学院自动化研究所 , 桂林电子科技大学
Abstract: 本发明涉及一种2D激光与深度图像融合的数据对齐修复方法及系统,所述数据对齐修复方法包括:提取在相同时刻对相同目标采集的2D激光数据和深度图像数据;确定在2D激光数据与深度图像数据中相似度值最高的序列数据;根据相似度值最高的序列数据,确定所述序列数据中的空洞区域和/或毛刺区域,并基于所述序列数据修复空洞区域和/或毛刺区域。本发明基于时间戳提取相同时刻2D激光数据和深度图像数据,筛选出相似度值最高的序列数据,利用序列数据的相关性将有效序列的变化趋势移植到另一模态的无效数据区间,得到新的修复序列,修复的序列能够增强2D激光地图和深度图像的可视化效果,使两种传感器数据得以互相弥补。
-
公开(公告)号:CN111782969A
公开(公告)日:2020-10-16
申请号:CN202010639752.8
申请日:2020-07-06
Applicant: 桂林电子科技大学
IPC: G06F16/9536 , G06F16/9537 , G06Q50/00
Abstract: 本发明公开了一种基于地理区域的社交网络中最大影响力节点的选取方法,所述方法将大型社交网络结构与地理信息相结合,采用四叉树索引与最大影响力树结构相结合的算法,选取查询区域内影响力最大的节点集,本发明可以高效选取出地理区域中影响力最大的种子节点集合。其中,使用四叉树索引结构来存储网络节点的位置信息,并使用深度优先搜索方法来识别给定查询区域中的候选对象;使用最大影响树状结构(MIA)计算每个候选节点的影响集并运行动态规划算法计算所有候选节点的影响力;再根据排序迭代弹出最大堆中具有最大影响值的候选节点作为最大影响力种子节点。
-
公开(公告)号:CN111694977A
公开(公告)日:2020-09-22
申请号:CN202010532683.0
申请日:2020-06-12
Applicant: 桂林电子科技大学
IPC: G06F16/55 , G06F16/583 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于数据增强的车辆图像检索方法,该方法是使用多尺度Retinex算法对现有的公开车辆图像数据进行数据增强,得到一个大规模车辆图像数据集;其次,使用卷积神经网络构建车辆图像检索模型并在增强后的数据集上进行训练,同时采用迁移学习的方法缩短模型的训练周期;最后,选择分类效果表现最好的模型作为特征提取引擎在检索测试集上进行模型评价。该方法解决了车辆图像缺乏和人为标注等带来的影响,在一定程度上可以增加模型的准确率和泛化能力。使用迁移学习的方法加快模型收敛的速度,减少训练的时间,提高车辆图像检索的准确率。
-
公开(公告)号:CN111694974A
公开(公告)日:2020-09-22
申请号:CN202010532689.8
申请日:2020-06-12
Applicant: 桂林电子科技大学
IPC: G06F16/51 , G06F16/583 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合注意力机制的深度哈希车辆图像检索方法,目的是为了提高车辆图像检索的准确率。由于数据量的增大和特征维数的增高所带来庞大计算量及获取特征向量中包含较多的干扰因素导致精确度低的问题。本发明针对该问题,引入注意力机制,提出了融合注意力机制的残差网络深度哈希模型,该模型借助注意力机制来识别车辆图像中多个目标对象的近似位置,以获得一个更为专注的特征表示。同时,本发明引入类别交叉熵损失函数来解决融入注意力机制的模型学习。
-
公开(公告)号:CN110457516A
公开(公告)日:2019-11-15
申请号:CN201910741822.8
申请日:2019-08-12
Applicant: 桂林电子科技大学
IPC: G06F16/583 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于栈式跨模态自编码器的跨模态图文检索方法,其主要目的是提高跨模态图文检索的精确度。首先,对图像和文本数据进行预处理,得到图像特征和文本特征,再通过两层受限玻尔兹曼机,提取单模态表示;其次,通过构建深层次的栈式跨模态自编码器,挖掘模态间的相关性;最终,训练模型并得到模型文件,在验证集上完成跨模态图文检索任务。本发明在实现了图文检索中常用的两种检索任务(以图检文和以文检图)的基础上,还能实现输入一种模态数据返回多种模态数据,在三个跨模态图文检索数据集上提升了模型检索精确度和泛化能力。
-
-
-
-
-
-
-
-
-