一种跨模态图文检索方法
    11.
    发明公开

    公开(公告)号:CN110457516A

    公开(公告)日:2019-11-15

    申请号:CN201910741822.8

    申请日:2019-08-12

    Abstract: 本发明公开了一种基于栈式跨模态自编码器的跨模态图文检索方法,其主要目的是提高跨模态图文检索的精确度。首先,对图像和文本数据进行预处理,得到图像特征和文本特征,再通过两层受限玻尔兹曼机,提取单模态表示;其次,通过构建深层次的栈式跨模态自编码器,挖掘模态间的相关性;最终,训练模型并得到模型文件,在验证集上完成跨模态图文检索任务。本发明在实现了图文检索中常用的两种检索任务(以图检文和以文检图)的基础上,还能实现输入一种模态数据返回多种模态数据,在三个跨模态图文检索数据集上提升了模型检索精确度和泛化能力。

    一种分层监督跨模态图文检索方法

    公开(公告)号:CN114168784B

    公开(公告)日:2024-11-01

    申请号:CN202111511008.0

    申请日:2021-12-10

    Abstract: 本发明公开了一种分层监督跨模态图文检索方法,所述的方法包括步骤如下:S1:构建用于提取图像特征和文本特征的特征提取网络;S2:利用特征提取网络提取图像和文本特征,分别得到图像和文本的初步高维特征值;S3:构建模态对抗网络,将图像和文本的初步高维特征值输入模态对抗网络进行对抗学习,使得含有相同语义的不同模态在公共空间中的距离最近;S4:构建哈希码生成网络,并利用哈希码生成网络约束特征提取网络的最后一层全连接层,使得通过最后一层全连接层的图像和文本的初步高维特征值,生成最优哈希码,实现对跨模态数据检索。本发明能实现对具有分层监督跨模态数据的检索,提升跨模态检索效率。

    一种轻量化可实现多人全身关键点的检测方法以及装置

    公开(公告)号:CN117854108A

    公开(公告)日:2024-04-09

    申请号:CN202410024047.5

    申请日:2024-01-08

    Abstract: 本发明提供了一种轻量化可实现多人全身关键点的检测方法以及装置,包括如下步骤:从MPII人体姿态数据集中获取脸部关键点、手部关键点以及脚部关键点的预测坐标,并将所述预测坐标与身体关键点坐标相结合形成真实标签,利用上述标记好的个人数据形成全身关键点检测数据集;将残差50卷积块注意力网络的前22层设计为全身关键点检测网络的主干网络,使其与N个轻量级强大的关键点检测子网络相结合形成全身关键点检测网络;然后将上述检测网络在所述全身关键点检测数据集上进行训练,并使用两种损失函数标签损失和蒸馏损失进行辅助训练,训练后的模型部署后进行实时检测和识别。本发明的检测方法具有高准确度、低参数量的检测性能。

    基于改进BSMOTE-Sequence算法的风电设备故障检测方法

    公开(公告)号:CN112801151B

    公开(公告)日:2022-04-12

    申请号:CN202110060075.9

    申请日:2021-01-18

    Abstract: 本发明公开了一种风电设备故障检测方法,本发明基于改进的BSMOTE‑Sequence风机故障采样策略,通过对BorderlineSMOTE进行改进而设计的一种风机数据集采样策略模型。BorderlineSMOTE在选择对哪些样本点进行合成时,第一步通过KNN算法选出K′个少数类近邻样本,第二步从这K′个样本中随机选择K″个样本。本发明是将第二步随机选择样本改进为根据时序特征来选择样本,该方式生成新样本综合考虑了空间距离、时序规律,能有效减少噪声点的生成,不仅解决了风机数据集的不平衡问题,而且并未破坏数据集的时序规律。此外,本发明还结合Tomek Links技术,可以有效地过滤数据集中的噪声样本、类间重叠样本,从而提高后续分类器训练的效率及准确率,避免模型过拟合。

    一种分层监督跨模态图文检索方法

    公开(公告)号:CN114168784A

    公开(公告)日:2022-03-11

    申请号:CN202111511008.0

    申请日:2021-12-10

    Abstract: 本发明公开了一种分层监督跨模态图文检索方法,所述的方法包括步骤如下:S1:构建用于提取图像特征和文本特征的特征提取网络;S2:利用特征提取网络提取图像和文本特征,分别得到图像和文本的初步高维特征值;S3:构建模态对抗网络,将图像和文本的初步高维特征值输入模态对抗网络进行对抗学习,使得含有相同语义的不同模态在公共空间中的距离最近;S4:构建哈希码生成网络,并利用哈希码生成网络约束特征提取网络的最后一层全连接层,使得通过最后一层全连接层的图像和文本的初步高维特征值,生成最优哈希码,实现对跨模态数据检索。本发明能实现对具有分层监督跨模态数据的检索,提升跨模态检索效率。

    一种外观相似度与空间位置信息融合的回环检测方法

    公开(公告)号:CN112396167A

    公开(公告)日:2021-02-23

    申请号:CN202011603737.4

    申请日:2020-12-30

    Abstract: 本发明公开了一种外观相似度与空间位置信息融合的回环检测方法,包括步骤:将装有视觉传感器和定位系统的机器人置于场景中自由探索,同时采集图像与相应的空间坐标信息。通过以卷积神经网络为核心的孪生网络框架训练相似度计算模型。采用训练完成的模型将新采集的场景图像与已有图像进行相似度判别,相似度大于一定阈值时,则认为机器人曾经经过该场景。在判别为机器人经过该场景的情况下,计算两张场景图像对应空间坐标的水平距离差,若距离差小于一定阈值,则判定机器人经过的路径产生闭合环路。本方法从外观相似度与里程计两个方面同时进行约束,从而达到检测机器人移动路径中闭合环路的目的。

Patent Agency Ranking