一种基于多尺度的Retinex和改进VGGNet网络的手势图像检索方法

    公开(公告)号:CN111695508B

    公开(公告)日:2022-07-19

    申请号:CN202010532767.4

    申请日:2020-06-12

    Abstract: 本发明公开了一种基于多尺度的Retinex和改进VGGNet网络的手势图像检索方法,该方法通过多尺度的Retinex方法对手势数据图像进行增强后,对采用深度学习方法对模型进行训练。当手势图像检索模型训练好之后,将最后一个FC层提取到的特征作为图像的特征表示参与手势图像检索任务,并改进的VGGNet的多分支网络结构中引入哈希层,模型的输入为手势图像和类别标签,类别标签作为监督信息学习图像特征,每个分支学习不同的标签信息,经过全连接层将之前两个分支学习到的特征进行融合,得到非线性组合特征,然后经过哈希层将得到低维度的哈希特征,再经过哈希层得到二进制哈希吗,最后将二进制哈希码作为特征向量来进行手势检索。在保证准确率的前提下,提高手势检索的效率。

    一种基于数据增强的车辆图像检索方法

    公开(公告)号:CN111694977A

    公开(公告)日:2020-09-22

    申请号:CN202010532683.0

    申请日:2020-06-12

    Abstract: 本发明公开了一种基于数据增强的车辆图像检索方法,该方法是使用多尺度Retinex算法对现有的公开车辆图像数据进行数据增强,得到一个大规模车辆图像数据集;其次,使用卷积神经网络构建车辆图像检索模型并在增强后的数据集上进行训练,同时采用迁移学习的方法缩短模型的训练周期;最后,选择分类效果表现最好的模型作为特征提取引擎在检索测试集上进行模型评价。该方法解决了车辆图像缺乏和人为标注等带来的影响,在一定程度上可以增加模型的准确率和泛化能力。使用迁移学习的方法加快模型收敛的速度,减少训练的时间,提高车辆图像检索的准确率。

    一种融合注意力机制的深度哈希车辆图像检索方法

    公开(公告)号:CN111694974A

    公开(公告)日:2020-09-22

    申请号:CN202010532689.8

    申请日:2020-06-12

    Abstract: 本发明公开了一种融合注意力机制的深度哈希车辆图像检索方法,目的是为了提高车辆图像检索的准确率。由于数据量的增大和特征维数的增高所带来庞大计算量及获取特征向量中包含较多的干扰因素导致精确度低的问题。本发明针对该问题,引入注意力机制,提出了融合注意力机制的残差网络深度哈希模型,该模型借助注意力机制来识别车辆图像中多个目标对象的近似位置,以获得一个更为专注的特征表示。同时,本发明引入类别交叉熵损失函数来解决融入注意力机制的模型学习。

    一种基于改进VGGNet网络和PCA的静态手势识别方法

    公开(公告)号:CN111695507A

    公开(公告)日:2020-09-22

    申请号:CN202010532751.3

    申请日:2020-06-12

    Abstract: 本发明公开了一种基于改进VGGNet网络的静态手势识别方法,该方法将VGGNet网络进行改进,使用不同的分支来学习标签信息,同时在网络中引入哈希层将手势图像的特征投影到汉明空间,通过计算汉明距离来提高处理手势的效率。将改进后的VGGNet网络和传统的主成分分析方法相结合来进行手势识别,首先将原始数据集和增强后的数据集作为输入数据对VGGNet网络进行训练,得到手势图像的高维特征,然后通过主成分分析法PCA将高维图像特征进行降维,减小特征向量长度,缩短图像之间的相似性度量的计算时间,从而提高提高手势识别的精度和效率。

    基于交互学习的多模态融合机械臂控制方法

    公开(公告)号:CN115114975A

    公开(公告)日:2022-09-27

    申请号:CN202210578157.7

    申请日:2022-05-25

    Abstract: 本发明公开了一种基于交互学习的多模态融合机械臂控制方法,该方法利用深度学习相关技术对多模态信息进行分析和处理,从而使得系统可以获取用户完整且精确的意图。通过隐马尔科夫模型(HMM)对语音命令进行准确识别处理;使用动态时间规整算法(DTW)实现对动态手势识别的研究;利用基于特征融合的表情识别算法来提取表情图像特征并进行特征融合,通过对表情进行识别达到对心理状态的判定,获取其心理意图。此外,本方法以人机交互为基础,通过决策树和Q‑Learning算法学习新命令和新知识,同时利用学习到的正确信息对原有的知识进行更新,实现机械臂自身知识的智能增长,从而实现对机械臂控制的优化。

    一种基于多尺度的Retinex和改进VGGNet网络的手势图像检索方法

    公开(公告)号:CN111695508A

    公开(公告)日:2020-09-22

    申请号:CN202010532767.4

    申请日:2020-06-12

    Abstract: 本发明公开了一种基于多尺度的Retinex和改进VGGNet网络的手势图像检索方法,该方法通过多尺度的Retinex方法对手势数据图像进行增强后,对采用深度学习方法对模型进行训练。当手势图像检索模型训练好之后,将最后一个FC层提取到的特征作为图像的特征表示参与手势图像检索任务,并改进的VGGNet的多分支网络结构中引入哈希层,模型的输入为手势图像和类别标签,类别标签作为监督信息学习图像特征,每个分支学习不同的标签信息,经过全连接层将之前两个分支学习到的特征进行融合,得到非线性组合特征,然后经过哈希层将得到低维度的哈希特征,再经过哈希层得到二进制哈希吗,最后将二进制哈希码作为特征向量来进行手势检索。在保证准确率的前提下,提高手势检索的效率。

    一种基于地理区域的社交网络阻塞影响最大化方法

    公开(公告)号:CN111695043A

    公开(公告)日:2020-09-22

    申请号:CN202010547743.6

    申请日:2020-06-16

    Abstract: 本发明公开了一种基于地理区域的社交网络阻塞影响最大化方法,该方法旨在社交网络信息传播时,防止目标区域受到不良信息的影响。研究影响阻止最大化(IBM)问题,以找到积极的种子,以尽可能多地阻止负面信息的传播。利用四叉树索引结构来存储节点的位置信息,结合社交网络的地理位置信息,提出了构造最大影响外图(MIOG)近似估计被阻止的负面影响并识别出具有更大潜力的阻止负影响的节点,选择候选节点以减少要估计的节点数量,高效地阻止负面信息在区域内的传播。

Patent Agency Ranking