一种跨模态图文检索方法

    公开(公告)号:CN110457516A

    公开(公告)日:2019-11-15

    申请号:CN201910741822.8

    申请日:2019-08-12

    Abstract: 本发明公开了一种基于栈式跨模态自编码器的跨模态图文检索方法,其主要目的是提高跨模态图文检索的精确度。首先,对图像和文本数据进行预处理,得到图像特征和文本特征,再通过两层受限玻尔兹曼机,提取单模态表示;其次,通过构建深层次的栈式跨模态自编码器,挖掘模态间的相关性;最终,训练模型并得到模型文件,在验证集上完成跨模态图文检索任务。本发明在实现了图文检索中常用的两种检索任务(以图检文和以文检图)的基础上,还能实现输入一种模态数据返回多种模态数据,在三个跨模态图文检索数据集上提升了模型检索精确度和泛化能力。

    基于深度学习的手部关键点检测方法

    公开(公告)号:CN110222558A

    公开(公告)日:2019-09-10

    申请号:CN201910325729.9

    申请日:2019-04-22

    Abstract: 本发明公开了一种基于深度学习的手部关键点检测方法,所述方法包括了CPMs卷积神经网络和GoogLeNet神经网络模型。所述CPMs卷积神经网络中,保留stage1中的数据层和最后七个卷积层,将stage1中的其他层剔除掉。所述GoogLeNet神经网络模型中,选用其前13网络层,并删除其中的数据层和inception(3b)后面的max pool层。将所述CPMs卷积神经网络和所述GoogLeNet神经网络模型结合起来,修改每一层的bottom属性、top属性的名称,使得层与层之间能够链接起来。本发明改进了网络模型结构,提高了关键点检测的准确度和减小了模型训练的代价(训练时间等),减少了模型参数得以加快检测速度。

Patent Agency Ranking