一种基于自激励判别性特征学习的行人重识别方法

    公开(公告)号:CN110163117B

    公开(公告)日:2021-03-05

    申请号:CN201910348620.7

    申请日:2019-04-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于自激励判别性特征学习的行人重识别方法,包括:(1)选取一个行人重识别网络,在该原始网络上添加一个负分支;(2)在训练阶段,原始网络产生分类损失函数,原始网络和负分支之间产生对抗损失函数和互斥响应项,一起构成目标函数,并利用随机梯度下降方法对整个网络进行优化;(3)在测试阶段,移除负分支,只保留原始网络在分类器之前的部分,作为训练好的网络模型,并输入行人图片进行抽取特征向量测试;(4)在行人检索阶段,利用训练好的网络模型抽取图片库中每张图片的特征向量,选择与待查询行人图片的特征向量相似度最高的图片的身份作为最终识别结果。利用本发明,可以提升现有行人重识别网络的效果。

    一种使用多层注意力网络机制解决视频问答的方法

    公开(公告)号:CN107766447B

    公开(公告)日:2021-01-12

    申请号:CN201710874931.8

    申请日:2017-09-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种利用多层注意力网络机制解决视频问答的方法。主要包括如下步骤:1)针对于一组视频,利用预训练好的卷积神经网络,获得帧级别及分段级别视频表达。2)使用问题单词级别的注意力网络机制,得到针对问题单词级别的帧级别及分段级别视频表达。3)使用问题级别的时间注意力机制,得到与问题相关的帧级别及分段级别视频表达。4)利用问题级别的融合注意力网络机制,得到问题相关的联合视频表达。5)利用所得联合视频表达,获取针对视频所问问题答案。相比于一般视频问答解决方案,本发明利用多层注意力机制,能够更准确地反映视频和问题特性,产生更加符合的答案。本发明在视频问答中所取得的效果相比于传统方法更好。

    一种文本引导的图像修复方法和系统

    公开(公告)号:CN111861945B

    公开(公告)日:2020-12-18

    申请号:CN202010993094.2

    申请日:2020-09-21

    Applicant: 浙江大学

    Abstract: 本发明公开了一种文本引导的图像修复技术方法和系统,属于计算机视觉的图像修复领域。主要包括如下步骤:1)针对于一组图像、引导文本训练集,通过一个由粗到精的图像修复模块,学习图像信息与文本信息的联合表征并生成合理的修复图像。2)对于图像修复模块生成的图像,通过一个文本重构模块,学习修复图像与引导文本间的语义相关性,推测引导文本的蒙版部分。本发明采用引导文本指导模型生成语义一致,视觉连贯且可控的图像,采用一个由粗到细的跨模态生成网络以及一种新型监督信号指导模型逐步修复图像,采用一个文本重构模块指导模型根据生成的修复图像对引导文本的蒙版部分进行预测,提高视觉文本一致性。

    一种基于互补伪标签的跨域行人重识别方法

    公开(公告)号:CN112016687A

    公开(公告)日:2020-12-01

    申请号:CN202010842670.3

    申请日:2020-08-20

    Applicant: 浙江大学

    Inventor: 冯昊 蔡登

    Abstract: 本发明公开了一种基于互补伪标签的跨域行人重识别方法,包括以下步骤:(1)分别从源域数据集和目标域数据集中采样数据,使用卷积神经网络获得各自的嵌入特征表达;(2)将得到的嵌入特征表达分别存入源域缓存和目标域缓存中;(3)使用在源域数据上训练得到的图卷积神经网络获得目标域图像的邻居作为其伪标签,并存入伪标签缓存中;(4)根据邻居伪标签生成目标域图像的组伪标签;(5)使用邻居伪标签和组伪标签以及对应的损失函数共同训练模型,直到模型收敛;(6)对训练好的模型,进行行人重识别的应用。利用本发明,能够更加深入地挖掘难区分的正样本作为伪标签,提升行人重识别模型在目标域的匹配能力。

    一种基于擦除显著性区域的行人重识别方法

    公开(公告)号:CN112016661A

    公开(公告)日:2020-12-01

    申请号:CN202010842675.6

    申请日:2020-08-20

    Applicant: 浙江大学

    Inventor: 沈栋 蔡登 何晓飞

    Abstract: 本发明公开了一种基于擦除显著性区域的行人重识别方法,包括:(1)从训练数据中随机选择P个不同的人,每个人随机选取K张图片,得到P×K张图片作为一次训练数据;(2)根据图片之间的相似程度,得到图片的显著性区域;(3)根据预先设置的擦除区域和概率,擦除一定比例的显著性区域;(4)提取擦除了显著性区域的图片的特征并且利用自适应全局池化层来进行池化操作,利用该特征计算误差;(5)计算原图的特征向量,利用该特征向量计算误差;(6)结合步骤(4)和(5)得到的误差,回传梯度训练模型;(7)利用训练好的模型进行行人重识别应用。利用本发明,可以帮助模型学到更佳丰富的特征表达,提升重识别效果。

    一种基于方向性卷积网络的语义分割方法

    公开(公告)号:CN111882563A

    公开(公告)日:2020-11-03

    申请号:CN202010669134.8

    申请日:2020-07-13

    Applicant: 浙江大学

    Inventor: 武伯熹 蔡登

    Abstract: 本发明公开了一种基于方向性卷积网络的语义分割方法,包括:(1)构建一个方向性卷积的全卷积网络;(2)将构建的方向性全卷积网络的顶层加入池化层和全连接层网络,构成第一深度模型,并在在大型数据集上进行预训练;(3)提取预训练好的第一深度模型中的全卷积部分,使用全卷积层初始化方向性全卷积网络的参数,并在其后加入新的全连接层,构成第二深度模型;(4)使用图片语义分割的数据集训练第二深度模型,直到模型收敛;(5)利用训练后的第二深度模型对待测图片进行分析,预测图像中每个像素所属的类别,形成图像语义分割图输出。本发明的方法能够促进语义分割学习感知野和中心像素的联系,提升训练模型的鲁棒性。

    一种基于时间分配和强化学习的交通信号灯控制方法

    公开(公告)号:CN110164150B

    公开(公告)日:2020-07-24

    申请号:CN201910496635.8

    申请日:2019-06-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于时间分配和强化学习的交通信号灯控制方法,包括:(1)配置仿真路口环境以及车流数据到交通模拟器,搭建智能体网络;(2)智能体网络根据路况状态产生下一信号周期的动作,并交由交通模拟器仿真一个信号周期;(3)把上一信号周期的经验存到重演缓存;(4)从重演缓存中采样经验训练智能体网络,并判断仿真的步数是否达到预设值,如果没有达到,则返回步骤(2),否则执行下一步;(5)重置交通模拟器并对智能体网络进行测试,完成测试后进行交通信号灯控制的应用。利用本发明,可以显著提升交通效率,能更容易地应用到实际道路上。

    一种基于对偶图框架的全量交通预测方法

    公开(公告)号:CN110717627A

    公开(公告)日:2020-01-21

    申请号:CN201910934228.0

    申请日:2019-09-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于对偶图框架的全量交通预测方法,包括:(1)将路网结构表示为拓扑图,将路口作为节点,将连接路口的路段作为边;准备历史的边、节点数据以及未来的边、节点数据;(2)构造历史信息编码器,将历史数据输入到编码器中,通过多层的对偶映射,实现边和节点之间的信息传递,将多层对偶映射的输出拼接为历史特征张量;(3)构造未来预测解码器,将历史特征张量解码成未来时空特征,输出未来预测结果;(4)将预测结果和实际数据之间的误差作为损失函数来进行模型训练,直到损失函数收敛;(5)用训练好的模型,进行模型测试,测试完毕后进行应用。本发明的预测结果能够得到未来交通状况的全量完整描述,预测准确度高。

    一种基于主动学习解决商品冷启动问题的推荐方法

    公开(公告)号:CN106127506B

    公开(公告)日:2019-12-17

    申请号:CN201610422332.8

    申请日:2016-06-13

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于主动学习解决商品冷启动问题的推荐方法,包括:步骤1,构建用户对商品的评分模型,通过用户对商品的历史评分数据和商品的属性特征对该模型进行预训练;步骤2,对于一个新商品,使用步骤1的评分模型估计出不同用户对该商品是否会评分,以及评多少分;步骤3,根据步骤2的结果,挑选用户对新商品进行评分,得到新商品上的评分数据;步骤4,利用新商品的评分数据对步骤1的评分模型进行再训练;步骤5,利用再训练的评分模型预测未挑选用户对新商品的评分,并根据该评分进行商品推荐。本发明同时考虑每个用户的用户体验,一定程度上保证挑选策略的公平性,充分利用有限的用户资源,有效的将商品推荐给用户。

    一种基于最大化区域互信息的语义分割方法

    公开(公告)号:CN110472653A

    公开(公告)日:2019-11-19

    申请号:CN201910585061.1

    申请日:2019-07-01

    Applicant: 浙江大学

    Inventor: 赵帅 蔡登 王阳

    Abstract: 本发明公开了一种基于最大化区域互信息的语义分割方法,包括:(1)将真实场景图片输入分割模型,获得预测分割图片;(2)构造预测图片与标签图片的高维分布;(3)计算给定预测图片高维分布的情况下,标签图片高维分布的后验方差的近似值;(4)计算预测图片和标签图片的两个高维分布的互信息的下界;(5)根据得到的互信息的下界,更新分割模型的权重参数,最大化两个高维分布的互信息以最大化预测图片和标签图片的相似性;(6)重复上述步骤(1)至步骤(5),达到预设训练次数后结束训练,并将训练完毕的模型进行语义分割的应用。本发明通过最大化模型分割图片和标签图片间的区域互信息,可以增强分割模型的分割效果。

Patent Agency Ranking