一种基于对抗学习损失函数的无监督域适应方法

    公开(公告)号:CN110837850B

    公开(公告)日:2022-06-21

    申请号:CN201911012806.1

    申请日:2019-10-23

    Applicant: 浙江大学

    Inventor: 陈铭浩 蔡登

    Abstract: 本发明公开了一种基于对抗学习损失函数的无监督域适应方法,包括:(1)源域图像经过特征提取网络G生成高层特征,经过分类器C与真实标签做交叉熵损失,另一方面经过域判别器D生成混淆矩阵,将伪标签纠正为真实标签。(2)目标域图像经过特征提取网络G生成高层特征,经过分类器C生成伪标签,另一方面高层特征经过域判别器D生成混淆矩阵,将伪标签纠正为相反分布。(3)让特征生成器与判别器对抗优化上述损失函数;此外对于目标域上的混淆矩阵,生成纠正标签,并作为目标域的标签,优化分类器。利用本发明,使无监督域适应中,能够对纠正伪标签的噪声,同时匹配域之间分布差异,从而提高目标域的分类精度。

    一种基于方向性全卷积网络的语义分割方法

    公开(公告)号:CN111882563B

    公开(公告)日:2022-05-27

    申请号:CN202010669134.8

    申请日:2020-07-13

    Applicant: 浙江大学

    Inventor: 武伯熹 蔡登

    Abstract: 本发明公开了一种基于方向性卷积网络的语义分割方法,包括:(1)构建一个方向性卷积的全卷积网络;(2)将构建的方向性全卷积网络的顶层加入池化层和全连接层网络,构成第一深度模型,并在在大型数据集上进行预训练;(3)提取预训练好的第一深度模型中的全卷积部分,使用全卷积层初始化方向性全卷积网络的参数,并在其后加入新的全连接层,构成第二深度模型;(4)使用图片语义分割的数据集训练第二深度模型,直到模型收敛;(5)利用训练后的第二深度模型对待测图片进行分析,预测图像中每个像素所属的类别,形成图像语义分割图输出。本发明的方法能够促进语义分割学习感知野和中心像素的联系,提升训练模型的鲁棒性。

    一种基于互补伪标签的跨域行人重识别方法

    公开(公告)号:CN112016687B

    公开(公告)日:2022-05-10

    申请号:CN202010842670.3

    申请日:2020-08-20

    Applicant: 浙江大学

    Inventor: 冯昊 蔡登

    Abstract: 本发明公开了一种基于互补伪标签的跨域行人重识别方法,包括以下步骤:(1)分别从源域数据集和目标域数据集中采样数据,使用卷积神经网络获得各自的嵌入特征表达;(2)将得到的嵌入特征表达分别存入源域缓存和目标域缓存中;(3)使用在源域数据上训练得到的图卷积神经网络获得目标域图像的邻居作为其伪标签,并存入伪标签缓存中;(4)根据邻居伪标签生成目标域图像的组伪标签;(5)使用邻居伪标签和组伪标签以及对应的损失函数共同训练模型,直到模型收敛;(6)对训练好的模型,进行行人重识别的应用。利用本发明,能够更加深入地挖掘难区分的正样本作为伪标签,提升行人重识别模型在目标域的匹配能力。

    一种基于擦除显著性区域的行人重识别方法

    公开(公告)号:CN112016661B

    公开(公告)日:2022-05-06

    申请号:CN202010842675.6

    申请日:2020-08-20

    Applicant: 浙江大学

    Inventor: 沈栋 蔡登 何晓飞

    Abstract: 本发明公开了一种基于擦除显著性区域的行人重识别方法,包括:(1)从训练数据中随机选择P个不同的人,每个人随机选取K张图片,得到P×K张图片作为一次训练数据;(2)根据图片之间的相似程度,得到图片的显著性区域;(3)根据预先设置的擦除区域和概率,擦除一定比例的显著性区域;(4)提取擦除了显著性区域的图片的特征并且利用自适应全局池化层来进行池化操作,利用该特征计算误差;(5)计算原图的特征向量,利用该特征向量计算误差;(6)结合步骤(4)和(5)得到的误差,回传梯度训练模型;(7)利用训练好的模型进行行人重识别应用。利用本发明,可以帮助模型学到更佳丰富的特征表达,提升重识别效果。

    一种面向移动端设备的障碍物检测方法

    公开(公告)号:CN111881828B

    公开(公告)日:2022-05-06

    申请号:CN202010738838.6

    申请日:2020-07-28

    Applicant: 浙江大学

    Inventor: 王闻箫 蔡登

    Abstract: 本发明公开了一种面向移动端设备的障碍物检测方法,包括:(1)选择障碍物检测模型;(2)将训练完的检测模型的识别准确率a作为因变量,模型的深度d、宽度w和图片大小r作为自变量;(3)分别对模型的深度d、宽度w和图片大小r进行剪枝,并在数据集上对模型进行微调,用函数f拟合a与d、w、r之间的关系;(4)通过优化函数求解最优的深度、宽度和图片大小(dm,wm,rm),并根据求得的(dm,wm,rm),导出对应的精简模型结构;(5)在数据集上对精简模型进行训练;(6)在移动端设备运行精简模型,实时输入周围的环境照片,进行障碍物识别。本发明使深度卷积神经网络可以满足移动端设备的流畅性要求,同时使障碍物检测具有较高的准确率。

    一种基于假设性半监督学习的开放领域问答方法

    公开(公告)号:CN108717413B

    公开(公告)日:2021-10-08

    申请号:CN201810253156.9

    申请日:2018-03-26

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于假设性半监督学习的开放领域问答方法,包括:(1)使用信息检索技术从语料库中将与问题相关的文章抽取出来;(2)假设给定问答训练集自带的文章是唯一的正标签,从语料库中抽取的所有文章都是负标签;(3)构建深度学习模型,通过训练一个文章打分器学习正标签的特征,训练一个阅读器从文章中选择正确答案;(4)进行文章相关性排序,将相关性高的前n个文章送入打分器内打分并根据分数重新标签;(5)重复步骤3和步骤4,直到模型收敛;(6)模型训练完毕,进行开放领域问答应用。利用本发明可以在不依赖额外人工标注和外部知识的情况下大幅提升现有开放领域问答系统的文章抽取质量和答案的准确率。

    一种基于解耦自适应判别性特征学习的行人重识别方法

    公开(公告)号:CN110443174B

    公开(公告)日:2021-08-10

    申请号:CN201910683172.6

    申请日:2019-07-26

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于解耦自适应判别性特征学习的行人重识别方法,包括:(1)选取已有的行人重识别模型,将模型分为特征抽取层和分类器层;(2)在训练阶段,每训练完N遍数据后对分类器层的参数进行随机初始化,特征抽取层的学习率随数据的迭代不断降低,分类器层的学习率保持不变;训练直到目标函数收敛;(3)在测试阶段,只保留特征抽取层,作为训练好的网络模型;(4)在行人检索阶段,用训练好的网络模型抽取图片库中每张图片的特征向量,将待查询行人图片特征向量和图片库中每张图片特征向量进行相似度排序并选择排序最靠前的图片的身份作为最终识别结果。利用本发明,可以很好地解决了现在行人特征学习网络优化不充分的问题。

    一种无需后处理操作的3D目标检测方法

    公开(公告)号:CN113052031A

    公开(公告)日:2021-06-29

    申请号:CN202110276978.0

    申请日:2021-03-15

    Applicant: 浙江大学

    Abstract: 本发明公开了一种无需后处理操作的3D目标检测方法,包括:(1)初始化K个3D候选框和1个物体嵌入特征;(2)对输入的点云样本进行特征提取,得到点特征;(3)在点特征上提取K个3D候选框特征;(4)使用物体嵌入特征对3D候选框特征进行筛选和提取,得到K个特征;(5)使用自注意力模型让K个特征交换特征信息,得到K个提议特征;(6)根据提议特征预测K个预测结果,并与标注信息一对一匹配后训练;(7)用步骤(6)预测的K个预测结果的3D候选框替代步骤(1)的K个3D候选框,用步骤(5)得到的特征提议替代步骤(1)的物体嵌入;重复步骤(3)~(7)多次得到检测结果。本发明可以解决现有3D目标检测器存在冗余预测的问题。

    一种基于循环空间转换网络的人脸漫画生成方法

    公开(公告)号:CN110415308B

    公开(公告)日:2021-03-05

    申请号:CN201910542411.6

    申请日:2019-06-21

    Applicant: 浙江大学

    Inventor: 储文青 蔡登

    Abstract: 本发明公开了一种基于循环空间转换网络的人脸漫画生成方法,包括:(1)选择训练数据集,分析数据集中的照片和人脸漫画部分,获取人脸的关键点信息;(2)根据人脸的关键点信息,建立基于循环空间转换网络的空间转换模型;(3)对空间转换模型进行训练和测试;(4)建立照片和人脸漫画之间的纹理转换模型,并进行训练优化;(5)将待转换的照片输入训练好的空间转换模型,并将空间转换结果送入纹理转换模型,最终得到高质量的人脸漫画。利用本发明,可以使得生成的人脸漫画不仅在几何结构上具有夸张化的效果,同时在纹理色彩上也具有艺术化的风格,极大地提升了美观性和趣味性。

    一种基于集成知识蒸馏的图像分类方法

    公开(公告)号:CN112199535A

    公开(公告)日:2021-01-08

    申请号:CN202011058365.1

    申请日:2020-09-30

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于集成知识蒸馏的图像分类方法,包括以下步骤:(1)预训练教师模型,将教师模型的训练过程分为三个阶段,从每个阶段中取出一个最好的教师模型,得到3个教师模型T1、T2和T3;(2)训练学生模型,将学生模型的训练过程划分为三个阶段,每个阶段用得到的三个教师模型来联合指导学生模型;其中,T3在每个阶段的权重保持不变;T1在第一阶段权重最大,T2在第二阶段权重最大;(3)使用训练好的学生模型进行图片分类任务,输入待分类图片,进行分类预测。利用本发明,使得学生模型从教师模型中学习知识变得简单,从而进一步提高学生模型的性能,在提高模型响应速度的同时保证图像分类的精度。

Patent Agency Ranking