一种基于边界框角点对齐和边界匹配的目标检测方法

    公开(公告)号:CN112016605A

    公开(公告)日:2020-12-01

    申请号:CN202010837568.4

    申请日:2020-08-19

    Applicant: 浙江大学

    Inventor: 郑途 蔡登 刘子立

    Abstract: 本发明公开了一种基于边界框角点对齐和边界匹配的目标检测方法,包括以下步骤:(1)获取真实场景图片,标注目标物体的类别和边界框位置,构成训练数据集;(2)将训练数据集中的图片输入检测模型,获得图片中物体的预测类别分布和预测边界框位置;(3)构建损失函数,分别计算物体的分类损失和边界框的定位损失;(4)优化上述分类损失和定位损失的损失函数,选择训练数据集中的图片,重复步骤(2)和(3),达到预设训练次数后结束训练;(5)检测模型训练完毕,选择待检测的图片输入模型,得到目标的类别和边界框位置。利用本发明,可以使得网络注重对重合度比较低的边界框的学习,提升整体检测精度。

    一种基于机器阅读到序列模型的迁移学习方法

    公开(公告)号:CN109508457B

    公开(公告)日:2020-05-29

    申请号:CN201811284309.2

    申请日:2018-10-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于机器阅读到序列模型的迁移学习方法,包括以下步骤:(1)预训练一个机器阅读模型,所述机器阅读模型包含基于循环神经网络的编码层和模型层;(2)建立一个序列模型,所述序列模型包含基于循环神经网络的编码器和解码器;(3)提取训练好的机器阅读模型中编码层和模型层的参数,迁移到待训练的序列模型中,作为训练序列模型时的部分初始化参数;(4)训练序列模型,直到模型收敛;(5)使用训练好的序列模型进行文本序列预测任务。利用本发明,能够更加深入地挖掘文本蕴含信息,提升生成文本序列的质量。

    一种基于对抗学习损失函数的无监督域适应方法

    公开(公告)号:CN110837850A

    公开(公告)日:2020-02-25

    申请号:CN201911012806.1

    申请日:2019-10-23

    Applicant: 浙江大学

    Inventor: 陈铭浩 蔡登

    Abstract: 本发明公开了一种基于对抗学习损失函数的无监督域适应方法,包括:(1)源域图像经过特征提取网络G生成高层特征,经过分类器C与真实标签做交叉熵损失,另一方面经过域判别器D生成混淆矩阵,将伪标签纠正为真实标签。(2)目标域图像经过特征提取网络G生成高层特征,经过分类器C生成伪标签,另一方面高层特征经过域判别器D生成混淆矩阵,将伪标签纠正为相反分布。(3)让特征生成器与判别器对抗优化上述损失函数;此外对于目标域上的混淆矩阵,生成纠正标签,并作为目标域的标签,优化分类器。利用本发明,使无监督域适应中,能够对纠正伪标签的噪声,同时匹配域之间分布差异,从而提高目标域的分类精度。

    一种基于神经主题模型的长文本生成方法

    公开(公告)号:CN110457483A

    公开(公告)日:2019-11-15

    申请号:CN201910542965.6

    申请日:2019-06-21

    Applicant: 浙江大学

    Inventor: 潘博远 蔡登 赵洲

    Abstract: 本发明公开了一种基于神经主题模型的长文本生成方法,包括:(1)利用长文本训练集对神经主题模型进行训练,每篇文章分解为一个对应的低维主题分布和一个公用的解码器;(2)使用步骤(1)中的低维主题分布作为标签训练一个多层感知机,使用训练完的多层感知机将短文本映射到主题分布;(3)使用步骤(1)得到的解码器对步骤(2)中得到的主题分布解码,得到高维的词分布;(4)训练一个语言模型,以短文本作为初始输入,从步骤(3)得到的词分布中采样出一定数量的主题词;(5)将短文本与步骤(4)中得到的主题词合并,输入一个通用的文本生成模型框架,输出长文本。利用本发明,大大提升了在大规模数据集上进行长文本生成的质量。

    一种基于最大二乘损失的无监督域适应语义分割方法

    公开(公告)号:CN110222690A

    公开(公告)日:2019-09-10

    申请号:CN201910353614.0

    申请日:2019-04-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于最大二乘损失的无监督域适应语义分割方法,包括:(1)在源域上预训练语义分割模型,所述语义分割模型基于ResNet网络;(2)同时提取语义分割模型中第四层的特征,加入一个额外的分类网络,对该网络分支进行同样的预训练;(3)在源域上有监督地训练语义分割模型,同时在目标域上使用最大二乘损失无监督地训练语义分割模型;(4)在目标域,使用ResNet网络最后一层的输出作为伪标签,无监督地训练第四层特征;(5)模型训练完毕,在目标域上对图片输出它的语义分割图。利用本发明,使无监督域适应的语义分割效果中,能够对难训练样本和小物体类别得到更多的训练,提高最后目标域上的语义分割质量。

    一种基于频繁项集的多标签分类方法

    公开(公告)号:CN109993231A

    公开(公告)日:2019-07-09

    申请号:CN201910270473.6

    申请日:2019-04-04

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于频繁项集的多标签分类方法,包括以下步骤:(1)在原始数据集上使用频繁项集挖掘算法挖掘出标签的频繁项集;(2)利用挖掘的频繁项集扩充原始数据集的标签空间,得到增强标签空间;(3)在增强标签空间中训练多标签分类器;(4)对于待测试样本,使用训练得到的多标签分类器预测其在增强标签空间中的增强标签;(5)对增强标签进行解码,得到待测试样本的最终标签。利用本发明,可以自动地挖掘出存在于多标签中的频繁项集,而这些频繁项集显式地包含了很强的高阶信息。因此,本方法可以有效地利用多标签数据中的高阶相关信息以进行多标签分类。

    一种基于高级语义的文本摘要生成方法

    公开(公告)号:CN109992775A

    公开(公告)日:2019-07-09

    申请号:CN201910227914.4

    申请日:2019-03-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于高级语义的文本摘要生成方法,包括:(1)将文本语料进行分词并转化为与词汇一一对应的语义标签序列;(2)在文本摘要模型上,使用双向循环网络作为编码器对词汇序列和语义标签序列进行编码,得到词汇上的抽象表征和语义上的抽象表征;(3)将词汇上的抽象表征和语义上的抽象表征进行合并;(4)将合并后的抽象表征送入解码器,分别计算词汇注意力权重和语义注意力权重,同时预测序列每一步在词表上的概率分布;(5)将注意力权重分布和词表概率分布合并,得到最终的输出概率分布,将最终的概率分布转化为可读的词汇,并串连成句进行输出。本发明可以提高模型在预测低频词以及进行无标签数据上的文本摘要的准确率。

    一种基于语言模型和强化学习的关键词问答方法

    公开(公告)号:CN109992669A

    公开(公告)日:2019-07-09

    申请号:CN201910274243.7

    申请日:2019-04-08

    Applicant: 浙江大学

    Inventor: 潘博远 蔡登

    Abstract: 本发明公开了一种基于语言模型和强化学习的关键词问答方法,包括以下步骤:(1)用关键词问题句和自然语言问题句的混合数据集来训练一个关键词问题分类器;(2)在自然语言问题句的数据集上预训练一个语言模型;(3)将步骤(2)中的语言模型高层网络提取,并用关键词问题句和其对应的自然语言问题句来训练一个含语言模型网络的问题重构模型来重构由步骤(1)判断为关键词问题句的问题;(4)将重构的问题句送入一个训练好的问答模型中,得到答案;(5)利用强化学习,以步骤(4)中预测答案和标准答案的相似度作为奖励函数来优化步骤(3)中的重构模型。利用本发明,可以大大提升了在大规模数据集上关键词问答任务的准确率。

    一种基于强化双通道序列学习的对话回复生成方法及系统

    公开(公告)号:CN108763504A

    公开(公告)日:2018-11-06

    申请号:CN201810539095.2

    申请日:2018-05-30

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于强化双通道序列学习的对话回复生成方法及系统,本发明方法的步骤如下:(1)对上下文进行建模,获取上下文语义向量;(2)利用编码器将当前对话和上下文语义向量结合学习,得到当前对话向量以及编码器向量;(3)将上下文语义向量和当前对话向量输入解码器,得到第一通道对话回复草稿以及解码器向量;(4)将编码器向量与解码器向量以及第一通道对话回复草稿输入润饰器进行润饰,生成第二通道经过润饰的对话回复;(5)利用强化学习算法优化目标函数;(6)模型训练完毕,生成对话回复并输出。利用本发明,可以使对话生成模型对全局信息的把握更加深入,生成更加符合对话场景的有实质性内容的回复。

    一种基于假设性半监督学习的开放领域问答方法

    公开(公告)号:CN108717413A

    公开(公告)日:2018-10-30

    申请号:CN201810253156.9

    申请日:2018-03-26

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于假设性半监督学习的开放领域问答方法,包括:(1)使用信息检索技术从语料库中将与问题相关的文章抽取出来;(2)假设给定问答训练集自带的文章是唯一的正标签,从语料库中抽取的所有文章都是负标签;(3)构建深度学习模型,通过训练一个文章打分器学习正标签的特征,训练一个阅读器从文章中选择正确答案;(4)进行文章相关性排序,将相关性高的前n个文章送入打分器内打分并根据分数重新标签;(5)重复步骤3和步骤4,直到模型收敛;(6)模型训练完毕,进行开放领域问答应用。利用本发明可以在不依赖额外人工标注和外部知识的情况下大幅提升现有开放领域问答系统的文章抽取质量和答案的准确率。

Patent Agency Ranking