-
公开(公告)号:CN109543672A
公开(公告)日:2019-03-29
申请号:CN201811197745.6
申请日:2018-10-15
Applicant: 天津大学
Abstract: 本发明涉及一种基于稠密特征金字塔网络的物体检测方法,包括下列步骤:确定基础网络架构,用于从输入图像中提取不同语义级别的深度特征,不同卷积块输出的特征图分辨率从下到上由逐渐降低。设计稠密连接网络部分,利用自上而下的跨层连接稠密地生成具有高级语义的特征图,将基础网络中最后输出的低分率特征图逐渐双线性差值上采样,使其与基础网络中所有卷积块中所有卷积层一一对用,并将其与基础网络中对应的特征图进行相加,最终得到若干高级语义且分辨率不同的特征图。设计细尺度预测部分,利用具有不同感受野的特征图分别提取不同尺度的候选检测窗口。输出物体检测结果。
-
公开(公告)号:CN109522930A
公开(公告)日:2019-03-26
申请号:CN201811208037.8
申请日:2018-10-17
Applicant: 天津大学
IPC: G06K9/62
Abstract: 本发明涉及一种基于遮挡类型预测的深度学习物体检测方法,包括:收集包含多种不同类别物体的图像,并标注每张图像中的所有感兴趣物体;设计基于遮挡类型预测的深度学习物体检测算法,用以有效实现物体检测,根据得到的候选检测框,使用候选区域池化层,将每一个候选检测框对应的特征图裁剪到同一大小,遮挡类别分类网络连接在这一特征上,由两个全连接层,和一个逻辑回归层组成,预测每一个候选检测框的遮挡类别;根据遮挡类别分类网络的结果,不同遮挡类别的物体将会使用对应的物体检测网络,物体检测网络由两个全连接层和逻辑回归层,预测每一个候选检测框的类别和位置;模型训练。
-
公开(公告)号:CN109325534A
公开(公告)日:2019-02-12
申请号:CN201811111230.X
申请日:2018-09-22
Applicant: 天津大学
Abstract: 本发明涉及一种基于双向多尺度金字塔的语义分割方法,包含:收集训练图像;设计基于双向多尺度金字塔的深度卷积神经网络结构以适用于语义分割;设计该网络的主干子网络,用以提取图像的基础特征;设计自下而上的多尺度金字塔模块;设计自上而下的多尺度金字塔模块;将自下而上的多尺度金字塔提取的特征与自上而下的多尺度金字塔提取的特征进行融合;基于融合的特征,卷积得到最终的分割结果。输入数据进行训练;将训练好的模型应用于实际任务中,通过训练好的模型,前向计算预测并输出分割的结果,并辅助实际场景中的决策。
-
公开(公告)号:CN108960069A
公开(公告)日:2018-12-07
申请号:CN201810567939.4
申请日:2018-06-05
Applicant: 天津大学
CPC classification number: G06K9/00671 , G06N3/0454 , G06N3/084
Abstract: 本发明涉及一种用于单阶段物体检测器的增强上下文的方法:选定物体检测的训练数据集;构建单阶段物体检测器,主要包含两部分:提取特征的主干网络和用于分类和检测框回归的子网络,主干网络选取ResNet50网络,针对分类和和检测框回归的子网络进行改进,设计基于增强上下文方法的分类子网络以及检测器回归的子网络,分类子网络和检测框回归子网络采用相同的设计:由三个膨胀率不同的卷积滤波器构成一个子模块,然后堆叠两个子模块构成子网络;采用多任务的损失函数;训练。
-
公开(公告)号:CN107506822A
公开(公告)日:2017-12-22
申请号:CN201710619831.0
申请日:2017-07-26
Applicant: 天津大学
Abstract: 本发明涉及一种基于空间融合池化的深度神经网络方法,用于图像分类,包括:收集各种不同类别的图像,并标注图像类别,作为图像标签信息;图像集划分;将收集的图像划分为训练集,验证集和测试集,训练集用于训练卷积神经网络;设计应用于图像分类的深度神经网络结构,包括所用的卷积层层数和空间融合池化层的层数,设计卷积层中滤波器的个数,设计空间融合池化层的中的融合函数形式和空间滑动步长和池化函数和池化窗口尺寸以及步长,设计用于特征融合的卷积滤波器结构,设计网络训练循环迭代的次数和网络最终收敛条件,并初始化网络参数;将训练数据批量的输入到该网络中,进行计算和训练。
-
-
公开(公告)号:CN103778594B
公开(公告)日:2017-01-25
申请号:CN201410021126.7
申请日:2014-01-16
Applicant: 天津大学
Abstract: 本发明属于本发明涉及彩色数码照片的自动修复技术领域,涉及一种基于闪光灯非闪光灯图像对的红眼检测方法,包括:将输入的一组闪光灯彩色图像FL和非闪光彩色图像NF由RGB空间转换到CIELAB颜色空间并进行预处理;基于L*分量进行图像配准;在CIELAB空间进行肤色检测;使用a*分量和b*分量度量闪光灯彩色图像和非闪光彩色图像的红眼区域像素点的饱和度值,得到两图像饱和度的差别;确定候选红眼区域;去除干扰区域;确定红眼区域。本发明可以利用闪光灯/非闪光灯照片组,引入图像配准环节,并综合使用颜色和饱和度特征,快速准确检测并定位闪光灯图像中的红眼区域。
-
公开(公告)号:CN106339725A
公开(公告)日:2017-01-18
申请号:CN201610782331.4
申请日:2016-08-31
Applicant: 天津大学
IPC: G06K9/62
CPC classification number: G06K9/6201
Abstract: 本发明涉及一种基于尺度不变特征和位置先验的行人检测方法,包括:采集行人正例训练样本窗口,获取正例样本窗口的高度H与窗口底端的纵坐标Y;利用支持向量机SVM训练高度信息关于窗口坐标的回归模型,采用径向基核函数;采集大量行人的正例样本和负例样本,计算图像特征通道的相对差分特征,训练AdaBoost分类模型;采用AdaBoost模型进行行人检测,在检测结果中,获取检测窗口的高度为,窗口底端纵向坐标为,采用回归模型,预测窗口底端位置为时的窗口高度;判断是否有行人存在。本发明提高了行人检测的性能。
-
公开(公告)号:CN104933029A
公开(公告)日:2015-09-23
申请号:CN201510350978.5
申请日:2015-06-23
Applicant: 天津大学
IPC: G06F17/27
Abstract: 本发明提供一种基于概率主题模型的文本图像联合语义分析方法,包括:采集大量包含图像的文本,对文本和图像进行适当的处理,按图像文本一对一组成图像-文本pairs数据库;利用这些样本训练得到用于文本图像语义分析的联合主题分布模型;对于输入的待分析图像,提取视觉特征词汇;对图像及其视觉词汇应用PLSA模型,结合文本图像联合主题分布,得到待分析图像的主题语义;将上一步得到的主题语义与图像-文本pairs数据库中的文本的主题进行匹配,选取最佳的匹配文本;对于得到的匹配文本,结合输入图像进行语义评价。本发明能够得到除了直观的场景物体信息之外的更多语义知识。
-
公开(公告)号:CN103942565A
公开(公告)日:2014-07-23
申请号:CN201410145293.2
申请日:2014-04-11
Applicant: 天津大学
IPC: G06K9/62
Abstract: 本发明涉及一种基于迭代二分级联分类器的快速物体检测方法,首先,通过AdaBoost算法得到初始的强分类器;其次,以最小化计算消耗量为目标函数,不断迭代二分初始的强分类,当相邻两次迭代二分过程中分类器的计算消耗量差的绝对值小于给定的阈值时停止迭代,此时二分形成的级联分类器便是一个计算消耗量最小的全局最优级联分类器;最后,利用该级联分类器在图像或视频中进行物体检测。本发明提出的物体检测方法,能够在保证物体检测系统的检测性能不变的前提下,通过最小化计算消耗量,实现快速物体检测。
-
-
-
-
-
-
-
-
-