一种基于距离变换标签的密集群体计数及定位方法

    公开(公告)号:CN111062280B

    公开(公告)日:2022-04-26

    申请号:CN201911232008.X

    申请日:2019-12-05

    Abstract: 本发明公开了一种基于距离变换标签的密集群体计数及定位方法。本发明提出了一种新颖的真实标签生成方式,将该真实标签称为Distance label map,通过Distance label map,只需要统计出局部最小值区域个数即可获得估算人数,除此之外,计算局部最小值区域的中心坐标即可获得预测人头的具体位置信息。特征提取采用特征金字塔网络,将图片输入网络中得到多个不同的融合特征,并与真实标签计算损失并求和,本发明提出了一种新的计算损失的函数,称之为自适应交叉熵,能够利用像素点的标签表示了该像素点离它最近像素点的距离信息对传统的交叉熵进行加权改进。本发明相较于之前的群体计数的相关工作,能在确保计数准确性的同时提供每个人头的定位信息。

    一种基于方向超像素的快速图像分割方法

    公开(公告)号:CN110992379B

    公开(公告)日:2022-04-19

    申请号:CN201911232075.1

    申请日:2019-12-05

    Abstract: 本发明公开了一种基于方向超像素的快速图像分割方法。与传统的基于聚类、分水岭、主动轮廓模型或图模型的分割方法相比,该方法的分割性能平均提高了100%。同时与之前一些通过卷积神经网络预测边缘加上耗时的后处理的分割方法相比,该方法可实时运行,速度是这些分割方法的18倍以上。首先,通过卷积神经网络在每个像素位置上预测一个二维向量,该向量的方向为从距离当前像素最近的边缘指向当前点。然后,根据每个位置预测的方向,得到基于方向的超像素图。在超像素图的基础上,构建区域关系图,最后使用定制的快速融合方法得到分割结果。该方法在图像分割的速度和精度的平衡上取得了很好的效果,实现简单,具有很广的实际应用范围。

    一种基于语义分割类内特征差异性的知识蒸馏方法

    公开(公告)号:CN111062951B

    公开(公告)日:2022-03-25

    申请号:CN201911277549.4

    申请日:2019-12-11

    Abstract: 本发明公开了一种基于语义分割类内特征差异性的知识蒸馏方法,目的是将复杂模型(教师模型)学到的暗知识迁移到精简模型(学生模型),从而在提升语义分割模型的准确度的同时保持其速度。首先,分别通过教师模型和学生模型得到卷积特征;然后,通过掩膜指导的平均池化操作得到各个类别中心的特征图并由此计算各个像素点与其对应的类别中心的特征相似性,得到类内特征差异图;最后,使学生模型的类内特征差异图与教师模型对齐,以达到提升学生模型准确度的目的。本发明提出的蒸馏方法相对于现有技术思路新颖,得到的语义分割模型在准确度和速度方面都取得了良好的效果,同时该方法可以方便地和其他相关技术结合,有很强的实际应用价值。

    一种训练模型以及字符检测的方法及装置

    公开(公告)号:CN113205095A

    公开(公告)日:2021-08-03

    申请号:CN202110392490.4

    申请日:2021-04-13

    Abstract: 本说明书公开了一种训练模型以及字符检测的方法及装置。基于合成训练样本对标注模型进行训练,根据训练后的标注模型的输出对真实训练样本进行标注,并根据合成训练样本对字符检测模型进行训练。通过训练后的字符检测模型对待检测的图像进行特征提取,并确定该图像中各字符的包围框以及该图像中的各中心线。以及根据各中心线与各包围框的重叠程度、与同一中心线重叠的各包围框,确定包围框组,并根据各包围框组中各包围框的几何位置特征,对各中心线向周围进行膨胀得到各膨胀包围框,作为该图像的字符检测结果。可通过训练得到的字符检测模型输出准确的包围框以及中心线,以确定出准确的膨胀包围框,作为字符检测结果。

    文字识别方法、装置、终端及其计算机存储介质

    公开(公告)号:CN113033249A

    公开(公告)日:2021-06-25

    申请号:CN201911253120.1

    申请日:2019-12-09

    Abstract: 本申请公开了一种文字识别方法、装置、终端及其计算机存储介质,通过卷积神经网络对输入的图片进行特征提取,然后输入具有多个通道的注意力机制模块,得到每个通道的注意力权重,并对深度特征图的每个通道进行缩放获得多个注意力特征图,然后输入全连接层进行特征融合后得到字符类别预测结果,训练模型时还根据输入图片的字符类别标注和字符类别预测结果设计损失函数,优化所述注意力权重,从而提高文字识别的准确性,对于困难样本的识别鲁棒性更强。

    一种基于尺度上下文回归的目标追踪与跟随方法

    公开(公告)号:CN111445497B

    公开(公告)日:2021-03-30

    申请号:CN202010117523.X

    申请日:2020-02-25

    Abstract: 本发明公开了一种基于尺度上下文回归的目标追踪与跟随方法,包括:通过单目摄像机采集图片,用户通过在待跟随目标上设置一个标识物体所在图像区域的矩形包围盒来初始化追踪过程;使用尺度上下文回归模型进行目标追踪,获取目标位置和尺度;使用基于局部块的追踪目标质量评估方法,判断是否发生目标丢失并及时的进行重检测;建立跟随者自身与待跟随目标的相对位置关系,同时基于此相对位置关系调整跟随者自身位姿。本发明在目标跟随过程中,增强系统判别与待跟随目标具有相似语义干扰物的能力,通过后处理使系统能够判断目标是否丢失并及时进行重检测,建立自身与目标的相对位置关系,最后调整自身位姿进行跟随。

    卷积神经网络模型的训练方法及装置

    公开(公告)号:CN106156807B

    公开(公告)日:2020-06-02

    申请号:CN201510154027.0

    申请日:2015-04-02

    Abstract: 本发明公开一种CNN模型的训练方法及装置,属于图像识别领域。包括:对训练图像分别进行卷积操作、最大池化操作和水平池化操作,得到第二特征图像;根据第二特征图像确定特征向量;对特征向量进行处理得到类别概率向量;根据类别概率向量及初始类别计算类别误差;基于类别误差调整模型参数;基于调整的模型参数,继续模型参数调整过程,将迭代次数达到预设次数时的模型参数作为训练好的CNN模型的模型参数。通过在各级卷积层上对训练图像进行卷积操作和最大池化操作后,进行水平池化操作。由于水平池化操作能从特征图像中提取标识图像水平方向特征的特征图像,确保训练好的CNN模型能识别任意尺寸的图像,扩大了训练好的CNN模型在识别图像时的适用范围。

    一种基于语义分割类内特征差异性的知识蒸馏方法

    公开(公告)号:CN111062951A

    公开(公告)日:2020-04-24

    申请号:CN201911277549.4

    申请日:2019-12-11

    Abstract: 本发明公开了一种基于语义分割类内特征差异性的知识蒸馏方法,目的是将复杂模型(教师模型)学到的暗知识迁移到精简模型(学生模型),从而在提升语义分割模型的准确度的同时保持其速度。首先,分别通过教师模型和学生模型得到卷积特征;然后,通过掩膜指导的平均池化操作得到各个类别中心的特征图并由此计算各个像素点与其对应的类别中心的特征相似性,得到类内特征差异图;最后,使学生模型的类内特征差异图与教师模型对齐,以达到提升学生模型准确度的目的。本发明提出的蒸馏方法相对于现有技术思路新颖,得到的语义分割模型在准确度和速度方面都取得了良好的效果,同时该方法可以方便地和其他相关技术结合,有很强的实际应用价值。

    一种语义上多模态图像生成的方法

    公开(公告)号:CN111062432A

    公开(公告)日:2020-04-24

    申请号:CN201911278401.2

    申请日:2019-12-13

    Inventor: 白翔 朱臻 徐志良

    Abstract: 本发明公开了一种语义上多模态图像生成的方法。本发明在分割标签生成图像的任务上提出了一个新任务,新任务是能够通过分割标签的类别对生成图像的类别进行单独控制。在这个任务上,本发明提出了一种解决方案,对编码器采用分组卷积,将自然图像里面不同类的编码进行分离,从而使得更改该编码能够改变生成图像中该类的样式。生成器部分,本发明采用的是组数逐渐递减的分组卷积,这能提高单独控制的能力,也能够减少显存的占用,因此可以将这个方法应用到类别较多的数据集上。同时本发明能够应用于许多图像生成的应用里面,如图像编辑等。本发明相较于之前的分割标签生成自然图像的相关工作,能对生成图像里面的类别尽可能的进行单独控制。

    一种基于距离变换标签的密集群体计数及定位方法

    公开(公告)号:CN111062280A

    公开(公告)日:2020-04-24

    申请号:CN201911232008.X

    申请日:2019-12-05

    Abstract: 本发明公开了一种基于距离变换标签的密集群体计数及定位方法。本发明提出了一种新颖的真实标签生成方式,将该真实标签称为Distance label map,通过Distance label map,只需要统计出局部最小值区域个数即可获得估算人数,除此之外,计算局部最小值区域的中心坐标即可获得预测人头的具体位置信息。特征提取采用特征金字塔网络,将图片输入网络中得到多个不同的融合特征,并与真实标签计算损失并求和,本发明提出了一种新的计算损失的函数,称之为自适应交叉熵,能够利用像素点的标签表示了该像素点离它最近像素点的距离信息对传统的交叉熵进行加权改进。本发明相较于之前的群体计数的相关工作,能在确保计数准确性的同时提供每个人头的定位信息。

Patent Agency Ranking