一种基于批次中心相似度的行人重识别方法

    公开(公告)号:CN110309810A

    公开(公告)日:2019-10-08

    申请号:CN201910617855.1

    申请日:2019-07-10

    Abstract: 本发明公开了一种基于批次中心相似度的行人重识别方法,包括:(1)基于经典基础网络结构,去掉网络最后的全连接层,并添加额外卷积层从而建立全卷积神经网络模型;(2)从原始训练数据集中随机选取P个行人,每个行人随机选取K个图像;(3)利用(2)得到的P*K个图像送进网络进行训练得到P*K个特征向量;(4)对每个行人的K个特征向量求一个中心向量,得到P个中心向量;(5)将P*K个特征向量中的每一个与其对应的中心向量和非同类的中心向量构成一个三元组进行回归优化。本发明方法简单易行,应用范围广,能够有效的解决行人重识别任务中错位、遮挡等问题。

    一种基于深度学习的高帧率视频生成方法及系统

    公开(公告)号:CN106686472B

    公开(公告)日:2019-04-26

    申请号:CN201611241691.X

    申请日:2016-12-29

    Abstract: 本发明公开了一种基于深度学习的高帧率视频生成方法,包括:利用一个或多个原始高帧率视频片段生成训练样本集;利用所述训练样本集中的多个视频帧子集合训练双通道卷积神经网络模型,以获得优化后双通道卷积神经网络,所述双通道卷积神经网络模型为由两个卷积通道融合而成的卷积神经网络;利用所述优化后双通道卷积神经网络,根据低帧率视频中的任意相邻两视频帧生成这两视频帧的插入帧,从而生成帧率高于所述低帧率视频的视频。本发明方法整个过程是端到端的,不需要对视频帧进行后续的处理,视频帧率转换效果良好,合成的视频流畅度高,对于视频拍摄过程中存在的抖动、视频场景切换等问题具有较好的鲁棒性。

    一种基于卷积神经网络的端到端物体检测方法

    公开(公告)号:CN106682697A

    公开(公告)日:2017-05-17

    申请号:CN201611241694.3

    申请日:2016-12-29

    Abstract: 本发明公开了一种基于卷积神经网络的端到端目标检测方法,包括:(1)基于经典基础网络结构,去掉经典基础网络最后的全连接层,并添加额外层从而建立卷积神经网络模型;(2)从原始训练数据集中随机选取一张原始图像进行数据扩增得到扩增图像,并获得在原始图像中随机选取的目标图像块在扩增图像中的位置和边框;(3)利用步骤(2)得到的目标图像块在扩增图像中的位置和边界,回归步骤(2)中的卷积神经网络模型得到模型参数,从而得到训练后的卷积神经网络模型;(4)利用训练后的卷积神经网络模型,检测待检测图像中的目标的边界框和类别。本方法采用直接回归目标中心点坐标、宽高和类别,与同类方法相比,在速度上有很大的优势。

    一种基于深度图像的手势识别方法与系统

    公开(公告)号:CN104636725A

    公开(公告)日:2015-05-20

    申请号:CN201510058032.1

    申请日:2015-02-04

    Abstract: 本发明公开了一种基于深度图像的手势识别方法,训练数据集和测试数据集中的深度图像通过深度传感器采集得到,首先计算图像中人体区域的最小深度值,再利用深度阈值,结合人手是离传感器最近物体的预设条件,分割出深度图像中的手势;然后获取手势在三个正交平面上的投影图,分别称为正视投影图、侧视投影图和顶视投影图;接着提取三个投影图的轮廓片段包特征,并级联成原始深度手势的特征向量;最后训练分类器,对从待识别深度图像中获取的手势特征向量进行分类,得到待识别手势的识别结果。本发明还提供了相应的手势识别系统。本发明方法手势识别简单易行,推广能力强,识别准确率高,能有效克服杂乱背景、光照、噪声及自遮挡等不利因素的影响。

    增强多模态大语言模型视觉感知能力的方法、模型和装置

    公开(公告)号:CN118585954A

    公开(公告)日:2024-09-03

    申请号:CN202410716799.8

    申请日:2024-06-04

    Abstract: 本发明涉及计算机视觉技术领域,提供了一种增强多模态大语言模型视觉感知能力的方法、模型和装置。方法包括:使用第一视觉专家模型对图像进行全景分割,得到全景分割图,使用第二视觉专家模型对图像进行深度预测,得到深度图;根据所述全景分割图和所述深度图,生成视觉元信息;根据所述视觉元信息和用户查询,生成文本特征;其中,所述文本特征包括用户查询中的语义信息和所述视觉元信息中的结构信息;从图像中提取视觉特征,将所述视觉特征和所述文本特征输入至大语言模型中,得到视觉感知结果。本发明通过生成视觉元信息,将视觉元信息与语言模型相结合,从而有效促进视觉感知能力与语言推理能力的深度融合。

    基于双向状态空间模型的视觉表征方法与装置

    公开(公告)号:CN117876845A

    公开(公告)日:2024-04-12

    申请号:CN202410057263.X

    申请日:2024-01-15

    Abstract: 本发明公开了一种基于双向状态空间模型的视觉表征方法——Vision Mamba(Vim)。Vim模型首先将输入图像分割为一系列图像块,并将其线性投影为向量序列输入至Vim模块中进行高效序列建模。该方法首次将状态空间模型Mamba应用于计算机视觉领域,并引入双向的状态空间建模方法来优化模型在处理视觉数据时缺乏全局视觉的问题,同时利用位置嵌入提供空间信息的位置感知能力,使模型在诸如语义分割、目标检测和实例分割等密集预测任务中表现更稳健。此外,得益于Mamba算法的高效设计,Vim具有次二次时间复杂度计算特性及线性内存复杂度,相较于基于Transformer结构的视觉模型有着明显的效率优势。本发明还提供了相应的基于双向状态空间模型的视觉表征装置。

    一种3D-DSA图像的重建方法及系统

    公开(公告)号:CN115375560B

    公开(公告)日:2023-04-18

    申请号:CN202210868669.7

    申请日:2022-07-22

    Abstract: 本发明涉及稀疏视图3D‑DSA成像技术领域,公开了一种3D‑DSA图像的重建方法,所述方法包括以下步骤:S1,采集基于微血管的2D‑DSA图像,对所述2D‑DSA图像进行预处理;S2,将预处理后的所述2D‑DSA图像以及对应的相机参数输入至训练好的3D‑DSA重建网络中,获得重建的3D‑DSA图像。此外,本发明还公开了一种血管3D‑DSA图像的重建系统,本发明的3D‑DSA图像的重建方法及系统,通过极少的2D图像便可以有效地重建多尺度人类脑血管系统,不仅可以确保重建图像的质量,还能够显著降低病人所承受的辐射剂量。

    一种3D-DSA图像的重建方法及系统

    公开(公告)号:CN115375560A

    公开(公告)日:2022-11-22

    申请号:CN202210868669.7

    申请日:2022-07-22

    Abstract: 本发明涉及稀疏视图3D‑DSA成像技术领域,公开了一种3D‑DSA图像的重建方法,所述方法包括以下步骤:S1,采集基于微血管的2D‑DSA图像,对所述2D‑DSA图像进行预处理;S2,将预处理后的所述2D‑DSA图像以及对应的相机参数输入至训练好的3D‑DSA重建网络中,获得重建的3D‑DSA图像。此外,本发明还公开了一种血管3D‑DSA图像的重建系统,本发明的3D‑DSA图像的重建方法及系统,通过极少的2D图像便可以有效地重建多尺度人类脑血管系统,不仅可以确保重建图像的质量,还能够显著降低病人所承受的辐射剂量。

    图像目标检测方法与装置
    39.
    发明公开

    公开(公告)号:CN115331081A

    公开(公告)日:2022-11-11

    申请号:CN202211053451.2

    申请日:2022-08-31

    Abstract: 本发明公开一种图像目标检测方法:使用Transformer网络作为骨干网络从图像提取多分辨率特征图;将多分辨率特征图输入到跨尺度注意力的特征金字塔网络中;在特征金字塔网络中,从输入的小分辨率特征开始,利用跨尺度注意力模块,逐步往大分辨率进行特征的融合及重组,特征从小分辨率到大分辨率被累积融合;通过融合后的特征将被进一步送入后续处理及预测模块,进行检测框的回归和类别的预测,基于目标数据集训练上述跨尺度注意力的特征金字塔网络直至收敛;利用训练得到的跨尺度注意力的特征金字塔网络对待检测图片进行检测框的回归和类别的预测。提升最终目标检测的性能。本发明还提供了相应的图像目标检测装置。

    一种基于实例查询的端到端实例分割方法

    公开(公告)号:CN112927245A

    公开(公告)日:2021-06-08

    申请号:CN202110388605.2

    申请日:2021-04-12

    Abstract: 本发明公开了一种基于实例查询的端到端实例分割方法:(1)训练基于实例查询和多层级并行掩码监督的端到端实例分割算法模型,包括以下子步骤:(1.1)对原始数据集中所有图片的感兴趣类别的物体进行实例级别的标注,标签为实例级别的包围框的左上及右下顶点和实例对应的前景掩码,得到带标注的标准训练数据集;(1.2)定义基于实例查询向量以及多层级并行掩码监督的端到端实例分割算法模型,利用反向传播和梯度下降算法训练该基于实例查询向量以及多层级并行掩码监督的端到端实例分割算法模型;(2)利用上述训练好的模型对待识别图片进行实例分割。

Patent Agency Ranking