一种用于手势识别的数据库建立方法

    公开(公告)号:CN106960036A

    公开(公告)日:2017-07-18

    申请号:CN201710174434.7

    申请日:2017-03-22

    CPC classification number: G06F3/017 G06F16/5866

    Abstract: 本发明公开了一种用于手势识别的数据库建立方法。本发明步骤如下:步骤1、从网络上收集关于单只手的RGB手部图片,构建数据库;步骤2、对数据库中的图片统一尺寸;将原始数据统一到一个标准尺寸N*M,并对每张手部图片进行命名,图片文件名称为“hand+序号”;步骤3、获取数据库中统一尺寸后的手部图片中手的各个节点的坐标数据;步骤4、将步骤2统一尺寸后手部图片和步骤3获取的坐标数据通过转换模块转换成深度学习框架能够直接使用的数据类型。本发明具有较好的适用性和鲁棒性,为手势识别提供了坚实的数据基础,旨在解决手势识别问题,推动人工智能的发展。

    一种基于多任务级联卷积网络的目标检测和对齐方法

    公开(公告)号:CN110175504A

    公开(公告)日:2019-08-27

    申请号:CN201910276011.5

    申请日:2019-04-08

    Abstract: 本发明公开了一种基于多任务级联卷积网络的目标检测和对齐方法。本发明步骤如下:1、构建数据集,生成图像金字塔;2、构建P-Net网络快速产生候选窗体,获得候选窗体和边界回归向量;同时候选窗体根据边界框进行校准;然后利用非极大值抑制方法去除重叠窗体;3、通过R-Net网络对步骤2产生的候选窗体进一步打分筛选;4、使用O-Net网络实现候选窗体的去留,同时定位面部五个关键点的定位;O-Net网络结构比R-Net多一层卷积,在去除重叠候选窗口的同时,显示五个人脸关键点定位,分别为左眼睛、右眼睛、鼻子以及嘴巴的左嘴角、右嘴角。本发明将人脸检测和对齐的相关性考虑进去,提升了人脸检测和对齐的精度。

    一种基于密集卷积神经网络的心电图卒中辅助诊断方法

    公开(公告)号:CN111613321A

    公开(公告)日:2020-09-01

    申请号:CN202010299702.X

    申请日:2020-04-16

    Abstract: 本发明提供一种基于密集卷积神经网络的心电图卒中辅助诊断方法。本发明方法首先建立初期数据库,分配训练集和测试集;然后将训练集作为原始训练数据输入到密集卷积神经网络中进行参数训练,得到基本的心电图卒中诊断模型;最后将测试集作为输入数据输入到获得的心电图卒中诊断模型中进行识别,得到识别结果。本发明提出了一种消除人为约束、减少主观因素的深度神经网络,使模型能够自动提取特征,探索脑卒中与心电图的关系,不仅自动提取卒中分类相关的特种,并且能够很好的节省计算机的资源,同时在精度上也能够达到要求。

    一种基于多任务的眼底图像检测方法

    公开(公告)号:CN113516678B

    公开(公告)日:2024-04-05

    申请号:CN202110348257.6

    申请日:2021-03-31

    Abstract: 本发明公开了一种基于多任务的眼底图像检测方法。采用DRIVE眼底公开数据集,将数据集分为训练集和测试集,并对数据进行有疾病和没有疾病的人工标记操作;对训练集和测试集进行数据增强操作;将数据增强后的训练集输入到多任务UNet网络中训练网络参数,得到眼底图像识别模型;通过经过数据增强的测试集进行测试,根据识别结果对模型进行微调。本发明方法更加具有普适性,本发明采用的对图像进行多任务计算并且在下采样添加额外操作对眼底疾病进行二分类任务,此外在跳跃链接中添加通道注意力机制使得网络对于通道信息更加敏感,保证图像分割质量。

    一种基于深度学习的背景去除的方法

    公开(公告)号:CN110189330A

    公开(公告)日:2019-08-30

    申请号:CN201910276000.7

    申请日:2019-04-08

    Abstract: 本发明公开了一种基于深度学习的背景去除的方法。本发明包括如下步骤:步骤1、对初期数据库的建立,通过采用对COCO数据集的整理以及添加修改得到所需要的对初期数据库;并找到对初期数据库中图片原始信息匹配所对应的标签信息;对初期数据库以及其所对应的标签信息进行预处理操作,包括图像正则化和图像格式转换;步骤2、将步骤1得到的初期数据库作为原始训练数据输入到提拉米苏Tiramisu网络中,得到基本的背景去除的模型;步骤3、将待识别的图片作为输入数据输入到上述模型中进行识别,得到识别结果。本发明实现全自动化操作,只需将所需要进行操作的图片输入到模型中即可自动完成背景去除的目的。

    一种基于深度残差网络的手势识别方法

    公开(公告)号:CN106991386A

    公开(公告)日:2017-07-28

    申请号:CN201710174418.8

    申请日:2017-03-22

    Abstract: 本发明公开了一种基于深度残差网络的手势识别方法。本发明步骤包括:步骤1.获取手势的原始数据信息,并将其进行N点标记得到2N维的原始标签数据;步骤2.对原始数据信息及2N维的标签数据进行预处理;步骤3、将预处理后的原始数据信息与转化为hdf5格式的2N维的原始标签数据作为原始训练数据,输入到深度残差网络中训练网络参数,得到手势识别模型;步骤4、将待识别手势数据做与步骤1相同的N点标记得到2N维的待识别标签数据;步骤5、对待识别手势数据及2N维的标签数据进行预处理,并将预处理后的手势数据与转化为hdf5格式的2N维的待识别标签数据,输入到上述手势识别模型中进行识别,得到识别结果。本发明有效解决梯度弥散和网络精度问题。

    一种基于多任务的眼底图像检测方法

    公开(公告)号:CN113516678A

    公开(公告)日:2021-10-19

    申请号:CN202110348257.6

    申请日:2021-03-31

    Abstract: 本发明公开了一种基于多任务的眼底图像检测方法。采用DRIVE眼底公开数据集,将数据集分为训练集和测试集,并对数据进行有疾病和没有疾病的人工标记操作;对训练集和测试集进行数据增强操作;将数据增强后的训练集输入到多任务UNet网络中训练网络参数,得到眼底图像识别模型;通过经过数据增强的测试集进行测试,根据识别结果对模型进行微调。本发明方法更加具有普适性,本发明采用的对图像进行多任务计算并且在下采样添加额外操作对眼底疾病进行二分类任务,此外在跳跃链接中添加通道注意力机制使得网络对于通道信息更加敏感,保证图像分割质量。

Patent Agency Ranking