一种基于深度学习的船舶图像目标检测方法

    公开(公告)号:CN111914935A

    公开(公告)日:2020-11-10

    申请号:CN202010766653.6

    申请日:2020-08-03

    Abstract: 本发明提供一种基于深度学习的船舶目标检测与识别方法,包括以下步骤:S1:搭建像素注意力模型,并对船舶图像进行预处理;S2:使用K-Means聚类生成船舶锚定框,并对标签边界框进行转换;S3:搭建基于像素注意力模型的YOLOV3网络结构;S4:使用训练优化方法训练网络;S5:使用非极大值抑制算法对网络输出进行后处理,避免出现重复检测问题。本发明提供的基于深度学习的船舶目标检测与识别方法,能够在多种复杂背景与分辨率下对实现船舶目标检测与识别,在船舶工业与海事管理等领域有较好的使用前景。

    一种基于交叉分辨率知识蒸馏的连续手语识别方法

    公开(公告)号:CN116580451A

    公开(公告)日:2023-08-11

    申请号:CN202310434423.3

    申请日:2023-04-21

    Abstract: 本发明公开了一种基于交叉分辨率知识蒸馏的连续手语识别方法,包括以下步骤:S1:对输入的连续手语视频数据进行预处理;S2:将高分辨率连续手语视频输入到教师网络多尺度时序特征网络MSTNet进行训练;S3:搭建学生网络低分辨率输入网络LRINet;S4:将高分辨率连续手语视频输入到锁定权值的MSTNet网络,将低分辨率连续手语视频输入到LRINet网络,采用混合损失函数对LRINet网络进行训练;S5:锁定LRINet网络权值,使用此网络对低分辨率连续手语视频进行识别。本发明提供的基于交叉分辨率知识蒸馏的连续手语识别方法,能够以低分辨率连续手语视频作为输入,在保证识别精度的同时降低了模型的参数量、计算量和推理时间,达到了性能和精度的平衡。

    一种基于深度学习的船舶图像目标检测方法

    公开(公告)号:CN111914935B

    公开(公告)日:2022-07-15

    申请号:CN202010766653.6

    申请日:2020-08-03

    Abstract: 本发明提供一种基于深度学习的船舶目标检测与识别方法,包括以下步骤:S1:搭建像素注意力模型,并对船舶图像进行预处理;S2:使用K‑Means聚类生成船舶锚定框,并对标签边界框进行转换;S3:搭建基于像素注意力模型的YOLOV3网络结构;S4:使用训练优化方法训练网络;S5:使用非极大值抑制算法对网络输出进行后处理,避免出现重复检测问题。本发明提供的基于深度学习的船舶目标检测与识别方法,能够在多种复杂背景与分辨率下对实现船舶目标检测与识别,在船舶工业与海事管理等领域有较好的使用前景。

    一种基于度量学习和教师学生模型的跨数据集表情识别方法

    公开(公告)号:CN113792574A

    公开(公告)日:2021-12-14

    申请号:CN202110796949.7

    申请日:2021-07-14

    Abstract: 本发明提出的基于距离度量学习的方法对图像进行权重加权,它显式地减少了训练过程中表情特征之间的类内差异从而使预测的精度更高;本发明使用教师学生模型进行全监督学习从而扩大训练数据的规模和提高训练数据的标签质量,提高深度卷积神经网络模型的性能。本发明采用源数据集和目标数据集的融合在精度和泛化能力之间提供了最佳的折衷,来达到跨数据集人脸表情识别一个较好的结果,提供了一个融合数据集的可选择方案,解决了数据集规模小和跨数据集表情识别忽略源数据集性能的问题;本发明解决了数据集标签错误多的缺点,进而提高深度卷积神经网络的分类精度。

    一种具有监督环节的指尖实时跟踪方法

    公开(公告)号:CN110781761A

    公开(公告)日:2020-02-11

    申请号:CN201910935847.1

    申请日:2019-09-29

    Abstract: 本发明公开了一种具有监督环节的指尖实时跟踪方法,包括以下步骤:S1:利用Kinect获取深度图像和RGB图像,并对深度图像进行滤波处理;S2:通过阈值分割方法,从深度图像中分割出手掌区域;S3:通过边缘点特征检测方法,从手掌区域中得到手掌轮廓;S4:在获取到的手掌轮廓的基础上,实现指尖的检测;S5:通过基于深度信息的卡尔曼滤波方法,获取到指尖的稳定状态;S6:通过具有监督环节的指尖跟踪算法,实现指尖的实时稳定跟踪。本发明提供的具有监督环节的指尖实时跟踪方法,能够实现对指尖的实时稳定跟踪,在人机交互领域具有广泛的用途。本发明能够实现对指尖的实时稳定跟踪,在人机交互领域具有广泛的用途。

    一种基于度量学习和教师学生模型的跨数据集表情识别方法

    公开(公告)号:CN113792574B

    公开(公告)日:2023-12-19

    申请号:CN202110796949.7

    申请日:2021-07-14

    Abstract: 本发明提出的基于距离度量学习的方法对图像进行权重加权,它显式地减少了训练过程中表情特征之间的类内差异从而使预测的精度更高;本发明使用教师学生模型进行全监督学习从而扩大训练数据的规模和提高训练数据的标签质量,提高深度卷积神经网络模型的性能。本发明采用源数据集和目标数据集的融合在精度和泛化能力之间提供了最佳的折衷,来达到跨数据集人脸表情识别一个较好的结果,提供了一个融合数据集的可选择方案,解决了数据集规模小和跨数据集表情识别忽略源数据集性能的问题;本发明解决了数据集标签错误多的缺点,进而提高深度卷积神经网络的分类精度。

    一种基于混合小波包特征深度学习的语音情感识别方法

    公开(公告)号:CN112151071A

    公开(公告)日:2020-12-29

    申请号:CN202011006934.8

    申请日:2020-09-23

    Abstract: 本发明提供基于混合小波包特征深度学习的语音情感识别方法,S1:通过自相关函数算法对语音数据进行端点检测;S2:将语音序列数据截取成相同长度,将语音序列采样统一为1024,针对该序列用3层小波包重构算法生成新的8个重构信号,组成特征集1;S3:将语音信号直接通过快速傅里叶变换(FFT)提取140个融合了LLDs及其泛化函数的特征值,组成特征集2;S4:将特征集2用DNN的深度学习结构进行进一步提取特征,将特征集1进行进一步提取特征;S5:将两种利用不同结构所提取到的特征集融合在一起,利用Softmax损失函数进行最终分类。本发明能够混有噪声的情况下,能够充分提取语音信号的时域信息和频域信息特征,进而利用深度学习算法实现。

    一种基于混合小波包特征深度学习的语音情感识别方法

    公开(公告)号:CN112151071B

    公开(公告)日:2022-10-28

    申请号:CN202011006934.8

    申请日:2020-09-23

    Abstract: 本发明提供基于混合小波包特征深度学习的语音情感识别方法,S1:通过自相关函数算法对语音数据进行端点检测;S2:将语音序列数据截取成相同长度,将语音序列采样统一为1024,针对该序列用3层小波包重构算法生成新的8个重构信号,组成特征集1;S3:将语音信号直接通过快速傅里叶变换(FFT)提取140个融合了LLDs及其泛化函数的特征值,组成特征集2;S4:将特征集2用DNN的深度学习结构进行进一步提取特征,将特征集1进行进一步提取特征;S5:将两种利用不同结构所提取到的特征集融合在一起,利用Softmax损失函数进行最终分类。本发明能够混有噪声的情况下,能够充分提取语音信号的时域信息和频域信息特征,进而利用深度学习算法实现。

Patent Agency Ranking