-
公开(公告)号:CN115019215A
公开(公告)日:2022-09-06
申请号:CN202210947014.9
申请日:2022-08-09
Applicant: 之江实验室
IPC: G06V20/17 , G06V20/10 , G06V10/82 , G06V10/764 , G06V10/26 , G06V10/778
Abstract: 本发明公开一种基于高光谱图像的大豆病虫害识别方法和装置,该方法包括:步骤一,利用无人机搭载的高光谱相机与RGB相机采集高光谱数据集及其对应的RGB数据集;步骤二,对采集的高光谱数据集进行数据增广;步骤三,对RGB图像进行植株区域分割后与对应的高光谱图像进行像素点相乘得到含植株区域的图像,对该图像进行预处理计算出各类别平均光谱特性曲线;步骤四,输入高光谱数据集至大豆病虫害识别网络模型,采用课程学习方式以及各类别平均光谱特性曲线进行模型训练;步骤五,采用训练好的大豆病虫害识别网络模型,对采集输入的高光谱图像进行预测分类,输出最终预测的虫害类别。本发明能有效提高大豆病虫害识别的准确度。
-
公开(公告)号:CN114972976A
公开(公告)日:2022-08-30
申请号:CN202210902801.1
申请日:2022-07-29
Applicant: 之江实验室
Abstract: 本发明公开了基于频域自注意力机制的夜间目标检测、训练方法及装置,采用具有夜间图像检测标签的开源数据集训练检测网络,首先将输入图像进行预处理,使其从RGB转化为YUV通道,分别将三个通道的图像划分成多个区块;对于三个通道的各个区块,分别进行DCT离散余弦变换;将各个区块中属于同一频域的信息依据其原本的空间关系存入同一通道中,生成数个代表不同频域的通道;将所有频域通道输入自注意力网络模块,该模块通过计算各通道之间的可缩放点积自注意力,输出每个通道动态加权后的数值,再将其分别输入相同的多层感知器MLP;将输出结果输入检测网络中,最终获得图像的检测结果。
-
公开(公告)号:CN114757822A
公开(公告)日:2022-07-15
申请号:CN202210663896.6
申请日:2022-06-14
Abstract: 本发明公开一种基于双目的人体三维关键点检测方法及系统,该方法包括:步骤一:通过采用YOLOv5目标检测算法的目标检测模块分别获得左、右视场图像中的人体矩形框;步骤二:扣取人体矩形框对应的人体图像,通过人体二维关键点识别算法提取左、右视场图像中人体各关键点的二维热力图;步骤三:将左、右人体二维关键点热力图反向投影到三维空间,得到三维反投影热力图;步骤四,将三维反投影热力图输入三维卷积编解码网络,通过编解码操作得到三维关键点热力图;步骤五,三维关键点热力图中每一通道通过自变量最大值软操作得到该通道表示的三维关键点所在坐标,最终得到全部人体三维关键点坐标。本发明具有较高的可行性和实用性。
-
公开(公告)号:CN114677596A
公开(公告)日:2022-06-28
申请号:CN202210579628.6
申请日:2022-05-26
IPC: G06V20/10 , G06V20/54 , G06V10/774 , G06V10/82 , G06V10/26 , G06V10/44 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明公开一种基于注意力模型的遥感图像船舶检测方法和装置,该方法包括:步骤一,收集船舶遥感图像,使用标注信息对图像数据集进行数据扩充;步骤二,对收集的遥感图像进行预处理,得到船舶检测模型训练使用的数据集;步骤三,将训练数据集里的图像输入到针对小尺寸目标改进过的YOLOV5注意力模型中,进行训练,得到训练好的遥感船舶检测模型;步骤四,将待检测的遥感图像裁剪,后输入到训练好的遥感船舶检测模型中,输出船舶的边界框和置信度;将所有裁剪图的边界框映射回原始遥感图像,经过置信度阈值过滤和非极大值抑制过滤重复目标后,获得最终的检测结果。本发明解决了遥感图像中船舶分布稀疏、尺寸过小导致的检测困难的问题。
-
公开(公告)号:CN113936339B
公开(公告)日:2022-04-22
申请号:CN202111537924.1
申请日:2021-12-16
Abstract: 本发明公开了基于双通道交叉注意力机制的打架识别方法和装置,该方法首先采集生成视频数据集,设置快慢两种帧率获取不同帧图像序列,进行预处理后分别送入快慢通道,在快慢通道采用基于分开时空自注意力机制的Transformer编码器提取图像序列时空编码特征;然后,经过交叉注意力模块融合一个通道CLS token与另一通道patch token信息,实现双通道时空编码特征融合;最后,将融合后的时空编码特征经过多层感知机头进行打架行为识别。本发明通过双通道Transformer模型与交叉注意力模块能有效提取视频时空特征,提高打架行为识别的准确率,适用于室内外监控系统。
-
公开(公告)号:CN114202794A
公开(公告)日:2022-03-18
申请号:CN202210147360.9
申请日:2022-02-17
Applicant: 之江实验室
Abstract: 本发明涉及人工智能算法技术领域,具体涉及一种基于人脸ppg信号的疲劳检测方法和装置,该方法包括以下步骤:步骤一,通过摄像头采集包含人脸的视频帧,进行人脸提取;步骤二,使用关键点检测方法,提取人脸关键点,进行头部运动检测;步骤三,对提取人脸进行预处理,通过疲劳分类模型并结合检测到的头部运动信息,得到疲劳检测结果。本发明针对于人脸的生理信号变化,采用深度学习训练的方式,增加疲劳检测与人脸生理信号变化的相关性,从而提高基于人脸的疲劳检测精度。
-
公开(公告)号:CN114022727A
公开(公告)日:2022-02-08
申请号:CN202111221950.3
申请日:2021-10-20
Applicant: 之江实验室
IPC: G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了本发明公开一种基于图像知识回顾的深度卷积神经网络自蒸馏方法,该方法首先针对目标网络设置辅助网络,在目标网络的下采样层引出分支,采用知识回顾的思路依次融合和连接各个分支,在训练过程中,通过监督学习以及采用目标网络的下采样层向引出分支层进行学习的方式,达到自蒸馏的目的。本发明在深度卷积神经网络自蒸馏领域引入知识回顾的思路,提高了深度卷积神经网络的训练精度;采用辅助网络的形式进行自蒸馏,相对使用数据增强来拉进类内距离的自蒸馏方法,在实际应用中更加简洁方便。
-
公开(公告)号:CN113936339A
公开(公告)日:2022-01-14
申请号:CN202111537924.1
申请日:2021-12-16
Abstract: 本发明公开了基于双通道交叉注意力机制的打架识别方法和装置,该方法首先采集生成视频数据集,设置快慢两种帧率获取不同帧图像序列,进行预处理后分别送入快慢通道,在快慢通道采用基于分开时空自注意力机制的Transformer编码器提取图像序列时空编码特征;然后,经过交叉注意力模块融合一个通道CLS token与另一通道patch token信息,实现双通道时空编码特征融合;最后,将融合后的时空编码特征经过多层感知机头进行打架行为识别。本发明通过双通道Transformer模型与交叉注意力模块能有效提取视频时空特征,提高打架行为识别的准确率,适用于室内外监控系统。
-
公开(公告)号:CN113378809B
公开(公告)日:2021-12-14
申请号:CN202110937135.0
申请日:2021-08-16
Applicant: 之江实验室
IPC: G06K9/00
Abstract: 本发明公开了一种基于单目三维人体姿态的摔倒检测方法,该方法通过目标检测模块检测出人体及沙发、床等适合躺的物品在场景图像中的矩形框,将人体图像输入三维人体姿态估计模块获得数字化人体模型的参数,包括人体在相机坐标系下的姿态、各关节相对于其父关节的姿态以及各关节在人体坐标系下的三维坐标。利用人体模型参数通过决策模块判定人员是否摔倒。本方法利用单个摄像头即可获得三维人体姿态,无须采集额外的图像对摔倒任务进行训练调优,硬件成本低,可广泛应用于智能监控等领域。
-
公开(公告)号:CN113378809A
公开(公告)日:2021-09-10
申请号:CN202110937135.0
申请日:2021-08-16
Applicant: 之江实验室
IPC: G06K9/00
Abstract: 本发明公开了一种基于单目三维人体姿态的摔倒检测方法,该方法通过目标检测模块检测出人体及沙发、床等适合躺的物品在场景图像中的矩形框,将人体图像输入三维人体姿态估计模块获得数字化人体模型的参数,包括人体在相机坐标系下的姿态、各关节相对于其父关节的姿态以及各关节在人体坐标系下的三维坐标。利用人体模型参数通过决策模块判定人员是否摔倒。本方法利用单个摄像头即可获得三维人体姿态,无须采集额外的图像对摔倒任务进行训练调优,硬件成本低,可广泛应用于智能监控等领域。
-
-
-
-
-
-
-
-
-