一种基于深度卷积神经网络的手势识别方法

    公开(公告)号:CN107480600A

    公开(公告)日:2017-12-15

    申请号:CN201710597440.3

    申请日:2017-07-20

    Inventor: 王修晖

    CPC classification number: G06K9/00389 G06K9/6256 G06N3/0454

    Abstract: 本发明公开了一种基于深度卷积神经网络的手势识别方法,包括:(1) 对训练集的样本图像进行边缘检测处理和样本集的划分;(2)构建深度卷积神经网络;(3)确定激活函数和损失函数;(4)训练深度神经网络;(5)根据训练后的深度卷积神经网络实现手势识别:其步骤包括:a)从待识别手势数据中提取手型图像;b)将手型图像进行边缘检测和尺寸归一化处理;c) 将归一化的手型图像输入到深度卷积神经网络中,依据输出层的输出值判定当前手势的归属类。本发明使用多重下采样技术构建深度卷积神经网络,并采用双曲正切函数作为激活函数进行神经网络的训练,不但能提高手势识别的效率,而且也能提高手势识别的准确率。

    一种基于多尺度特征融合和卷积注意力的商标检测与分类方法

    公开(公告)号:CN118314561A

    公开(公告)日:2024-07-09

    申请号:CN202410308856.9

    申请日:2024-03-18

    Abstract: 本发明公开了一种基于多尺度特征融合和卷积注意力的商标检测与分类算法。该算法模型包括:获取待检测商标图像;将待检测商标图像输入至监督学习机制的商标检测与分类模型中,进行图像的特征提取与Anchor Boxes设计,根据输出的生成结果来预测后续不同尺度目标的位置和大小;之后,根据不同尺度的目标框将特征图划分到不同的预测头,在预测头中计算并生成目标的类别概率、边界框的坐标信息及置信度等;在获得预测框后,应用非极大值抑制(NMS)算法来去除重叠较多的预测框,只保留置信度最高的目标框;最后在图像中绘制目标框并标记类别信息。相较传统的目标检测技术,本方法减少了漏检误检的情况,同时提高了检测的精度和效率。

    一种基于SwinTransformer的商标文本识别方法

    公开(公告)号:CN118230306A

    公开(公告)日:2024-06-21

    申请号:CN202410331309.2

    申请日:2024-03-21

    Abstract: 本发明涉及一种基于SwinTransformer的商标文本识别方法,首先获取一张商标文本图像,原始图像通过一个基于OTSU改进的FAST角点检测器来生成角点图,原始图像以及角点图分别通过一个带有金字塔(FPN)的SwinTransformer获取原始图像特征和角点图特征。原始图像特征通过自注意力机制学习图像的局部特征,然后通过交叉注意力机制与角点特征融合,以学习全局特征。编码器输出特征图,解码器则将该特征图放进softmax分类器进行文字预测,提取一系列字符。采用基于SwinTransformer作为骨干网络的特征提取器可以充分利用其先进的自注意力机制,更全面、准确地抽取关键的文本特征。引用角点查询机制,能够优先选择关键点区域,即文本中具有显著变化的位置,从而提高对重要特征的关注度。相对于其他自然场景的文本识别方法,本发明提高了在处理商标图像中变形字识别方面的鲁棒性。

    一种商标侵权检测方法和系统

    公开(公告)号:CN117809060A

    公开(公告)日:2024-04-02

    申请号:CN202311871533.2

    申请日:2023-12-29

    Abstract: 本发明公开了一种商标侵权检测方法和系统,将超分辨率图片重构技术和基于CNN的检测模型相结合,通过超分辨率图片重构技术提高了待检测商标图片的分辨率,以便于后续CNN检测阶段特征信息充分提取,并在CNN检测过程中先提取m个特征子库集合,再进行相似性度量计算,降低了系统运算量,提高了商标侵权判定的准确度。本发明将人工智能技术运用到商标侵权判定中,进一步提高商标相似性判断的客观性和一致性,可以解决当前商标侵司法实践中的困境。此外,基于区块链技术,在线上进行侵权证据的取证和存证,进一步提高了取证存证的效率和安全。

    基于孪生网络的设备红外图谱故障分类

    公开(公告)号:CN116863189A

    公开(公告)日:2023-10-10

    申请号:CN202310269970.0

    申请日:2023-03-20

    Abstract: 本发明提供一种基于孪生网络的设备红外图谱故障分类方法,其包括如下步骤:首先本文使用369张图像感应电机热图像数据集。其次针对红外图像分辨率低、细节模糊和故障图数量少的问题,开发了一个受Resnet网络启发的孪生卷积神经网络(CSA)模型。CSA模型由CSD单元与CDCM单元构成。新的模块CSD单元,以消除潜在的位置偏差。CDCM单元主要进行特征融合,加大了感受野,让每个卷积输出都包含较大范围的信息。最后本文运用二分类交叉熵损失来进行训练。本发明能够有效地满足体积小和轻量化的需求,在具有设备红外故障图的情况下,能够很好的进行故障分类。在电力设备上的故障诊断中可以提高供电安全,具有广阔的应用前景。

    一种基于YOLO的深度学习的工业现场生产工作区域的违规检测方法

    公开(公告)号:CN114913606A

    公开(公告)日:2022-08-16

    申请号:CN202210691592.0

    申请日:2022-06-17

    Abstract: 本发明公开了一种基于YOLO的深度学习的工业现场生产工作区域的违规检测方法,搭建图像采集系统,收集训练样本,再通过数据增强将数据集扩充并进行人工标注,建立工业现场生产工作区域违规行为数据集;基于YOLO的深度学习的方法,根据工地现场违规行为数据集的特点,提出全新的自适应注意力结构嵌入模型(ASAM)和增强特征提取的网络模块GFPN,并且使用alpha‑iou Loss优化Loss函数,使用diou‑NMS替代传统的NMS,最终得到一个新的YOLO网络模型;利用数据集对改进后的YOLO网络模型进行训练,得到能够精确检测是否具有违规行为(工业现场生产工作区域未佩戴安全帽、抽烟等行为)的网络模型;利用训练得到的网络模型,实现对工业现场生产工作区域的违规行为进行检测。本发明能够有效地提高工业现场生产工作区域违规行为检测的精度,具有广阔的应用前景。

Patent Agency Ranking