一种岩石图像检索方法及其系统

    公开(公告)号:CN111414954B

    公开(公告)日:2022-09-09

    申请号:CN202010188033.9

    申请日:2020-03-17

    Abstract: 本发明公开了一种岩石图像检索方法,包括:实时获取图像数据,将图像数据输入到训练好的深度学习网络模型中,得到检索的结果图;所述述深度学习网络模型的训练过程包括:利用已收集的图像数据构建岩石图像数据集;将数据集输入到网络中,通过空间转移模块处理后,使网络能够主动地在空间上转换特征映射;将处理后的数据输入多粒度网络中,计算模型的总损失函数和mAP值,经过多次计算,当损失函数趋于稳定,且mAP值达到峰值时,完成深度学习网络模型的训练;本发明避免了仅利用表征对岩石图像进行分类,同时对岩石图像的细粒度特征有更精确的提取,有助于在有杂物遮挡、样本数量较少和质量较低、信息缺失等情况下提高岩石图像的检索准确率。

    一种基于扰动视觉解释的视频异常事件检测方法

    公开(公告)号:CN111814644B

    公开(公告)日:2022-05-03

    申请号:CN202010619232.0

    申请日:2020-07-01

    Abstract: 本发明属于计算机视觉和模式识别领域,具体涉及一种基于扰动视觉解释的视频异常事件检测方法,包括:获取视频数据集,将数据集输入到优化的深度学习模型中进行模型训练;实时获取视频数据,将获取的数据输入到训练好的深度学习模型中,得到检测结果以及解释图;本发明在构建深度学习模型中加入了可解释模型,通过可解释模型提取了输入视频中的重要像素以及重要区域,使得深度学习模型在处理视频数据过程中的更明确,增强了检测结果的可信度。

    一种基于表观特征和空间约束的客体视域估计方法

    公开(公告)号:CN114359955A

    公开(公告)日:2022-04-15

    申请号:CN202111481082.2

    申请日:2021-12-06

    Abstract: 本发明属于计算机视觉和模式识别领域,具体的涉及一种基于表观特征和空间约束的客体视域估计方法,其中客体视域估计方法包括:将包括头部图像的数据作为训练数据集;根据客体的表观特征和空间约束,构建客体视域模型,输入预处理后的训练数据集进行模型的参数训练,得到训练后的客体视域估计模型;将测试数据输入客体视域估计模型,得到客体视域估计结果。所述客体视域估计模型包括头部显著性检测网络、双目注视方向场预测网络、FRNet网络,从待识别客体的视角出发,为视域估计提供了一种新的角度,利用表观特征进行有效的客体视域提取,利用空间约束筛选视域区域,增强了对无效区域的滤除能力。

    一种基于改进时空卷积网络的唇语识别方法

    公开(公告)号:CN114359786A

    公开(公告)日:2022-04-15

    申请号:CN202111483875.8

    申请日:2021-12-07

    Abstract: 本发明属于图像与视频处理技术领域,具体涉及一种基于改进时空卷积网络的唇语识别方法;该方法包括:实时获取视频数据,视频数据输入到训练好的基于改进时空卷积网络的唇语识别模型中,输出唇语识别结果;本发明在特征提取阶段综合利用视频流数据中局部静态空间特征和时序特征,提取出更有效的特征向量,尽可能的减少语言内容在视觉表征上的歧义性。本发明为唇语的识别提供更可靠、更有力的信息,提升了对于视觉歧义的鲁棒性,同时,通过将时序特征提取网络中的多个不同尺度的卷积操作前加入了一个维度控制层,减少特征图的大小,解决了网络的深度和宽度的问题,更适用于视频流数据的特征提取,具有良好的经济效益。

    一种基于渐进式层级加权注意网络的细粒度行为识别方法

    公开(公告)号:CN114360051A

    公开(公告)日:2022-04-15

    申请号:CN202111481340.7

    申请日:2021-12-06

    Abstract: 本发明属于图像处理领域,特别涉及一种基于渐进式层级加权注意网络的细粒度行为识别方法,包括将采集到的图像进行预处理后输入预先定义的神经网络模型进行训练,训练模型是以Resnet50为骨干的4层渐进式网络组成,在渐进式网络第二层训练时,使用YOLO v5进行人体检测,将检测后的结果进行裁剪并插值,与原始图像相融合作为输入;在渐进式网络的第四层时,会将线性插值后的图像进一步细粒度特征提取,并裁剪填充,与原始图像融合后作为输入。本发明从细粒度分类的角度出发,融合父类和子类两阶段损失,并结合渐进式的思想,引入人体检测模型,提高了细粒度人体行为分类的准确率,改变了现有技术不能很好解决相似行为分类的现状。

    一种岩石图像检索方法及其系统

    公开(公告)号:CN111414954A

    公开(公告)日:2020-07-14

    申请号:CN202010188033.9

    申请日:2020-03-17

    Abstract: 本发明公开了一种岩石图像检索方法,包括:实时获取图像数据,将图像数据输入到训练好的深度学习网络模型中,得到检索的结果图;所述述深度学习网络模型的训练过程包括:利用已收集的图像数据构建岩石图像数据集;将数据集输入到网络中,通过空间转移模块处理后,使网络能够主动地在空间上转换特征映射;将处理后的数据输入多粒度网络中,计算模型的总损失函数和mAP值,经过多次计算,当损失函数趋于稳定,且mAP值达到峰值时,完成深度学习网络模型的训练;本发明避免了仅利用表征对岩石图像进行分类,同时对岩石图像的细粒度特征有更精确的提取,有助于在有杂物遮挡、样本数量较少和质量较低、信息缺失等情况下提高岩石图像的检索准确率。

    一种基于交通场景的多支路目标检测方法

    公开(公告)号:CN110059554A

    公开(公告)日:2019-07-26

    申请号:CN201910187966.3

    申请日:2019-03-13

    Abstract: 本发明请求保护一种基于交通场景的多支路目标检测方法,包括步骤:S1获取交通路口拍摄的高清照片构建相关数据集,对交通场景图像进行分类和标注,生成相应的类别标签,并划分训练集和测试集;S2搭建基于深度学习的具有32层的网络模型,采用k-means聚类算法获取9个锚框先验,将这9个锚框平均分配到三个检测分支中,该网络将检测任务转化为回归任务,在一个网络上同时完成目标的分类与边界框的回归,即将目标检测算法的候选框生成、特征提取、分类及位置精修这4个步骤统一到一个深度网络框架之内,采用反向传播和随机梯度下降方法对网络模型进行端到端训练,通过迭代训练使损失函数降到一个小的范围然后停止训练。

    一种基于空间认知学习的图像地理标注方法

    公开(公告)号:CN107273502A

    公开(公告)日:2017-10-20

    申请号:CN201710463291.1

    申请日:2017-06-19

    Abstract: 本发明请求保护一种基于空间认知学习的图像地理标注方法,涉及深度学习及图像分类标注领域。该方法包括:对图像进行预处理,使训练集和验证集符合深度学习工具的输入格式;利用深度学习工具构建卷积神经网络,使用全局平均池化层学习图像特征的空间分布;使用训练集进行端到端的训练,使网络自动学习图像的地理特征,在训练过程修改网络的参数,使全局平均池化层对地理特征有高的敏感度;保存训练模型并用验证集对模型进行验证;使用保存好的训练模型对新的测试对象进行计算,得到图像的地理标注。本发明从输入图像中自动地学习图像中的地理特征,避免了人工选取特征的干扰,在大规模的图像地理特征学习任务中实现了自动、高效的特征学习。

    基于卷积特征和空间视觉词袋模型的场景识别方法

    公开(公告)号:CN106919920A

    公开(公告)日:2017-07-04

    申请号:CN201710126371.8

    申请日:2017-03-06

    Abstract: 本发明公开了一种基于卷积特征和空间视觉词袋模型的场景识别方法。该方法包括:对原始数据库中的数据进行扩增技术,产生大量的、与原数据相似、标签不变的训练数据;对数据库中的图像进行预处理,得到符合的场景图像;利用构建的卷积神经网络模型及其训练后得到的参数设置,训练得到数据库图像的卷积特征;将得到的图像卷积特征用空间视觉词袋模型进行词典生成特征编码并形成直方图矢量;引入并联的思想融合多种特征,发挥其优势并结合SVM分类器实现场景分类性能的提高。

Patent Agency Ranking