一种基于图像频率分解的显著性目标检测与分割方法

    公开(公告)号:CN117475141A

    公开(公告)日:2024-01-30

    申请号:CN202311546618.3

    申请日:2023-11-20

    Abstract: 本发明属于人工智能和计算机视觉领域,涉及一种基于图像频率分解的显著性目标检测与分割方法。该方法采用主干网对图像进行初步编码;然后在解码部分严格遵循图像的频率分解和合成机制,采用双分支特征并行学习结构,能够同时学习和优化显著目标的高频边界细节和低频内部区域特征。在每个分支的核心部分,设计了一个多尺度频率特征增强模块以优化频率特征。此外,提出一种新型的基于像素灰度统计相似性度量的损失函数,该损失函数结合BCE和IoU损失函数可进一步提高模型的整体精确度和性能。本发明能够很好的处理复杂背景环境下高低频图像信息混杂导致的显著性目标定位不准和边界不清等问题,并具有较强的通用性和鲁棒性。

    融合纹理特征与形状特征的时序性的草图识别方法

    公开(公告)号:CN108229501B

    公开(公告)日:2021-09-28

    申请号:CN201711379401.2

    申请日:2017-12-20

    Abstract: 本发明属于计算机视觉领域,公开了一种融合纹理特征与形状特征的时序性的草图识别方法。首先,按照草图的笔画顺序获取一个图像序列;其次,提取每个图像的纹理特征和形状特征,形成对应于图像序列的特征序列;然后,将特征输入到包含两个阶段的网络中进行学习,第一阶段的两个循环神经网络分别接受图像的纹理特征和形状特征,第二阶段首先融合上一阶段的输出,然后输入到第三个循环神经网络,最后通过分类器得到结果,如此,按照序列中的顺序进行迭代学习。优点:将几何描述子用于草图识别,同时采用循环神经网络对草图的时序特征进行有效学习,从而显著改善原有识别模型忽视草图形状特征与时序性特征的缺陷,较好地提升草图识别率。

    一种基于射影不变量的直线匹配方法

    公开(公告)号:CN105719309B

    公开(公告)日:2018-08-14

    申请号:CN201610056000.2

    申请日:2016-01-27

    Abstract: 本发明涉及计算机视觉领域,提供一种基于射影不变量的直线匹配方法,包括:步骤1、采集两幅图像;步骤2、对参考图像和待匹配图像进行直线检测,得到参考图像的直线集和待匹配图像的直线集;并进行特征点匹配,得到特征点匹配点集;步骤3、分别获得参考图像和待匹配图像中每条直线的梯度方向;步骤4、使用直线交点和梯度重新定位参考图像和待匹配图像中直线的端点;步骤5、进行参考图像和待匹配图像中的特征点分簇;步骤6、利用直线上两点和直线附近三点构成的五点射影不变量,确定参考图像和待匹配图像中对应局部点集的相似度,并确定参考点集对;步骤7、根据参考点集对及其相似度,进行直线匹配。本发明能提高直线匹配精确性和可靠性。

    一种基于射影不变量的直线匹配方法

    公开(公告)号:CN105719309A

    公开(公告)日:2016-06-29

    申请号:CN201610056000.2

    申请日:2016-01-27

    Abstract: 本发明涉及计算机视觉领域,提供一种基于射影不变量的直线匹配方法,包括:步骤1、采集两幅图像;步骤2、对参考图像和待匹配图像进行直线检测,得到参考图像的直线集和待匹配图像的直线集;并进行特征点匹配,得到特征点匹配点集;步骤3、分别获得参考图像和待匹配图像中每条直线的梯度方向;步骤4、使用直线交点和梯度重新定位参考图像和待匹配图像中直线的端点;步骤5、进行参考图像和待匹配图像中的特征点分簇;步骤6、利用直线上两点和直线附近三点构成的五点射影不变量,确定参考图像和待匹配图像中对应局部点集的相似度,并确定参考点集对;步骤7、根据参考点集对及其相似度,进行直线匹配。本发明能提高直线匹配精确性和可靠性。

    一种基于手势的汉字交互输入与识别方法

    公开(公告)号:CN103093196B

    公开(公告)日:2014-08-27

    申请号:CN201310012582.0

    申请日:2013-01-14

    CPC classification number: G06F3/017 G06K9/00355 G06K9/6253 G06K2209/01

    Abstract: 本发明属于计算机视觉和模式识别领域,涉及一种基于手势的汉字交互输入与识别方法。本发明能够让用户在不佩戴任何的硬件设备情况下,通过一个普通网络摄像头,用手作为媒介按照正规书写汉字和词组的规则与顺序来完成汉字的输入、识别与选择等功能。该发明突破了以往键盘输入、接触屏输入、语音输入汉字的局限,对使用者的限制较小,识别准确率较高,作为一种全新的输入方式,在人机界面、数字家庭、游戏与娱乐等领域有着很好的应用前景。

    一种面向图像分类任务的组合增量学习方法

    公开(公告)号:CN119445327A

    公开(公告)日:2025-02-14

    申请号:CN202411487168.X

    申请日:2024-10-24

    Abstract: 本发明涉及计算机视觉图像分类领域,提供一种面向图像分类任务的组合增量学习方法,包括:通过图像特征提取器中提取到图像特征;将图像特征分别在对象提示池与组合提示池中选取合适的提示并进行融合;使用对象提示指导属性提示选择并进行融合;获取训练图像的特征序列;通过Transformer Encoder分别得到训练图像的属性特征、对象特征与组合特征;使用属性分类器、对象分类器、组合分类器分别对属性、对象和组合进行分类,得到属性、对象、组合的预测分数;最终对测试图像进行测试获取最终组合预测分数,分数最高的组合即为预测分类结果。本发明能够大幅度提高对于组合增量图像的分类精度,使图像分类更加准确。

    一种基于直线特征匹配及约束的图像拼接方法

    公开(公告)号:CN112967217B

    公开(公告)日:2024-02-06

    申请号:CN202110263577.1

    申请日:2021-03-11

    Abstract: 本发明涉及计算机视觉图像拼接领域,提供一种基于直线特征匹配及约束的图像拼接方法,包括步骤100,将两幅图像划分为目标图像和参考图像,提取并匹配两幅图像中的特征点,筛选正确的匹配点,提取两幅图像中的特征直线;步骤200,利用点线不变量匹配两幅图像中的特征直线,根据几何关系重构匹配直线邻域内的特征点以增加匹配特征点的数量,最后筛选正确的匹配点;步骤300,估计全局单应性矩阵;步骤400,为目标图像划分均匀网格,构造能量函数的约束项,通过最小化能量函数计算扭曲网格的顶点坐标;步骤500,将扭曲的目标图像与参考图像融合,形成最终的拼接图像。本发明能够在保持全局直线的同时大幅度减少拼接图像的失真情况。

    一种复杂连通区域特征的快速标定与提取方法

    公开(公告)号:CN106127786B

    公开(公告)日:2018-12-18

    申请号:CN201610512165.6

    申请日:2016-07-04

    Abstract: 一种复杂连通区域特征的快速标定与提取方法,属于计算机应用技术领域。其特征是采用关联区域扩展标定的方式,充分利用已确定连通区域的邻域信息,通过设置垂直方向上的位移指针及邻域上非重叠区域的扫描指针向量,能够通过对二值图像的一次遍历便标定并提取出该图像所有连通区域的常用特征。本发明的效果和益处是能够有效避免所有已经被访问过但又不可能存在连通邻域的元素被再次访问,真正实现一次性扩展一片连通区域。能够处理计算内存允许的任意大小图像,处理任意复杂的大量连通区域时,性能远超过普通方法,处理能力和处理速度显著提高,提取到的结果数据可扩展性强。

Patent Agency Ranking