一种基于多尺度语言嵌入REC的目标检测方法

    公开(公告)号:CN112926662A

    公开(公告)日:2021-06-08

    申请号:CN202110222614.4

    申请日:2021-02-25

    Abstract: 本发明提供一种基于多尺度语言嵌入REC的目标检测方法,把语言特征转化为不同尺度的卷积核,并与视觉特征进行卷积,得到语言特征与视觉特征每个点及其周围的点的相似度,将得到的相似度谱作用回原始视觉特征上,加强与语言相关的视觉特征的表达,同时引入全局视觉语言相互作用信息及位置信息,预测被描述的目标的位置,提升了网络对于视觉上下文的利用能力,相比于基准的普通基于单阶段REC的目标检测方法,预测准确率更高。

    基于多分支网络的图像分割结果质量评价方法

    公开(公告)号:CN109242864A

    公开(公告)日:2019-01-18

    申请号:CN201811087399.6

    申请日:2018-09-18

    Abstract: 本发明公开了一种基于多分支网络的图像分割结果质量评价方法。属于图像处理技术领域。本发明为了取得评价效果更好的图像分割结果质量评价方案,采用基于多分支卷积神经网络的评价网络对分割结果进行评价得出其质量预测分数,为后续的分割性能优化和最佳分割结果挑选提供依据。与现有的对不同图像分割结果进行评的评价方式相比,本发明利用多分支的卷积神经网络,从多方面提取分割图像更全面的特征,从而解决了现有评价方式在关联性较小分割结果差距较大,以及在较为相似的分割结果评价处理时效果不佳的技术问题。

    基于图像分割结果评价的交互式分割性能优化方法

    公开(公告)号:CN108428234A

    公开(公告)日:2018-08-21

    申请号:CN201711000091.9

    申请日:2017-10-24

    Abstract: 本发明公开了一种基于图像分割结果评价的交互式分割性能优化方法,旨在解决现有技术中交互式分割方法的分割参数人工选择耗时耗力,同时交互分割参数固定而导致交互式分割结果准确率不高的问题;本发明提出了一种新的基于分割质量评价的自动选择交互式分割方法参数以获取最优分割的方法,利用分割质量评价来获得最优的分割参数从而提高了分割的准确性,其中分割质量评价采用基于卷积神经网络的方法,保证了评价的高准确率,构建了一个新的交互式分割性能优化结构;本发明适用于图像处理领域相关领域。

    一种基于分类模糊及图像分割的英文字符识别方法

    公开(公告)号:CN103455823B

    公开(公告)日:2016-10-12

    申请号:CN201310376411.6

    申请日:2013-08-27

    Abstract: 本发明提供一种基于分类模糊及图像分割的英文字符识别方法。当一个个子窗口完整地、理想地分割出一个独立字符时,该个子窗的最后一列或最后一行应为背景区域,分离置信度等于或接近最大值1;当个子窗口没有完整分割出一个独立字符时,该个子窗的最后一列或最后一行会包含有字符区域,使得分离置信度降低。完整分割出一个独立字符的子窗口的窗口分数将远大于其他尺寸的子窗口的窗口分数。本发明通过引入了分离置信度对滑动窗结果进行分数计算就能有效的抑制大量干扰的子窗口,提高识别正确率。本发明将形状相似的大写字母、小写字母以及数字进行合并分类,之后通过常用英文字母组合规则进行2次判断,进一步能提高相似形状字符的识别正确率。

    一种基于分割传播的共分割结果修正方法

    公开(公告)号:CN103606143B

    公开(公告)日:2016-05-18

    申请号:CN201310413872.6

    申请日:2013-09-11

    Inventor: 李宏亮 孟凡满

    Abstract: 本发明提供一种基于分割传播的共分割结果修正方法,包括将共分割结果分为正确的分割结果集合及错误的分割结果集合;选择待修正的错误分割图像I′j;求当前错误分割图像I′j对应的全局谱MG;求当前错误分割图像I′j对应的局部谱ML;步骤6基于全局谱和局部谱获取当前的错误分割图像I′j对应的前景谱MU为:MU=αML+(1-α)MG;获取了当前的错误分割图像I′j的前景谱MU后,再对该前景谱MU进行分割,获取修正后的共分割结果。本发明通过全局和局部传播使得修正方法的自适应能力强,修正结果准确。

    一种基于分割传播的共分割结果修正方法

    公开(公告)号:CN103606143A

    公开(公告)日:2014-02-26

    申请号:CN201310413872.6

    申请日:2013-09-11

    Inventor: 李宏亮 孟凡满

    Abstract: 本发明提供一种基于分割传播的共分割结果修正方法,包括将共分割结果分为正确的分割结果集合及错误的分割结果集合;选择待修正的错误分割图像I′j;求当前错误分割图像I′j对应的全局谱MG;求当前错误分割图像I′j对应的局部谱ML;步骤6基于全局谱和局部谱获取当前的错误分割图像I′j对应的前景谱MU为:MU=αML+(1-α)MG;获取了当前的错误分割图像I′j的前景谱MU后,再对该前景谱MU进行分割,获取修正后的共分割结果。本发明通过全局和局部传播使得修正方法的自适应能力强,修正结果准确。

    一种基于预训练模型的自适应融合多模态数据集识别方法

    公开(公告)号:CN119004168A

    公开(公告)日:2024-11-22

    申请号:CN202411012805.8

    申请日:2024-07-26

    Abstract: 本发明公开了一种基于预训练模型的自适应融合多模态数据集识别方法,涉及深度学习领域中的多模态学习和类增量学习技术领域。本发明提出基于专家混合的参数高效微调方法和一个自适应加权融合模块能够动态适应增量场景,避免发生灾难性遗忘。同时利用文本增强技术和新提出的损失函数,使模型能够在类增量过程中取得更好的分类性能。此外,本发明在类增量学习过程中是不需要存储旧数据的,因此不会涉及隐私问题,并且模型的参数量较小,实现的几种经典类增量学习方法相比,本发明在智慧课堂场景数据集上获得了更优的分类性能。

    一种基于动态权重定位蒸馏的可见光和红外融合目标检测方法

    公开(公告)号:CN115661597B

    公开(公告)日:2023-08-15

    申请号:CN202211335800.X

    申请日:2022-10-28

    Abstract: 该发明公开了一种基于动态权重定位蒸馏的可见光和红外融合目标检测方法,属于多模态目标检测领域。本发明中采用两个教师网络,一个学生网络,两个教师网络分别用可见光和红外图片进行训练,然后采用定位蒸馏(Localization Distillation)的方法将知识蒸馏到学生网络,学生网络的输入为可见光和红外图片拼接(Concat)在一起。三个网络都采用YOLOv5,结构完全一致。另外,通过对每个批量(Batch)数据在教师网络中的检测结果进行评价,通过检测指标动态的调整蒸馏损失的权重。本发明可以在不增加计算开销的基础上实现可见光和红外图像融合目标检测。

    一种结合全局与局部特征的行人属性识别方法

    公开(公告)号:CN116311372A

    公开(公告)日:2023-06-23

    申请号:CN202310292681.2

    申请日:2023-03-23

    Abstract: 本发明提供一种结合全局与局部特征的行人属性识别方法,包括全局特征提取步骤、局部特征提取步骤和识别步骤;对图像的全局信息进行提取时采用了特征金字塔结构来获取多尺度的特征,提高属性的识别性能;局部特征提取时,直接在训练中将图像均匀划分为多个部分,强迫各部分去学习对应的行人特征,以此获得多粒度局部特征表示,而无需多余的外部模块。本发明使用多粒度网络提取多粒度局部特征,使网络学习到特征不明显,语义信息较弱的的细粒度属性特征;同时用金字塔结构获取多尺度全局特征,融合边缘信息,使网络学习到高层丰富和语义信息和底层准确的位置信息,在不增加网络计算复杂度的情况下,提高网络的识别性能。

Patent Agency Ranking