一种基于贝叶斯深度多任务学习的语义分割与深度预测方法

    公开(公告)号:CN114913328B

    公开(公告)日:2024-07-26

    申请号:CN202210537471.0

    申请日:2022-05-18

    Inventor: 葛宏伟 王世豪

    Abstract: 本发明属于人工智能与计算机视觉领域,公开了一种基于贝叶斯深度多任务学习的语义分割与深度预测方法。该方法将语义分割与深度预测任务视为多任务,利用深度学习方法解决多模态问题,通过预训练处理的主干网络生成包含多个尺度的原始共享特征,并利用提出的贝叶斯多通道交流单元与任务共享单元实现尺度与任务特征之间的交流;最后通过设计的贝叶斯多模态蒸馏机制输出语义分割与深度预测的结果。本发明方法核心在于设计了多尺度与多任务交流机制,并引入贝叶斯深度学习设计了贝叶斯门控机制,并显著提高语义分割与深度预测任务的精度。本发明作为一种基于贝叶斯深度多任务学习的语义分割与深度预测方法,可广泛应用于自动驾驶以及智能机器人领域。

    一种基于交互级联轻量化transformers的域自适应行人重识别方法

    公开(公告)号:CN114596589A

    公开(公告)日:2022-06-07

    申请号:CN202210246448.6

    申请日:2022-03-14

    Abstract: 本发明公开了一种基于交互级联轻量化transformers的域自适应行人重识别方法,属于计算机视觉与行人识别的交叉技术领域。该方法所设计的轻量化transformer包括局部轻量化transformer和全局轻量化transformer,它们由嵌入模块、多头自注意力模块和多头混合模块组成。轻量化transformer可以捕捉长距离依赖,避免噪声标签的影响加剧。在该方法所设计的交互级联框架中,像素点被交替赋予局部信息和全局信息,这增强了局部信息建模和全局信息建模的交互能力,进而提高了模型的特征表达能力。本方法实现了有效的域自适应行人重识别。

    一种基于多粒度标签的交叉域自适应行人重识别方法

    公开(公告)号:CN111666851A

    公开(公告)日:2020-09-15

    申请号:CN202010466677.X

    申请日:2020-05-28

    Inventor: 葛宏伟 刘常堃

    Abstract: 本发明属于计算机视觉与行人识别的交叉领域,一种基于多粒度标签的交叉域自适应行人重识别方法。本方法首先基于深度学习的方法提出了多粒度分辨率网络,该网络结构在分块多粒度网络的基础上,增加了多分辨率的特征信息,使得模型在细节特征提取能力上得到了提高。此外,通过增加注意力机制,使模型自适应学习不同粒度的权重占比,提升多粒度分辨率网络的性能。为提高无标签数据的利用率,在源域和目标域之间的交叉域自适应训练过程中采用聚类得到目标域的多粒度“伪标签”,形成每张行人图像拥有一个主身份标识以及多个分块身份标识的多粒度标签结构,补充行人特征的部分相似性。本方法可以扩展到更多的无标签数据,且对数据的分布无约束条件。

    一种基于语义场景分类的图像自动标注方法

    公开(公告)号:CN107220663B

    公开(公告)日:2020-05-19

    申请号:CN201710346426.6

    申请日:2017-05-17

    Abstract: 本发明属于计算机应用及计算视觉领域,涉及一种基于语义场景分类的图像自动标注算法。本方法利用基于非负矩阵分解的方法检测标签的语义场景信息,以概率方式映射训练集样本到对应的场景,并利用样本的场景信息训练基于极限学习机和差分进化算法的场景分类器。最后利用场景分类器,将待标注样本快速映射到与其场景相关的样本子集中,在这个样本子集中利用KNN‑based算法完成标注。该发明不仅缩小了搜索最邻近样本的范围,提升了算法效率,而且使得KNN算法在语义相关的样本集合中进行标注,从而减少噪音的干扰,提高了标注效果。本方法中的场景个数远少于标签个数,因此解决了基于模型学习的方法不适合标签数量庞大的数据集的问题。

    一种基于Res-Gan的零样本学习算法

    公开(公告)号:CN110334781A

    公开(公告)日:2019-10-15

    申请号:CN201910497533.8

    申请日:2019-06-10

    Abstract: 一种基于Res-Gan的零样本学习算法,属于机器学习中的零样本学习领域。包括:1):通过对属性空间的数据乘以权值,得到加权后的属性,实现属性的放大或抑制。2)在步骤1神经网络实现属性加权的基础上进行多激活函数融。3)在步骤2的基础上,设计残差结构,利用残差结构增加神经网络的深度,增加神经网络识别的准确率。4)在步骤3的基础上,设计生成对抗网络,生成对抗网络包含生成网络和判别网络,生成网络与残差结构相结合,通过两个网络之间的对抗,提高神经网络识别的准确率。本发明通过属性加权、多激活函数融合、残差结构、生成对抗网络等技术,使得神经网络训练的收敛速度大大提高,同时在AwA、CUB等数据集上的识别准确率也大幅提高。

    一种基于CCA和2PKNN的自动图像标注方法

    公开(公告)号:CN105808752B

    公开(公告)日:2018-04-10

    申请号:CN201610144113.8

    申请日:2016-03-10

    Abstract: 本发明属于计算机应用技术领域学习理论及应用子领域,涉及一种基于CCA和2PKNN的自动图像标注方法,用以解决自动图像标注任务中存在的语义鸿沟、弱标记和类别不平衡问题。首先,对于语义鸿沟问题,将两个特征映射到CCA子空间,在该子空间求两个特征的距离;对于弱标记问题,对每个标签构建一个语义空间;针对类别不平衡问题,结合KNN算法,在每个标签的语义空间中找到测试图像的k个最邻近,将它们构成图像子集,利用该子集和测试图像的视觉距离,结合贝叶斯公式,将分数最高的几个标签指定给测试图像。最后,利用标签间的相关性,优化图像标注结果。该方法对图像标注性能有了较大程度的改善。

    一种基于多分辨率卷积神经网络的交通标志识别方法

    公开(公告)号:CN104537393B

    公开(公告)日:2018-01-16

    申请号:CN201510002850.X

    申请日:2015-01-04

    Abstract: 本发明属于计算机应用技术领域机器学习理论及应用子领域,关注于智能交通技术中的交通标志识别问题。其特征是使用一种多分辨率卷积神经网络交通标志识别方法,用于解决使用卷积神经网络进行交通标志识别时速度较慢的问题,使用不同分辨率的二维图像作为输入,并行运算两个相同结构的卷积神经网络进行特征映射和提取,而后基于网络训练的权值阈值进行精确分类和识别。本发明通过使用两个具有不同分辨率分支的CNN代替了基本的CNN结构,高分辨图像输入可映射出全局和轮廓的特征,低分辨率的图像可映射出局部和细节特征,保证了识别的分辨率,提高了模型训练速度。

    一种基于语义场景分类的图像自动标注方法

    公开(公告)号:CN107220663A

    公开(公告)日:2017-09-29

    申请号:CN201710346426.6

    申请日:2017-05-17

    Abstract: 本发明属于计算机应用及计算视觉领域,涉及一种基于语义场景分类的图像自动标注算法。本方法利用基于非负矩阵分解的方法检测标签的语义场景信息,以概率方式映射训练集样本到对应的场景,并利用样本的场景信息训练基于极限学习机和差分进化算法的场景分类器。最后利用场景分类器,将待标注样本快速映射到与其场景相关的样本子集中,在这个样本子集中利用KNN‑based算法完成标注。该发明不仅缩小了搜索最邻近样本的范围,提升了算法效率,而且使得KNN算法在语义相关的样本集合中进行标注,从而减少噪音的干扰,提高了标注效果。本方法中的场景个数远少于标签个数,因此解决了基于模型学习的方法不适合标签数量庞大的数据集的问题。

    一种基于聚类的高维多目标进化方法

    公开(公告)号:CN106022464A

    公开(公告)日:2016-10-12

    申请号:CN201610326223.6

    申请日:2016-05-17

    Inventor: 葛宏伟 韩红艳

    CPC classification number: G06N3/006 G06N3/086

    Abstract: 本发明属于计算机应用技术与智能计算的交叉领域,涉及一种基于聚类的高维多目标进化方法。该方法是在维持种群多样性的基础上,选择收敛性较好的个体来解决种群分布不均匀及Pareto分层排序耗时的问题。针对通常的聚类算法会产生多样性较好但收敛性很差的个体,本方法引入一个两层聚类算法由当前种群的非劣解来引导劣解的聚类,然后用一个两层排序方法识别每类中个体的优劣性以解决Pareto支配的无效性,并依次从每类中选择一个个体进入下一代进行环境选择。本发明针对Pareto支配的无效性,在评估大量非劣解的优劣性同时,降低了算法的计算复杂度,保证了非劣解集的收敛性和多样性。

    一种基于CCA和2PKNN的自动图像标注方法

    公开(公告)号:CN105808752A

    公开(公告)日:2016-07-27

    申请号:CN201610144113.8

    申请日:2016-03-10

    CPC classification number: G06F17/30268 G06K9/627

    Abstract: 本发明属于计算机应用技术领域学习理论及应用子领域,涉及一种基于CCA和2PKNN的自动图像标注方法,用以解决自动图像标注任务中存在的语义鸿沟、弱标记和类别不平衡问题。首先,对于语义鸿沟问题,将两个特征映射到CCA子空间,在该子空间求两个特征的距离;对于弱标记问题,对每个标签构建一个语义空间;针对类别不平衡问题,结合KNN算法,在每个标签的语义空间中找到测试图像的k个最邻近,将它们构成图像子集,利用该子集和测试图像的视觉距离,结合贝叶斯公式,将分数最高的几个标签指定给测试图像。最后,利用标签间的相关性,优化图像标注结果。该方法对图像标注性能有了较大程度的改善。

Patent Agency Ranking