基于多任务深度学习的人脸属性识别方法

    公开(公告)号:CN106203395A

    公开(公告)日:2016-12-07

    申请号:CN201610591877.1

    申请日:2016-07-26

    Applicant: 厦门大学

    Abstract: 基于多任务深度学习的人脸属性识别方法,涉及计算机视觉中的人脸属性识别。准备图像数据集;对图像数据集中的每幅图像逐一进行人脸检测;对所有检测到的人脸进行人脸关键点检测;对检测到的人脸关键点将每幅人脸根据人脸对齐方法,对齐到标准的人脸图像上,构成人脸图像训练集;计算出训练集中的平均人脸图像;构建多任务深度卷积神经网络,把人脸图像训练集中的每幅人脸图像减去平均人脸图像后进行网络参数的训练,得卷积神经网络模型;将待识别的测试图像进行人脸检测和人脸关键点检测,并根据人脸关键点将图像中的人脸对齐到标准的人脸图像上;将标准的人脸图像减去平均人脸图像,并放到构建好的卷积神经网络模型中进行前馈运算操作,即得。

    一种基于稀疏编码特征的场景文本识别方法

    公开(公告)号:CN103942550A

    公开(公告)日:2014-07-23

    申请号:CN201410184072.6

    申请日:2014-05-04

    Applicant: 厦门大学

    Abstract: 一种基于稀疏编码特征的场景文本识别方法,涉及计算机视觉和模式识别。输入待识别的自然场景文本图像;采用多尺度滑动窗口的方法,用字符分类器对图像中的窗口区域进行检测和识别,对每一个字符类别,将分类器输出较大的区域判定为候选字符区域,输出较小的区域认为是背景区域,这样找出图像中包含的候选字符区域,再采用非极大值抑制方法,对重叠率较大的区域只保留分类器输出值最大的区域和相应的字符类别,除去重复冗余的候选字符区域,得到字符检测结果;将检测到的字符合并成一个词或文本行;输出场景文本识别结果。能够更加有效地表示和提取字符的结构特征,从而提高场景文本的识别率。

    基于语义Hough变换和偏最小二乘法的目标检测方法

    公开(公告)号:CN102831445A

    公开(公告)日:2012-12-19

    申请号:CN201210272631.X

    申请日:2012-08-01

    Applicant: 厦门大学

    Inventor: 王菡子 唐建宇

    Abstract: 基于语义Hough变换和偏最小二乘法的目标检测方法,涉及计算机视觉技术。首先利用训练集建立图像块的特征向量、语义特征向量与图像块类别和投票偏移向量之间的回归模型,然后将待检测图像中的每个图像块的特征向量和语义特征向量代入回归模型,找出类别为正的图像块并产生投票、形成Hough图像,最后在Hough图像中找出投票密度的局部极大值点作为检测结果,完成目标检测。

    联邦学习场景下的人脸表情识别方法

    公开(公告)号:CN119091482A

    公开(公告)日:2024-12-06

    申请号:CN202411051228.3

    申请日:2024-08-01

    Applicant: 厦门大学

    Inventor: 严严 丁虎 王菡子

    Abstract: 本发明公开了联邦学习场景下的人脸表情识别方法,本方案巧妙性通过将全局局部干扰解耦(GLDD)方法用于联邦表情识别,使得模型训练过程中,其局部干扰解耦可以通过自适应考虑干扰对本地客户端的影响,缓解了异构干扰的挑战;同时,全局干扰解耦通过聚合来自全局服务器上的客户端的表情和干扰信息,降低了异构表情数据和异构干扰的影响。

    基于统一中间模态的跨模态行人重识别方法

    公开(公告)号:CN113903053B

    公开(公告)日:2024-06-07

    申请号:CN202111129224.9

    申请日:2021-09-26

    Applicant: 厦门大学

    Abstract: 基于统一中间模态的跨模态行人重识别方法,涉及计算机视觉技术领域。包括以下步骤:1)将两种模态图像分别输入到两个编码器中进行编码;2)将编码得到的两种特征输入到两个非线性激活函数中用于加深其非线性表达能力;3)将非线性激活后的两种特征输入到一个共享的解码器中,并解码到一个统一的中间图像空间中,得到中间模态图像;4)将得到的中间模态图像与原始图像一起输入到网络中进行优化,完成跨模态行人重识别。可降低模态差异,进一步地拉近两种中间模态图像之间的距离,提升跨模态行人重识别模型的性能。

    一种基于专家协作学习的不平衡数据联邦学习方法

    公开(公告)号:CN117851937A

    公开(公告)日:2024-04-09

    申请号:CN202410032618.X

    申请日:2024-01-09

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于专家协作学习的不平衡数据联邦学习方法,包括:若干个参与方共同训练一全局模型,直至该全局模型收敛;每个参与方下载收敛完成的该全局模型,并利用该全局模型的特征提取器去初始化参与方的若干专家模型;每个参与方根据各自的数据,对专家模型以及全局模型的分类器进行更新;所述专家模型用于针对不同类别的数据进行特征提取、分类,包括头类数据专家模型和尾类数据专家模型;将待测样本输入专家模型以及全局模型等。本发明为每个参与方设置一个头专家和一个尾专家分别针对每个参与方中的头部类和尾部类,这允许每个参与方中的少数类去成为一个专家的主导类,每个专家内部的不平衡程度和参与方的不平衡程度相比,也会有所降低。

    一种基于事件相机的数据关联方法

    公开(公告)号:CN112131991B

    公开(公告)日:2024-01-23

    申请号:CN202010967054.0

    申请日:2020-09-15

    Applicant: 厦门大学

    Abstract: 内的所有物体的运动轨迹。可用于目标跟踪、运一种基于事件相机的数据关联方法,涉及计 动分割等。算机视觉。将事件相机感应环境中物体运动生成的异步时空视觉事件序列聚合成视觉事件的集合;将时空三维空间在时间维度上切片,在最早和最晚的两个切片上穷举采样,生成对应的直线模型假设集合,选出代表性模型假设集合,对每一个模型假设生成模型假设的内点集合;对代表性模型假设集合内每一个模型假设,计算内点集合在时间轴上的离差,对每个代表性模型假设赋予相应的权重;根据内点集合投影在图像平面生成的视觉事件图像的对比度进一步加权;在权重

    一种场景图生成方法、装置、设备及存储介质

    公开(公告)号:CN117274409A

    公开(公告)日:2023-12-22

    申请号:CN202211261936.0

    申请日:2022-10-14

    Abstract: 本申请提供一种场景图生成方法、装置、设备及存储介质,涉及人工智能技术领域,尤其涉及图像处理技术领域;在本申请中,针对待识别图像,获得用于表征第一目标对象和第二目标对象之间关联关系的初始谓词,第一目标对象和第二目标对象均为待识别图像中的目标对象;基于至少一类参考谓词中每类参考谓词,分别确定与第一目标对象之间的第一上下文关联度、与第二目标对象之间的第二上下文关联度,与初始谓词之间的谓词相似度;基于第一上下文关联度、第二上下文关联度和谓词相似度,在至少一类参考谓词中,选取出目标谓词;基于第一目标对象、第二目标对象和目标谓词,生成场景图。准确确定出用于表征对象之间关联关系的谓词,提升场景图的准确性。

    基于双模式网络的多数据集X光安检图像目标检测方法

    公开(公告)号:CN116071704A

    公开(公告)日:2023-05-05

    申请号:CN202310110761.1

    申请日:2023-02-13

    Applicant: 厦门大学

    Abstract: 本发明涉及一种基于双模式网络的多数据集X光安检图像目标检测方法,包括:将Lattice外观增强子网络连接基础特征提取网络形成目标检测网络;通过目标检测网络和K个X光安检图像数据集训练K个目标检测网络的教师模型;构建K个X光安检图像数据集的共同类模式学习网络和独特类模式学习网络;使用训练后的K个目标检测网络的教师模型轮流对目标检测网络的学生模型在共同类模式学习网络和独特类模式学习网络下进行知识蒸馏;利用反向传播算法训练知识蒸馏后的目标检测网络的学生模型;使用训练后的目标检测网络的学生模型对X光安检图像进行目标检测,得到X光安检图像中违禁品的位置及对应类别。可以精准检测违禁品的位置及对应类别,并标记出违禁品。

    一种基于有效特征表示的无偏场景图生成方法

    公开(公告)号:CN115861779A

    公开(公告)日:2023-03-28

    申请号:CN202211506846.3

    申请日:2022-11-29

    Applicant: 厦门大学

    Inventor: 王菡子 马文熙

    Abstract: 一种基于有效特征表示的无偏场景图生成方法,涉及计算机视觉技术。采用特征提取网络和分类网络解耦的训练策略,利用预训练好的骨干网络提取物体的视觉特征;进行目标检测,利用提取到的物体的视觉特征、物体的位置编码以及物体的类别编码两两配对再次组合编码,得到适用于谓词分类的编码特征;通过一个全连接层进行谓词分类;训练特征提取网络,在推理时不采用全连接层形式的分类网络,通过计算每一类谓词的用于谓词分类的编码特征的均值,根据待分类样本的编码特征与每一类谓词特征均值的余弦相似度进行谓词分类。摒弃全连接层分类器,直接基于谓词特征进行分类,可排除全连接层参数易受长尾数据影响的问题,从而提升场景图生成任务的性能。

Patent Agency Ranking