-
公开(公告)号:CN119229130A
公开(公告)日:2024-12-31
申请号:CN202411736952.X
申请日:2024-11-29
Applicant: 华侨大学
IPC: G06V10/26 , G06N3/0464 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于分类激活映射自举的路面裂痕分割方法及装置,涉及人工智能、机器视觉领域,方法包括:训练基于深度网络的正常与裂痕路面分类模型;利用类激活映射方法生成路面图像的激活映射图,通过高激活阈值筛选出类别高激活掩码并进行增强操作后,加入路面图像训练集;重复上述步骤,直到达到设定条件;基于训练好的正常与裂痕路面分类模型生成待推理的路面图像的激活映射图,通过裂痕掩码阈值获得待推理的路面图像的裂痕掩码,作为裂痕分割结果。本发明利用分类模型与激活映射,寻找类别高激活掩码更新路面图像训练集,不断迭代优化掩码效果,以改善路面裂痕分割效果,无需对裂痕进行像素级的标注,大大降低了标注成本。
-
公开(公告)号:CN119228788A
公开(公告)日:2024-12-31
申请号:CN202411725027.7
申请日:2024-11-28
Applicant: 华侨大学
IPC: G06T7/00 , G06N3/0455 , G06N3/08 , G06V10/26 , G06V10/40 , G06V10/764 , G06V10/82 , G01R31/12 , G01N21/88
Abstract: 本发明公开了一种基于类别余弦映射的绝缘子故障检测方法及装置,涉及人工智能、机器视觉领域,包括:从真实数据集合与合成数据集合中获取图像数据、故障标签以及类别标签;利用类别余弦偏置编码将类别偏置编码进图像数据,利用特征提取网络提取编码结果中的空间特征;利用类别余弦偏置解码缓解空间特征中的偏置信息以获得类别特征,利用多标签分类器获取类别特征与类别标签的分类损失;利用分割解码器获取空间特征与故障标签的掩码损失;基于分类损失与掩码损失完成模型训练。本发明将正常、故障绝缘子以及合成图像的类别差异通过余弦偏置编码至图像数据中,引导模型理解合成图像与真实场景中的分布差异,最终提升合成数据在实践中的有效性。
-
公开(公告)号:CN119027845A
公开(公告)日:2024-11-26
申请号:CN202411514321.3
申请日:2024-10-29
Applicant: 华侨大学 , 泉州圣源警用侦察设备有限公司
IPC: G06V20/17 , G06V10/25 , G06V10/764 , G06V10/77 , G06V10/774 , G06V10/80
Abstract: 本发明涉及图像处理与人工智能技术领域,公开了一种无人机森林火灾风险区块检测方法及系统,方法包括:构建基于区块分类的目标检测模型并进行训练,利用训练好的基于区块分类的目标检测模型实现无人机森林火灾风险区块检测;所述基于区块分类的目标检测模型利用区块映射器无人机图像中的不同区块映射为区块特征;利用多阶段采样网络对区块特征进行多种尺度的采样,并利用降维映射层进行尺度对齐,获得多尺度区块特征;通过哈达玛积融合多尺度区块特征,利用区块分类器将融合后的多尺度区块特征映射至区块类别概率。本发明以区域分类方式实现风险区块的定位,避免了现有技术因精确定位导致的庞大计算量,延长无人机可用时间。
-
公开(公告)号:CN118506168A
公开(公告)日:2024-08-16
申请号:CN202410954584.X
申请日:2024-07-17
Applicant: 华侨大学 , 杭州电子科技大学 , 厦门亿联网络技术股份有限公司
IPC: G06V10/98 , G06N3/045 , G06N3/0464 , G06T7/13 , G06V10/40 , G06V10/54 , G06V10/776 , G06V10/80 , G06V10/82 , G06V20/40
Abstract: 本发明公开一种基于多重特征网络的沉浸式视频质量评价方法及装置,涉及图像处理领域,包括:在沉浸式视频质量评价模型中,通过视频预处理网络对待评价的沉浸式视频包含的多个视点的纹理视频和深度视频进行视点筛选,得到筛选后视点的纹理视频和深度视频,通过时空特征提取网络对筛选后视点的纹理视频和深度视频进行特征提取并计算得到对应视点的纹理视频的质量分数和深度视频的质量分数;通过权重计算网络计算得到筛选后视点的时空轨迹权重,将筛选后视点的时空轨迹权重与对应视点的纹理视频的质量分数和深度视频的质量分数输入质量分数计算模块计算得到沉浸式视频的质量分数。本发明解决现有沉浸式视频质量评价算法效果较差的问题。
-
公开(公告)号:CN118196731B
公开(公告)日:2024-08-16
申请号:CN202410605567.5
申请日:2024-05-16
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于通道与空间量子注意力学习的车辆再辨识方法及装置,涉及车辆再辨识领域,包括:利用深度网络从车辆图像中提取车辆的特征映射;设计通道量子注意力学习分支和空间量子注意力学习分支,分别对残差模块输出的特征映射学习通道量子注意力掩码和空间量子注意力掩码,并将两种注意力掩码融合为通道‑空间复合量子注意力掩码,用于增强车辆的特征映射,使深度网络能够更全面捕捉特征映射中的重要特征。本发明利用量子叠加与纠缠特性实现车辆注意力学习,能够提高特征学习效果,改善车辆再辨识的准确率,解决了传统机器学习模型难以学习这些复杂的非线性关系的问题。
-
公开(公告)号:CN118450127A
公开(公告)日:2024-08-06
申请号:CN202410885047.4
申请日:2024-07-03
Applicant: 华侨大学
IPC: H04N19/147 , H04N19/625 , H04N19/136 , H04N19/149
Abstract: 本发明公开了一种融合空频域显著性特征的SCV编码感知码率控制方法及装置,涉及视频编码领域,方法包括:获取屏幕内容视频,通过卷积、相似度计算,对屏幕内容视频在空域上进行显著性建模,获得空域的显著性特征;其次利用DCT变换,对屏幕内容视频在频域上进行显著性建模,获得频域的显著性特征;然后利用显著性因子指导CTU级的目标比特分配;最后通过显著性因子构建显著性启发的感知码率控制模型,调节参数,实现码率控制。本发明通过提取空域和频域的显著性特征并加以融合求得显著性因子,使用显著性因子指导码率控制,能够提高编码率失真性能,提升码率分配精度。
-
公开(公告)号:CN118233570B
公开(公告)日:2024-07-26
申请号:CN202410605570.7
申请日:2024-05-16
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于微观几何纹理的防伪图像的生成方法及装置,涉及防伪领域,包括:获取物品对应的唯一序列号、防伪图像的宽和高、防伪图像单元的几何纹理样式;根据唯一序列号生成编码比特流,基于防伪图像单元的几何纹理样式采用对应的加密模式对编码比特流进行加密,生成加密编码比特流;根据防伪图像的宽和高以及加密编码比特流确定防伪图像中防伪图像单元、定位模组和数据模组的数量、大小和起始坐标,根据加密编码比特流以及数据模组和定位模组的几何纹理确定数据模组和定位模组的纹理图案;绘制所有防伪图像单元的定位模组和数据模组,组成防伪图像,解决现有防伪图像防伪特征少、易受噪声干扰、识别效率低、样式可塑性差等问题。
-
公开(公告)号:CN118334711A
公开(公告)日:2024-07-12
申请号:CN202410757573.2
申请日:2024-06-13
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06V40/10 , G06N3/0455 , G06N3/0464 , G06T7/70 , G06V10/26 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种基于服装描述生成的行人性别与年龄识别方法及装置,涉及图像识别领域,包括:构建行人性别与年龄识别模型,通过线性映射层和前a层Transformer块将行人图像处理为识别特征和图像特征,利用人体部位检测模型获取行人图像中的人体部位的位置,并裁剪出各个人体部位图像,利用图像字幕生成模型生成各个人体部位图像对应的服装文字描述,并利用词嵌入模型将服装文字描述映射为服装文字描述向量,将服装文字描述向量输入特征提取模块,提取得到对应的向量特征,将所有向量特征拼接后再连接至识别特征和图像特征后,并依次经过后b层Transformer块、第一全连接层和Softmax函数层,得到识别结果,解决性别与年龄识别技术受观察角度与环境等因素影响较大的问题。
-
公开(公告)号:CN118233570A
公开(公告)日:2024-06-21
申请号:CN202410605570.7
申请日:2024-05-16
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于微观几何纹理的防伪图像的生成方法及装置,涉及防伪领域,包括:获取物品对应的唯一序列号、防伪图像的宽和高、防伪图像单元的几何纹理样式;根据唯一序列号生成编码比特流,基于防伪图像单元的几何纹理样式采用对应的加密模式对编码比特流进行加密,生成加密编码比特流;根据防伪图像的宽和高以及加密编码比特流确定防伪图像中防伪图像单元、定位模组和数据模组的数量、大小和起始坐标,根据加密编码比特流以及数据模组和定位模组的几何纹理确定数据模组和定位模组的纹理图案;绘制所有防伪图像单元的定位模组和数据模组,组成防伪图像,解决现有防伪图像防伪特征少、易受噪声干扰、识别效率低、样式可塑性差等问题。
-
公开(公告)号:CN117456561B
公开(公告)日:2024-03-12
申请号:CN202311779478.4
申请日:2023-12-22
Applicant: 华侨大学
IPC: G06V40/10 , G06V10/44 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N10/20 , G06N10/60
Abstract: 本发明公开一种基于部件量子学习的行人再辨识方法,涉及量子计算、人工智能领域,包括:用深度神经网络从行人图像中提取特征映射,并用自适应空间平均池化把特征映射分解为多个部件特征;用多分支通道型量子卷积网络,每个分支对应从一个部件特征上进行量子学习,获得部件量子特征;把所有部件量子特征求和并输入通道型量子卷积网络进行部件量子特征融合,获得最终的行人特征向量,用于行人再辨识。本发明利用量子叠加与纠缠特性实现行人特征学习,能提高特征学习效果,进而提升行人再辨识的准确率。
-
-
-
-
-
-
-
-
-