-
公开(公告)号:CN107133920A
公开(公告)日:2017-09-05
申请号:CN201710443083.5
申请日:2017-06-13
Applicant: 华侨大学
CPC classification number: G06T3/4038 , G06T7/11 , G06T7/44 , G06T7/62
Abstract: 本发明属于图像处理技术领域,公开了一种基于视觉特征的马赛克拼图的自动生成方法,将大量的小图像拼接成一副大图像。相比现在半自动的制作方式,自动生成方法基于图像底层特征,从有限的小图像素材集中找到一张最佳的图像拼接顺序,从而减少拼图中突兀的噪声块;采用基于信噪比的自适应图像叠加方法,避免在宏观上,大图局部细节的丢失。方法具体包括:大图的矩形分割;图像底层特征抽取;基于图像底层特征的小图像筛选;基于信噪比的自适应图像叠加。从拼图的效果上看,本发明的方法相比于目前的拼图方法有更好的视觉效果,与原图的误差较小;达到了人工手动调整的视觉效果,实现了全自动的马赛克拼图。
-
公开(公告)号:CN106682233A
公开(公告)日:2017-05-17
申请号:CN201710029935.6
申请日:2017-01-16
Applicant: 华侨大学
Abstract: 本发明的一种基于深度学习与局部特征融合的哈希图像检索方法,所述方法包括五个部分:(1)图像的预处理;(2)用卷积神经网络对含有分类标签的图像进行训练;(3)用二值化方式生成图像的哈希码并提取1024维浮点型局部聚合向量;(4)用哈希码进行粗检索;(5)用局部聚合向量进行精检索。本发明的一种基于深度学习与局部特征融合的哈希图像检索方法提取两种特征后用近似最近邻搜索策略来进行图像检索,检索精确度高、检索速度快。
-
公开(公告)号:CN119848427A
公开(公告)日:2025-04-18
申请号:CN202411967907.5
申请日:2024-12-30
Applicant: 华侨大学 , 厦门万宾科技有限公司
IPC: G06F18/10 , G06F18/213 , G06F18/214 , G06F18/2431 , G06F18/243 , G06N5/01
Abstract: 本发明公开了一种基于改进C4.5的真空干泵多故障预测方法及系统,方法包括:使用改进C4.5算法构建决策树模型并利用真空干泵的全寿命振动信号数据进行训练,得到训练好的多故障预测模型;获取真空干泵实时运行监测的振动信号数据,并对所述数据进行预处理;将预处理后的振动信号数据输入训练好的多故障预测模型,以预测振动信号数据中是否出现故障,并输出故障预测结果,所述预测结果包括故障类型及故障发生时间。本发明通过透明的决策过程、实时更新、精细特征提取和强大的多故障分类能力,解决了现有技术的不足,能够有效预测真空干泵的多种重叠故障,为设备维护提供及时的决策支持。
-
公开(公告)号:CN118015708A
公开(公告)日:2024-05-10
申请号:CN202410411050.2
申请日:2024-04-08
Applicant: 华侨大学
IPC: G06V40/20 , G06V20/40 , G06V10/44 , G06V10/62 , G06V10/764 , G06V10/766 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0985 , A63B24/00 , A63B69/00
Abstract: 一种基于裁判分数学习的跳水运动质量评估方法、装置和设备,涉及动作质量评估技术领域。方法包含S1、获取待评估视频。S2、根据待评估视频进行采样,获取待评估视频帧序列。S3、从训练集中选取对比视频帧序列。S4、通过空间特征编码器ViT分别进行编码,获取两个图像特征序列。S5、通过时序特征编码器TE分别进行编码,获取待评估视频级特征序列和对比视频级特征序列。S6、将两个特征序列输入裁判分数学习评估网络,获取动作质量得分。裁判分数学习评估网络利用基于交叉注意力机制的交叉特征融合网络和基于Transformer解码器的对比动作特征解码器来学习生成具有差异性的裁判分数特征,然后采用分数预测网络根据裁判分数特征预测动作质量得分。
-
公开(公告)号:CN113642420B
公开(公告)日:2024-04-16
申请号:CN202110843573.0
申请日:2021-07-26
Applicant: 华侨大学
Abstract: 本发明提供了一种唇语的识别方法、装置及设备,包括:获取视频数据,并对所述视频数据进行处理,以获得唇部图像序列;对所述图像序列进行双向时序的特征提取,生成所述唇部图像序列的表观特征;调用LSTM模型,对所述表观特征的变化进行镜头转换的边界检测并生成检测结果,根据所述检测结果初始化所述LSTM模型的隐含层和记忆层;提取所述隐含层的编码特征,并根据所述编码特征获取单词预测序列。减少现有的唇语识别算法的复杂度、时间复杂度的同时保持较高的准确率。
-
公开(公告)号:CN117115573B
公开(公告)日:2024-01-05
申请号:CN202311388102.0
申请日:2023-10-25
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/26 , G06V10/80 , G06V10/774 , G06V10/52
Abstract: 本发明提供了一种有毒生物图像分类识别方法、装置、设备及存储介质,先通过获取图像样本,调用基于均衡采样策略和逆向采样策略交叉训练过的分类模型基于所述图像样本的分辨率进行分割成多组切块;接着,基于特征提取的阶段调整所述多组切块的数量以及采样频率进行特征提取,以生成不同阶段的多尺度特征图;最后,对所述不同阶段的多尺度特征图进行融合后通过融合特征分类器进行预测,以生成所述图像样本的预测结果,其中,预测结果为所述图像样本是否为有毒生物,通过使用自适应样本平衡采样训练策略,缓解训练集类别样本数量不均衡造成的影响,有效的提高了在对有毒生物识别时的识别率。
-
公开(公告)号:CN117095244B
公开(公告)日:2024-01-05
申请号:CN202311349539.3
申请日:2023-10-18
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种红外目标识别方法、装置、设备及介质,包括获取红外摄像机采集到的红外图片数据集;调用训练好的YOLOv5目标识别模型对红外图片数据集的红外图片进行识别处理,生成输出特征张量和模型识别精度;调用注意力模块对输出特征张量和模型识别精度进行过滤处理,生成三个不同尺寸的过滤特征图;小目标识别头、中目标识别头和大目标识别头分别依照对应的不同尺寸的过滤特征图,对待识别物体进行识别。此外,现有的基于领域自适应的红外目标识别技术存在生成的图像质量不够稳定的问题。
-
公开(公告)号:CN117095244A
公开(公告)日:2023-11-21
申请号:CN202311349539.3
申请日:2023-10-18
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种红外目标识别方法、装置、设备及介质,包括获取红外摄像机采集到的红外图片数据集;调用训练好的YOLOv5目标识别模型对红外图片数据集的红外图片进行识别处理,生成输出特征张量和模型识别精度;调用注意力模块对输出特征张量和模型识别精度进行过滤处理,生成三个不同尺寸的过滤特征图;小目标识别头、中目标识别头和大目标识别头分别依照对应的不同尺寸的过滤特征图,对待识别物体进行识别。此外,现有的基于领域自适应的红外目标识别技术存在生成的图像质量不够稳定的问题。
-
公开(公告)号:CN117058472A
公开(公告)日:2023-11-14
申请号:CN202311316106.8
申请日:2023-10-12
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06V10/25 , G06V10/766 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本发明提供了基于自注意力机制的3D目标检测方法、装置、设备,涉及人工智能和计算机视觉技术领域,针对在两阶段网络模型中第一阶段得到感兴趣区域后点与点之间的信息密度不高问题,提出了一种基于自注意力机制的3D目标检测算法,通过增强点与点之间的交互信息密度,进而提高感受野的覆盖范围。在KITTI数据集上的实验证明,该方法在汽车、行人、自行车类数据集上的平均检测精度有了较大的提升,尤其在小目标稀疏的点中效果显著,这进一步证实了该算法的有效性。
-
公开(公告)号:CN116662587A
公开(公告)日:2023-08-29
申请号:CN202310942873.3
申请日:2023-07-31
Applicant: 华侨大学
IPC: G06F16/53 , G06F16/55 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于查询生成器的人物交互检测方法、装置及设备,方法包括以下步骤:读取待检测的目标图像;利用特征提取器对所述目标图像进行特征提取获得图像特征;随机初始化一组人‑物对的先验边界框,将所述图像特征与所述先验边界框共同输入查询生成器,并基于所述查询生成器生成每层实例检测器和交互分类器所需的两组查询向量以及查询向量的位置信息;经由不同的解码器将输入的图像特征、查询向量和位置信息解码为特征向量组;根据所述特征向量组得到人物交互的预测结果。本发明将查询向量视为候选的人物交互检测结果,通过初始化人‑物对的先验边界框,来从中生成所需的查询向量,能够更精准且高效地进行人物交互行为识别。
-
-
-
-
-
-
-
-
-