-
公开(公告)号:CN118710537B
公开(公告)日:2024-11-15
申请号:CN202411206290.5
申请日:2024-08-30
Applicant: 厦门瑞为信息技术有限公司
IPC: G06T5/70 , G06V10/82 , G06N3/0464 , G06T7/90 , G06V10/80
Abstract: 本发明公开了深度学习模型的暗光图像增强方法,raw图像会先经过混合特征补偿机制以增强模型对图像细节及纹理特征的处理;然后,编码器负责捕捉图像的关键特征信息和噪声信息,为后续的图像去噪和颜色渲染提供基础;随后,raw解码器将编码器提取的特征进行处理,实现图像去噪,利用raw图像的噪声可处理特性去除图像中的噪声,保留图像的重要细节和纹理;最后,带稀疏注意力及门控前馈机制的sRGB解码器负责颜色空间的转换和色彩增强,确保最终图像在视觉上更接近真实世界的光照条件,以便在各种显示设备上呈现。本发明通过引入混合特征补偿机制、稀疏注意力机制以及门控前馈机制能够有效改善低光照环境下的图像质量。
-
公开(公告)号:CN118865537A
公开(公告)日:2024-10-29
申请号:CN202411347350.5
申请日:2024-09-26
Applicant: 厦门瑞为信息技术有限公司
Abstract: 本发明提供一种单目俯视镜头辅助儿童过闸后关闭闸门的方法和装置,所述方法包括:认证步骤,闸机进行行人认证,当认证通过后,闸机开门,同时发送开门信号给单目俯视镜头模组;视觉检测步骤,利用单目俯视镜头模组捕捉实时图像,并将实时图像通过多头分区儿童检测处理,进行实时儿童检测;策略判定步骤,单目俯视镜头模组利用检测步骤的检测结果,判定行人是否通过闸机;如果不是,不做处理;如果是,则发送关门信号给闸机;关门步骤,闸机收到单目俯视镜头模组发送的关门信息,执行关门操作,并准备下一轮行人认证。所述方法提高当行人是儿童时的关门准确性。
-
公开(公告)号:CN118821853A
公开(公告)日:2024-10-22
申请号:CN202410923960.9
申请日:2024-07-11
Applicant: 厦门瑞为信息技术有限公司
IPC: G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种带多尺度池化的transformer模块处理方法,可用于基于深度神经网络的活体检测模型中,用以在训练阶段辅助训练CNN分支,能够为CNN分支提供全局上下文信息,增强模型对图像中的长距离依赖关系的建模能力。此外,通过将多尺度池化引入至transformer模块的多头自注意力模块中,能够有效压缩特征序列的长度,减少训练模型所需要的计算资源,同时获取极具判别性的特征表示,进一步提升了模型的性能。
-
公开(公告)号:CN118470808A
公开(公告)日:2024-08-09
申请号:CN202410923964.7
申请日:2024-07-11
Applicant: 厦门瑞为信息技术有限公司
IPC: G06V40/40 , G06V10/82 , G06N3/0464 , G06V10/774 , G06N3/096
Abstract: 本发明公开了一种基于局部卷积与语义信息的活体检测装置与方法,利用深度神经网络结构的活体检测模型并进行模型推理,活体检测模型包括CNN分支、transformer分支、语义信息对齐模块及模型损失计算模块,带多尺度池化的多头自注意力模块作为transformer模块的一部分,通过压缩特征序列长度和增强特征表示能力,进一步提升了模型的性能。本发明利用局部卷积以显著降低模型参数量及内存访问次数,在保障模型原有判别性以及抗干扰能力的情况下,使活体检测模型能够在资源受限的设备或场景中运行,实现对图像中的真假人脸进行准确区分,具有较高的真人通过率和抵抗各类攻击的能力。
-
公开(公告)号:CN118470436A
公开(公告)日:2024-08-09
申请号:CN202410909764.6
申请日:2024-07-09
Applicant: 厦门瑞为信息技术有限公司
IPC: G06V10/764 , G06V10/82 , G06V40/10 , G06V10/25 , G06V10/10 , G06N3/0455 , G01V8/00
Abstract: 本发明公开了一种提升毫米波安检仪违禁品检测能力的方法,其从毫米波的本质出发,通过调节毫米波信号增益强度,生成多种不同DB的毫米波图片用于深度学习算法的训练,提升算法的准确率和鲁棒性。针对毫米波图像中不存在人体的空白区域,采用基于关键点外推的方法进行去除,使算法聚焦于有效区域,降低算法推理消耗。为了让检测算法能达到更高的准确率,本发明将去除空白区域的正、背面图像水平拼接起来,输入检测算法,让算法在推理时可以得到更多的有效信息。为了让检测算法充分注意到图像中正、背面图像的相关性,本发明对DETR算法进行了的修改,引导算法中的注意力机制,更好的发挥作用。
-
公开(公告)号:CN117726701A
公开(公告)日:2024-03-19
申请号:CN202311586389.8
申请日:2023-11-27
Applicant: 厦门瑞为信息技术有限公司
IPC: G06T11/00 , G06V40/16 , G06N3/0475 , G06N3/08
Abstract: 本发明公开了基于可见光图像生成紫外光图像的方法、系统及应用,主要利用深度学习生成器网络,先通过精心设计的专用可见光和紫外光数据采集双目模组进行采集对齐的帧同步的图像数据,然后对可见光图像数据进行人脸区域检测,利用分割网络生成人脸区域掩码并用于模型训练损失函数计算,设计好相应的深度学习生成器网络,对模型进行训练,在模型效果收敛后,给生成器模型提供常规手机,相机拍摄的高清人脸图像作为输入,可推理预测出相应的紫外人脸图像。该紫外人脸图像可应用到生物识别、健康诊断、艺术创作和数字娱乐等领域。
-
公开(公告)号:CN116170581A
公开(公告)日:2023-05-26
申请号:CN202310132397.9
申请日:2023-02-17
Applicant: 厦门瑞为信息技术有限公司
IPC: H04N19/103 , H04L9/40 , H04L69/04
Abstract: 本申请涉及一种基于目标感知的视频信息编码方法和电子设备,该方法通过在编码前实现针对不同目标的感知能力,并可根据实际场景需求灵活选择不同的目标感知器以及编码模式,实现对特定目标进行感知并按需进行不同模式视频信息的编码操作,通过不同模式选择可实现对内存空间、网络带宽、存储介质空间和能源等方面大幅节省,也可确保视频流信息在其整个生命周期中除了摄像头采集阶段(包括编码、传输、存储、兼容式解码和呈现阶段)全程做到信息脱敏,做到视频信息全链路安全。在兼容标准解码模式数据呈现基础上,还可利用专用解码器进行完全解码,实现恢复摄像头采集的原始视频信息。
-
公开(公告)号:CN115795507A
公开(公告)日:2023-03-14
申请号:CN202211530484.1
申请日:2022-12-01
Applicant: 厦门瑞为信息技术有限公司
Abstract: 本发明公开了一种边端多路视频流脱敏及逆转方法、系统和专用播放器,对边端获取的多路视频流原始数据进行整合及编码,对整合数据进行人脸检测,解析人脸位置及原始数据位置,复制人脸区域数据进行压缩和加密,将人脸位置、视频流ID、视频流起始帧时间、帧号等信息进行编码,对整合数据中人脸区域进行脱敏处理,存储脱敏后的整合数据及加密后的人脸数据,在显示终端显示出脱敏后的整合数据。采用专用播放器,对脱敏后整合数据、人脸加密进行逆向操作,恢复到原始视频数据进行播放,以满足对原始视频记录的要求,本申请能够在达到脱敏要求的情况下,降低对带宽与存储器的需求量,实现保密。
-
公开(公告)号:CN114612764A
公开(公告)日:2022-06-10
申请号:CN202210142734.8
申请日:2022-02-16
Applicant: 厦门瑞为信息技术有限公司
Abstract: 本发明公开了一种基于毫米波图像的物品检测方法、装置及可读介质,通过获取人体正面和背面的毫米波图像,将人体正面和背面的毫米波图像输入经训练的主干网络分别提取正面特征和背面特征;基于注意力机制将正面特征和背面特征分别进行交互融合扩充,并将得到的扩充正面特征图像和/或扩充背面特征图像输入经训练的基于非同源数据的多任务神经网络架构,输出全图物品检测结果和人体骨架检测结果;基于人体骨架检测结果将图像划分成多个特征块,并对每个特征块采用独立的检测头分别进行检测,得到二次检测结果,再在原图上进行位置映射,得到分块物品检测结果;将分块物品检测结果与全图物品检测结果进行非极大值抑制,得到最终的物品检测结果。
-
公开(公告)号:CN118570885B
公开(公告)日:2025-03-04
申请号:CN202411026995.9
申请日:2024-07-30
Applicant: 厦门瑞为信息技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了基于补丁幅值和熵引导策略的活体检测方法与装置,利用SE模块筛选出图片中的k个显著补丁,对于每个显著补丁,其幅值会与其他同类别的图片的补丁的幅值进行随机混合并与显著补丁的相位信息结合,以生成多样化的数据。随着多样化补丁的不断生成,间接鼓励活体检测模型利用脸部的其他区域信息来判断真假人脸。此外,本发明使用熵引导的难例挖掘策略来挖掘难例,能够根据token中包含的总信息量来动态调整样本图像的重要性权重,使活体检测模型在人脸关键区域被遮挡的情况下仍能结合剩余的特征信息以做出鲁棒性的判断。本发明能够缓解活体检测模型的过拟合问题,并提升活体检测模型的泛化能力。
-
-
-
-
-
-
-
-
-