基于CLIP快速构建图像分类模型的方法

    公开(公告)号:CN117409262A

    公开(公告)日:2024-01-16

    申请号:CN202311719576.9

    申请日:2023-12-14

    Abstract: 本发明公开一种基于CLIP快速构建图像分类模型的方法,包括S1、搜集图像;S2、使用CLIP模型筛选特定标签图像;S3、制作分类数据集,将数据集划分为训练集和测试集;S4、使用DivideMix方法训练分类模型。本发明采用CLIP图文匹配技术,通过输入标签文本即可从海量数据中提取出符合标签要求的数据图像,构建出可以用学习分类模型的数据集,而无需人工标注。同时针对筛选出的图像中可能存在的噪声(即类别错误)的问题,本发明引入带噪声数据的学习方法DivideMix,以降低数据集中噪声带来的影响。用此方法训练图像分类模型,可以提升模型的训练效率,降低数据标注需求,成本低,同时还可以达到不错的模型效果。

    基于图像语义识别的场站特殊旅客识别和交互系统及方法

    公开(公告)号:CN116758591A

    公开(公告)日:2023-09-15

    申请号:CN202311044432.8

    申请日:2023-08-18

    Abstract: 本发明公开了一种基于图像语义识别的场站特殊旅客识别和交互系统及方法,系统包括:图像采集终端、图像语义模型训练服务器、图像识别终端及交互终端,图像采集终端设有图像采集模块,图像语义模型训练服务器设有通用图像语义识别大模型及特殊旅客数据集,图像识别终端设有图像语义识别模块,交互终端设有服务人员提示模块、服务人员确认模块及特殊旅客关怀交互模块;本发明采用人工智能辅助服务人员的方式,从“发现”到“确认”到“帮服措施”,形成一整套完整的识别和交互系统,采用语义图像分析识别技术,对通用图像语义识别大模型进行微调训练,可适应复杂的场景和各式各样人的特征,具有较高的鲁棒性和准确性,可提高特殊旅客的发现效率。

    一种具有宽动态和LFM功能的USB摄像头及其电路

    公开(公告)号:CN116528055A

    公开(公告)日:2023-08-01

    申请号:CN202211569207.1

    申请日:2022-12-08

    Abstract: 本发明公开了一种具有宽动态和LFM功能的USB摄像头及其电路,涉及摄像技术领域,USB摄像头电路包括依次连接的图像传感器电路、图像处理电路、USB发送电路,图像传感器电路用于进行宽动态的图像采集和LFM功能处理,图像处理电路对图像传感器电路输出的图像进行处理,并以MIPI界面传输给USB发送电路,USB发送电路用于以USB信号输出图像信号。本申请具有宽动态图像范围和LFM处理能力,提高了图像输出效果。

    一种基于现代浏览器的操作界面应用系统

    公开(公告)号:CN116301840A

    公开(公告)日:2023-06-23

    申请号:CN202211483344.3

    申请日:2022-11-24

    Abstract: 本发明公开了一种基于现代浏览器的操作界面应用系统,涉及设备界面开发的技术领域,包括界面交互端和硬件控制模块,界面交互端包括界面展示模块、指令生成模块和指令传输模块,界面展示模块用于开启预设的浏览器并控制开启的浏览器显示预设的操作界面;指令生成模块用于基于操作界面的点击操作生成相应的控制指令;指令传输模块用于与硬件控制模块连接将控制指令发送给硬件控制模块;硬件控制模块用于接收控制指令以控制设备动作。由现代浏览器访问特定的网址来展示预设的web网页,通过web网页来代替传统的GUI界面,用户通过对web网页的操作也可以正常生成控制指令以控制硬件设备动作,而web网页的开发更加通用、高效。

    双目摄像头的标定方法、装置、计算机可读介质及设备

    公开(公告)号:CN115994950A

    公开(公告)日:2023-04-21

    申请号:CN202211623863.5

    申请日:2022-12-16

    Abstract: 本申请的实施例提供了一种双目摄像头的标定方法、装置、计算机可读介质及设备。该方法包括:获取由各摄像头针对同一拍摄内容分别拍摄到的第一拍摄图像和第二拍摄图像;分别确定第一拍摄图像、第二拍摄图像中各标定图像对应的特征点信息以确定双目摄像头对应的目标标定信息,并分别确定各拍摄图像到共面行对准平面的第一转换矩阵和第二转换矩阵;对各拍摄图像中所包含的待检测人脸图像进行深度识别,确定对应的深度信息;将深度信息与实际距离进行比较,以确定标定结果是否有效。本申请实施例的技术方案可以提高双目摄像头的标定效率,并保证标定结果的准确性。

    一种基于YOLOV3司机危险动作识别方法及系统

    公开(公告)号:CN110969130B

    公开(公告)日:2023-04-18

    申请号:CN201911220885.5

    申请日:2019-12-03

    Inventor: 袁嘉言

    Abstract: 本发明提供一种基于YOLOV3司机危险动作识别方法,获取司机的红外图像,通过人脸检测算法确定人脸位置,并且按照人脸位置选取司机危险行为待识别区域;使用YOLOV3算法快速检测待识别区域是否发生司机危险动作状态;如果YOLOV3算法检测到司机在做危险动作,将危险动作区域提取出来做深度学习分类,确定司机在做哪种危险行为;统计一段时间内,如果司机都在做某种危险行为,则提醒司机注意安全驾驶,并且将司机危险行为上传在云端;本发明还提供一种基于YOLOV3司机危险动作识别系统,使预测结果更为准确能大大减少警报危险行为的误识别。

    旅客出入闸的尾随监测方法、装置、介质及设备

    公开(公告)号:CN115953737A

    公开(公告)日:2023-04-11

    申请号:CN202310070663.X

    申请日:2023-01-17

    Abstract: 本申请的实施例提供了一种旅客出入闸的尾随监测方法、装置、介质及设备。该方法包括:实时获取关于尾随监测区域的监控视频;根据所述监控视频进行识别,确定所述尾随监测区域是否同时存在至少两位旅客,若是,则确定尾随事件发生,并向闸机发送用于提示禁止尾随的提示信息;根据后续的监控视频进行识别,确定所述至少两位旅客分别对应的行为信息;根据所述至少两位旅客分别对应的行为信息,确定所述尾随事件的事件类型;执行预先设定的与所述事件类型对应的应对策略。本申请实施例的技术方案可以提高尾随事件识别的准确性,并合理采用相对应的应对措施。

    一种顾客类型判断方法、系统、设备和介质

    公开(公告)号:CN111401232B

    公开(公告)日:2023-04-07

    申请号:CN202010177123.8

    申请日:2020-03-13

    Inventor: 唐士锵 王欣

    Abstract: 本发明提供一种顾客类型判断方法、系统、设备和介质,方法包括:接收上传的人脸抓拍图片;将所述人脸抓拍图片替换其他的人脸抓拍图片;将抓拍图片与人脸库中的图片进行比对,将比对结果进行推送;通过门店或商场内布设的人脸识别设备,通过抓拍人脸并上传到云端,在相应的人脸库里进行比对从而判断顾客类型。顾客进店后就会推送该顾客的类型及历史购买喜好,使店员可以针对性地采用不同的话术进行商品推销。

    基于人脸图像进行年龄和性别预测的方法、系统和设备

    公开(公告)号:CN111091109B

    公开(公告)日:2023-04-07

    申请号:CN201911345806.3

    申请日:2019-12-24

    Inventor: 徐绍凯 贾宝芝

    Abstract: 本发明提供一种基于人脸图像进行年龄和性别预测的方法、系统和设备,方法包括:获取一图片;使用人脸检测算法检测图片中的人脸位置和特征点位置,根据预设的参数对人脸进行矫正和截取,得到标准的人脸图片;使用预训练的神经网络模型对标准的人脸图片进行预测,输出人脸年龄和性别;神经网络模型采用了特征金字塔结构,能够提取从高到低的更丰富的多层次人脸特征,同时将年龄值表示为端点权值向量,在模型训练阶段作为中间层监督信息与年龄值回归一起训练模型,而在预测阶段直接输出年龄回归值,在速度和精度上均优于现有方法;本发明使用单阶段单模型的方法,快速准确地对视频或图片中的人脸进行年龄和性别的预测,预测结果可用于多种场景。

Patent Agency Ranking