-
公开(公告)号:CN103116748A
公开(公告)日:2013-05-22
申请号:CN201310077048.8
申请日:2013-03-11
Applicant: 清华大学
IPC: G06K9/00
Abstract: 本发明提出一种基于路面标识识别违规驾驶行为的方法及系统。其中,方法包括以下步骤:获取车辆行驶的道路图像,并对道路图像进行预处理以生成道路图像的二值化图像;根据二值化图像中的白像素点确定道路的边界以生成道路边界线;从道路图像中检测与道路边界线对应的道路线之间是否有引导标识,其中,引导标识包括公交专用标识和方向标识;以及当引导标识为方向标识时,根据方向标识和车辆状态信息判断车辆是否违规行驶。根据本发明实施例的方法,通过生成道路图像的二值化图像,并在该二值化图像中判别引导标识识别驾驶是否规范,提前预防了交通事故的发生,进而提高了驾驶的安全性。
-
公开(公告)号:CN102184405B
公开(公告)日:2012-12-26
申请号:CN201110098035.X
申请日:2011-04-19
Applicant: 清华大学
Abstract: 本发明涉及图像处理技术领域,具体公开了一种图像采集分析方法,包括:步骤1.制作若干个标尺并将其摆放在每行超市货架上,所述标尺上具有若干组编码;步骤2.采集摆放有所述标尺的货架的图像;步骤3.对采集到的所述图像分离色彩通道,在分离后的各个通道上检测标尺的编码;步骤4.根据对所述编码的检测结果对图像进行校正;步骤5.根据对所述编码的检测结果在校正后的图像上分割出图像中包含商品的区域;步骤6.在所述区域上利用颜色特征和局部纹理特征对商品进行分类,进而得到商品摆放的相关信息。本发明能够高效、准确的得到商品在货架上的摆放位置、数量等信息。而且本方法简便易行,节省大量人力物力。
-
公开(公告)号:CN102542492A
公开(公告)日:2012-07-04
申请号:CN201210006449.X
申请日:2012-01-10
Applicant: 清华大学
Abstract: 本发明公开了一种视觉广告效果评估系统及方法,图像处理及计算机视觉技术领域。该系统包括:采集模块,用于按照设定的采集频率,实时采集设定范围内经过待评估的广告牌的行人的视频图像、以及设定范围内的背景图像;数据处理模块,用于根据计算机视觉方法及图像处理方法,对采集模块采集到的视频图像进行处理,获取经过待评估的广告牌的行人流量、行人观看比例以及行人观看时间数据,并将数据发送至评估模块;评估模块,用于根据所述行人流量、行人观看比例以及行人观看的时间数据评估所述待评估广告的设置方位和适度以及内容吸引度。可以有效地实现对视觉广告效果进行评估,并能进行广告优劣的评价,且评估精度高。
-
公开(公告)号:CN118587735A
公开(公告)日:2024-09-03
申请号:CN202410490877.7
申请日:2024-04-23
Applicant: 清华大学
Abstract: 本发明提供一种泛化行人检索特征学习方法和装置,该方法包括:确定无标注的行人检索视频训练集;对训练集进行视频帧间隔采样,得到视频帧训练样本;将视频帧训练样本输入行人检索网络模型,确定行人检索网络模型输出的行人检索训练正样本对;根据训练正样本对调节行人检索网络模型的损失函数,以对行人检索网络模型进行无监督的特征学习训练;重复迭代执行采样的步骤、样本输入的步骤和调节的步骤,直至达到预设训练次数,完成对行人检索网络模型的泛化特征学习训练过程。本发明学习的特征具有身份鉴别性和泛化性,能够在任意场景中不经过微调直接使用,提升了行人检索特征学习的泛化性能。
-
公开(公告)号:CN112215223B
公开(公告)日:2024-03-19
申请号:CN202011107999.1
申请日:2020-10-16
IPC: G06V20/62 , G06V30/18 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多元注意力机制的多方向场景文字识别方法及系统,所述方法包括:由特征提取器对从外接的文字检测模块输出的文本行/列图像I进行归一化处理,利用深层卷积神经网络对经归一化的图像提取特征,得到原始特征图F0,在原始特征图F0上叠加二维方向位置编码P输出多通道特征图F;由编码器将从特征提取器输出的多通道特征图F转换为隐含表示H;由解码器将从编码器输出的隐含表示H转换为识别文本作为输出结果。本发明提供的多方向场景文字识别方法及系统,适用于识别场景图像中的横排、竖排多种方向以及弯曲文本行,具有较强的适用性。
-
公开(公告)号:CN116631019B
公开(公告)日:2024-02-27
申请号:CN202210302699.1
申请日:2022-03-24
Applicant: 清华大学 , 首都医科大学附属北京佑安医院
Abstract: 了口罩适合性检测的成本。本发明提供一种基于面部图像的口罩适合性检测方法及装置,其中方法包括:获取受试者的正面面部图像;将所述正面面部图像输入至适合性检测模型,获得所述适合性检测模型输出的一个或多个适合性因数,每个所述适合性因数与预设口罩型号一一对应;其中,所述适合性检测模型是基于图像样本以及所述图像样本对应的一个或多个适合性因数标签进行训练后得到的,每个所述适合性因数标签是根据所述图像样本
-
公开(公告)号:CN117373010A
公开(公告)日:2024-01-09
申请号:CN202311329890.6
申请日:2023-10-15
Applicant: 清华大学
IPC: G06V20/62 , G06V10/44 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了基于深度表征学习的车牌图像识别方法及系统,该方法,包括获取车牌图像样本数据送入车牌识别模型;其中,车牌识别模型,包括图像校正模块、特征提取模块、编码器和解码器;利用图像校正模块对车牌图像进行图像校正得到校正图像,并利用特征提取模块对校正图像进行特征提取得到最终特征图;将最终特征图输入至编码器得到隐含表征序列,并利用解码器对隐含表征序列进行解码得到车牌识别结果。本发明适用于识别开放场景中动态获取的车牌图像,可提高低质量车牌图像识别性能。
-
公开(公告)号:CN115497120B
公开(公告)日:2023-12-15
申请号:CN202211166187.3
申请日:2022-09-23
Applicant: 清华大学 , 佛山市帆思科材料技术有限公司
IPC: G06V40/10 , G06V10/762 , G06V10/44 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了基于Transformer的两步式领域自适应行人再识别方法,属于行人再识别技术领域,将所述源域图像和class token编码后输入Transformer识别模型,提取源域图像中的行人特征,并反向传播更新模型;获取目标域图像,将目标域图像编码后输入Transformer识别模型,提取目标域图像中的行人特征,并反向传播更新模型;开放模型中所有参数,将经过过滤的目标域图像输入Transformer识别模型,提取目标域图像的行人特征,并反向传播更新模型;本发明将Transformer应用到领域自适应行人再识别中,提升了识别模型的性能。
-
公开(公告)号:CN114083535B
公开(公告)日:2023-06-13
申请号:CN202111371166.0
申请日:2021-11-18
Applicant: 清华大学
IPC: B25J9/16
Abstract: 本发明提供一种机器手抓取姿势质量的物理度量方法及装置。其中,该方法包括:确定机器手的候选抓取姿势与物体之间接触点的平坦度分数;确定所述候选抓取姿势夹持所述物体的重心分数;基于所述平坦度分数和所述重心分数评估候选抓取姿势的质量。本发明提供的机器手抓取姿势质量的物理度量方法,基于人类在生活中拿起物体时倾向于接触物体上更平坦的部位以及习惯于接触物体的中心部位的特性,通过两种物理度量分数分别从物体自身平坦度和重力分析上评价机器手抓取姿势的质量,使得候选抓取姿势的评价结果具有更强的鲁棒性,在对实际物体预测抓取姿势时,能够选择出更加优质的候选抓取姿势,从而提升了后续机器手抓取姿势控制的精确度和稳定性。
-
公开(公告)号:CN114723718A
公开(公告)日:2022-07-08
申请号:CN202210395710.3
申请日:2022-04-14
Applicant: 清华大学
Abstract: 本发明提供一种大场景图像的区域提取方法及装置,其中的区域提取方法包括:S1,获取目标图像;S2,将目标图像输入至骨干特征网络,得到目标图像的骨干特征图;S3,获取目标图像的区域记录特征图;S4,根据骨干特征图和区域记录特征图,得到目标图像的目标状态;S5,将目标状态输入至策略生成网络,获取目标图像的区域提取策略;S6,根据区域提取策略,确定待提取的目标区域,并从目标图像中提取目标区域,目标区域由一个或多个子目标区域构成。该方法解决了现有技术中大场景图像处理效率低且缺乏灵活性的缺陷,有效提高了大场景图像处理效率,并增加了对大场景图像区域提取的灵活性。
-
-
-
-
-
-
-
-
-