-
公开(公告)号:CN107679585A
公开(公告)日:2018-02-09
申请号:CN201710889188.3
申请日:2017-09-27
Applicant: 清华大学
CPC classification number: G06K9/6821 , G06N3/049 , G06N3/08
Abstract: 本发明提供一种基于时间残差长短时记忆网络的阿拉伯文识别方法及系统,所述方法包括:S1、在长短时记忆LSTM网络中每一LSTM单元中添加时间残差连接,以构造时间残差LSTM网络,所述时间残差连接用于将所述LSTM单元前一时刻的输出加权叠加到所述LSTM单元当前时刻的输出上;S2、基于训练后的所述时间残差LSTM网络,对输入的阿拉伯文图像序列进行识别。本发明提供的基于时间残差长短时记忆网络的阿拉伯文识别方法及系统,通过在时间维度上将残差学习的思想与LSTM相结合,将LSTM网络上一时刻的输出加权叠加到当前输出上,形成时间残差LSTM网络,从而使得较深的神经网络易于训练,提高了阿拉伯文的识别率。
-
公开(公告)号:CN107066945A
公开(公告)日:2017-08-18
申请号:CN201710143006.8
申请日:2017-03-10
Applicant: 清华大学
CPC classification number: G07C9/00158 , G06K9/00255 , G06K9/00771
Abstract: 本发明实施例涉及电子信息技术领域,提供一种大流量通关快速身份核验方法和系统,其中方法包括:获取预设摄像机实时采集的行人的第一监控图像,识别第一监控图像中人脸获取人脸图像,根据人脸图像确定行人的行人身份类型及人脸图像在第一监控图像中的图像坐标;根据图像坐标、预设深度摄像机采集的行人距离信息及深度摄像机的标定信息获取行人在行人通道中的地理坐标;控制地踩式多色LED阵列在行人的地理坐标区域显示与行人的行人身份类型对应的行进标识,以提示行人按照行进标识的指示行进。本发明实施例提供的大流量通关快速身份核验方法和系统,能够大幅提高核验效率和通行能力,且能够保证对所有通行人员无遗漏的身份核验。
-
公开(公告)号:CN107025435A
公开(公告)日:2017-08-08
申请号:CN201710139212.1
申请日:2017-03-09
Applicant: 清华大学
IPC: G06K9/00
CPC classification number: G06K9/00268 , G06K9/00228
Abstract: 本发明实施例提供一种人脸识别处理方法及系统,涉及计算机视觉与图像处理领域,所述方法包括:获取待识别人的身份证人脸相片和实时人脸图像;提取所述身份证人脸相片中的人脸特征和所述实时人脸图像中的人脸特征;根据所述身份证人脸相片中的人脸特征,以及实时人脸图像中的人脸特征计算身份证人脸特征自相关系数、现场人脸特征自相关系数和身份证现场人脸特征互相关系数;识别所述待识别人身份。通过利用了高清证件照的细节特征、二代身份证芯片人脸图片分辨率较低但姿态正光照好的特点,以及现场采集的人脸照姿态表情变化大等特点,进行训练得到辅助参数,提升了人脸识别处理的准确率以及场景适应性。
-
公开(公告)号:CN102663820B
公开(公告)日:2014-10-22
申请号:CN201210133145.X
申请日:2012-04-28
Applicant: 清华大学
IPC: G06T17/00
Abstract: 本发明公开了一种三维头部模型重建方法,包括以下步骤:S1:输入人脸的正面和侧面图像;S2:提取图像面部和头发区域的特征点;S3:根据面部特征点形变生成三维头部模型;S4:根据图像生成无缝的全局头部纹理;S5:将所得纹理映射到形变三维头部模型上;S6:根据头发区域特征点,用昆氏曲面进行头发区域的拟合;S7:将昆氏曲面形变,并进行纹理贴图。本方法简便易行,计算复杂度低,在保证精度的前提下能很真实的重建三维头部模型。
-
公开(公告)号:CN101140624A
公开(公告)日:2008-03-12
申请号:CN200710176039.9
申请日:2007-10-18
Applicant: 清华大学
Abstract: 本发明公开了一种图像匹配方法,属于图像匹配技术领域。所述方法包括:利用MSER方法检测出待匹配的图像中的同质区域;采用椭圆区域方程对检测到的每个同质区域进行拟合;采用椭圆形梯度直方图和多尺度图像分解抽取经过椭圆区域方程拟合后的同质区域所在测量区域的特征向量;采用分层k均值聚类算法构造同质区域集合的二叉树,进行图像匹配。所述方法还包括:采用结合二叉树的渐进式方法构建感兴趣区域的分类器,进行图像匹配。本发明结合图像尺度空间和统计学习方法大大地降低了提取图像特征向量的复杂度和局部区域匹配复杂度,同时增强了图像匹配算法的稳定性。
-
公开(公告)号:CN100356388C
公开(公告)日:2007-12-19
申请号:CN200510136310.7
申请日:2005-12-31
Applicant: 清华大学
IPC: G06K9/00
Abstract: 本发明属于分类器集成和模式识别领域,其特征在于,首先通过各种采集设备获得用户的人脸、虹膜、在线签名和脱机笔迹各生物特征,接下来将这些生物特征分别送入对应的识别认证子模块进行特征提取和模板匹配,并输出各自匹配后得到的分数。这些分数经过归一化后,或者被送入识别融合模块,通过置信度集成等步骤得到最后的识别结果;或者被送入认证融合模块,映射到多维空间并通过分类器分类后得到最后的认证结果;或者识别融合之后再次进行认证融合,得到认证后的最终识别结果。经过融合以后,无论是进行验证还是识别,总的错误率较之单一生物特征识别认证系统,都得到了降低。
-
公开(公告)号:CN113326762B
公开(公告)日:2025-04-25
申请号:CN202110580830.6
申请日:2021-05-26
Applicant: 清华大学
IPC: G06V40/16 , G06V10/80 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/045 , G06F40/284
Abstract: 本发明提供一种人脸图像的情绪确定方法、装置、电子设备及存储介质,其中所述方法包括:对待分析人脸图像进行卷积计算,提取所述待分析人脸图像的全图特征;对所述全图特征进行解耦,得到多个人脸部件的特征;基于动态融合依据状态,动态融合所述多个人脸部件的特征,形成高层次语义特征;基于所述高层次语义特征和语言生成模型,以逐词预测的方式生成情绪描述语句,提升了所生成的情绪描述语句的质量。
-
公开(公告)号:CN119722700A
公开(公告)日:2025-03-28
申请号:CN202411716850.1
申请日:2024-11-27
Applicant: 清华大学
IPC: G06T7/11 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明提供一种全切片肾小球图像分割方法、装置、电子设备及存储介质,其中的方法包括:获取原始全切片肾小球图像及其对应的光学缩放倍率;根据光学缩放倍率和边缘移除机制,对原始全切片肾小球图像进行自适应裁剪,得到多个输入图像块;基于预先训练的图像分割模型对多个输入图像块逐一进行分割,得到多个图像块分割结果;其中,图像分割模型基于nnU‑Net网络及其变式构建得到;将多个图像块分割结果进行重叠拼接,得到原始全切片肾小球图像的目标分割结果。该方法通过基于光学缩放倍率的先验知识,确保了裁剪后的多个输入图像块与训练图像的尺度一致,与此同时,通过引入边缘移除机制,采用重叠的方式进行裁剪,有效避免了肾小球处于裁剪边缘时的边缘效应,实现了对全切片肾小球图像中复杂解剖结构和病变区域的准确分割,提升了图像分割结果的精确度和鲁棒性。
-
公开(公告)号:CN119444569A
公开(公告)日:2025-02-14
申请号:CN202411302332.5
申请日:2024-09-18
Applicant: 清华大学
IPC: G06T3/4053 , G06T5/94 , G06T7/13 , G06T7/33 , G06V40/10
Abstract: 本发明提供一种基于超分辨算法的指静脉图像预处理方法及系统,包括:获取原始指静脉图像,将所述原始指静脉图像输入至预设的超分辨率模型,输出高分辨率指静脉图像;基于所述高分辨率指静脉图像进行对比度增强,生成高对比度图像;基于所述高对比度图像进行手指旋转对齐和手指轮廓边界提取,获得手指轮廓图像;根据所述手指轮廓图像进行静脉区配准,生成灰度图像,对所述灰度图像进行二值化处理,完成指静脉图像预处理。本发明解决了现有指静脉图像识别精度低的问题。
-
公开(公告)号:CN116416480A
公开(公告)日:2023-07-11
申请号:CN202310680502.2
申请日:2023-06-09
Applicant: 清华大学
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06V10/774 , G06N3/0895 , G06N3/09
Abstract: 本发明提供一种基于多模板提示学习的视觉分类方法和装置,涉及机器学习技术领域,包括:利用候选文本集生成多个提示模板下的候选文本集;将待分类的视频的连续视频帧和每一个提示模板下的候选文本集输入视觉语言编码模型中,得到视频在每一个提示模板下的类别概率分布;利用所述类别概率分布,确定视频的视觉分类结果。本发明对多个预设提示模板和融入帧融合模块的视觉语言预训练模型进行全监督模板参数优化‑半监督模型优化以及全监督模板参数微调得到多个提示模板和视觉语言编码模型,提高了视觉语言预训练模型泛化到下游视觉理解任务时的训练样本利用效率,进而将多个提示模板和视觉语言编码模型应用于下游视觉理解任务时可提高理解的准确度。
-
-
-
-
-
-
-
-
-