人脸关键点检测方法、装置及存储介质

    公开(公告)号:CN109558837B

    公开(公告)日:2024-03-22

    申请号:CN201811437216.9

    申请日:2018-11-28

    Inventor: 李宣平 李岩

    Abstract: 本公开是关于一种人脸关键点检测方法、装置及存储介质,属于图像处理领域。方法包括:获取平均人脸图像和平均人脸图像中平均人脸关键点的坐标;获取与平均人脸图像的尺寸相同的目标图像;生成第一图像,第一图像中各个像素点的像素值为目标图像和平均人脸图像中对应像素点的像素值之差;基于检测模型和第一图像,获取目标图像中的目标人脸关键点的坐标与平均人脸关键点的坐标之间的坐标差;根据平均人脸关键点的坐标和坐标差,确定目标人脸关键点的坐标。由于第一图像的数据量小于目标图像,能够降低检测模型的计算量,进而降低了对检测装置的处理能力要求,能够适用于多种类型的检测装置中,适用范围大。

    图像处理方法、装置及设备

    公开(公告)号:CN112712471B

    公开(公告)日:2024-03-15

    申请号:CN201911026262.4

    申请日:2019-10-25

    Inventor: 张水发 李岩

    Abstract: 本公开关于一种图像处理方法、装置及设备,并具体公开了:当待处理图像中过曝像素占总像素的比例不小于预设比例时,获取与待处理图像对应的目标图像;其中,待处理图像与目标图像分别为使用不同的曝光值对同一拍照对象进行拍照时得到的图像;目标图像中过曝像素占总像素的比例小于预设比例;基于目标图像中非过曝像素的灰度值,对待处理图像中过曝像素的灰度值进行调整,以及基于目标图像中非过曝像素的亮度值,对待处理图像中非过曝像素的亮度值进行调整。

    图像处理模型的确定方法、装置、设备及存储介质

    公开(公告)号:CN113052240B

    公开(公告)日:2024-03-05

    申请号:CN202110328519.2

    申请日:2021-03-26

    Abstract: 本公开关于一种图像处理模型的确定方法、装置、设备及存储介质,涉及图像处理领域。本公开实施例中,对于每个样本图像,通过增加旋转图像,考虑到旋转图像的哈希码与样本图像的哈希码一致的特性,引入了另一种损失值,结合这种损失值与训练样本图像之间相似度的损失值,对图像处理模型的模型参数进行更新,能够使得图像处理模型在获取到更准确的哈希码,基于哈希码进行后续处理,也能够得到更准确的处理结果,因而能够提高该图像处理模型的准确性,且旋转图像为对样本图像进行几何变换得到的,这样该图像处理模型对几何变换前后的图像均能够进行准确处理,具有更好的鲁棒性,且无需标注数据,减少了人工成本,提高数据处理效率。

    点击模型确定方法、搜索方法、装置、服务器及介质

    公开(公告)号:CN113254734B

    公开(公告)日:2024-01-09

    申请号:CN202110559194.9

    申请日:2021-05-21

    Inventor: 张志伟 李岩

    Abstract: 本公开关于一种点击模型确定方法、搜索方法、装置、服务器及计算机可读存储介质。点击模型确定方法,包括:通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。本公开实现了针对不同搜索词可以采用不同的点击模型进行搜索,从而可以提高搜索结果的搜索质量。

    竖排文字识别方法、装置、设备及介质

    公开(公告)号:CN110991445B

    公开(公告)日:2023-09-29

    申请号:CN201911147784.X

    申请日:2019-11-21

    Inventor: 张水发 李岩

    Abstract: 本公开关于一种竖排文字识别方法、装置、设备及介质,属于多媒体技术领域。本公开对待识别的竖排文字的竖向图像进行旋转,得到该竖排文字对应的横向图像,并基于该横向图像的图像特征,获取该竖排文字对应的横排文字的图像特征,对该横排文字的图像特征进行识别,相比于直接对竖排文字的竖向图像进行识别,得到了将该竖排文字调整成了横排文字的图像特征,易于识别,识别出文字的概率大大提高,同时也提高了识别的准确率。

    一种视频的分类方法及装置

    公开(公告)号:CN110647933B

    公开(公告)日:2023-06-20

    申请号:CN201910894922.4

    申请日:2019-09-20

    Inventor: 李涛 李岩 武军晖

    Abstract: 本公开涉及视频技术领域,尤其涉及一种视频的分类方法及装置。用于提高分类速度,保证分类准确率,该方法为:从待分类的视频中提取出多个帧图像,获得若干帧图像集和若干参考帧图像,分别对各个帧图像集中的帧图像进行分辨率压缩,获得对应的动图,然后,进行视频类型识别,获得第一分类结果集合和相应的第一权重集合,以及获得第二分类结果集合和相应的第二权重集合,最后,进行合并,筛选出权重符合预设条件的分类结果作为目标分类结果。这样,根据获得的各个动图和参考帧图像对视频进行分类,保证分类的自动训练功能,降低系统开销,并且,保证了目标分类结果的准确度,提高视频类型识别的精确度和有效性,加快分类速度。

    人脸表情的识别方法及装置

    公开(公告)号:CN111144266B

    公开(公告)日:2022-11-22

    申请号:CN201911329050.3

    申请日:2019-12-20

    Inventor: 李岩 李宣平

    Abstract: 本公开关于一种人脸表情的识别方法及装置。其中,该方法包括:通过对输入的图片进行人脸检测,得到人脸图片;基于预设的表情分类标准,确定所述人脸图片中各表情的类别;针对不同类别的表情,采用不同的方式得到所述人脸图片中的人脸的各类别表情的表情系数;基于得到所述人脸的各个所述表情系数的取值,识别出所述人脸的表情。可以提高表情识别的准确性。

    语音识别方法、装置、电子设备及存储介质

    公开(公告)号:CN111009237B

    公开(公告)日:2022-07-01

    申请号:CN201911274852.9

    申请日:2019-12-12

    Abstract: 本公开关于一种语音识别方法、装置、电子设备及存储介质。所述方法包括:从当前说话人的待识别语音数据中提取相应的原始语音特征序列;将原始语音特征序列输入至语音识别模型;对原始语音特征序列进行编码,生成对应的语音特征序列;根据语音特征序列和训练得到的包含多个说话人特征的基础特征组,计算得到当前说话人的说话人特征序列;根据当前说话人的说话人特征序列和语音特征序列,生成目标语音特征序列;对目标语音特征序列进行解码,生成语音识别结果。通过选择多个说话人特征作为基础特征组,当前说话人的说话人特征由这些基础特征计算得到,从而不需要使用单独的模型提取当前说话人的说话人特征,简化了当前说话人的说话人特征获取过程。

    图像检测模型的训练方法、装置及存储介质

    公开(公告)号:CN110443280B

    公开(公告)日:2022-06-03

    申请号:CN201910603697.4

    申请日:2019-07-05

    Abstract: 本公开关于一种图像检测模型的训练方法、装置及存储介质,所述方法,包括:获取用以训练目标模型的样本图像集合;根据所述样本图像集合中包含的不同样本类别对应的样本数量,以及所述目标模型针对当前输入的目标样本图像的预测概率,确定所述目标模型针对所述目标样本图像的类别回归损失函数;针对所述样本图像集合中的每个样本图像,调整所述目标模型的类别回归损失函数,并通过所述样本图像训练所述目标模型中的模型参数。解决了在样本不均衡的情况下,训练任务比较难收敛,训练得到的模型的准确率和召回率不高的技术问题。取得了提高样本数量少的样本类别的收敛速度,增加训练得到的模型的准确率和召回率的有益效果。

Patent Agency Ranking