-
公开(公告)号:CN106056561A
公开(公告)日:2016-10-26
申请号:CN201610224521.4
申请日:2016-04-12
Applicant: 西安电子科技大学
IPC: G06T5/50
CPC classification number: G06T5/50 , G06T2207/10004 , G06T2207/20221
Abstract: 本发明公开了一种基于贝叶斯推断的人脸画像合成方法,主要解决现有方法在近邻寻找或者在权值求解阶段没有考虑相邻图像块之间的相似性约束问题。其方案是:1.划分训练画像样本集、训练照片样本集和测试样本集;2.将所有图像划分成图像块,并组成块集合;3.将训练照片块集合与对应的画像块集合划分为多个子集;4.从训练照片‑画像块集合中选择出最近邻块;5.将最近邻块按欧式距离从训练照片‑画像块集合中进行近邻块再选择,对求解再选近邻块的线性组合权值;6.依据近邻块和组合权值,求解待合成画像块;7.迭代执行步骤5‑6共N次,融合得到最终的合成画像。本发明具有合成结果清晰度高、细节更完整的优点,可用于人脸检索与识别。
-
公开(公告)号:CN117636058A
公开(公告)日:2024-03-01
申请号:CN202311713673.7
申请日:2023-12-13
Applicant: 西安电子科技大学
IPC: G06V10/764 , G06V10/44 , G06V10/82 , G06V10/80 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了基于同层多尺度注意力的细粒度图像分类方法,包括以下步骤;步骤1:利用同层多尺度注意力层提取不同尺度的关键特征:步骤2:利用多尺度特征融合模块融合不同尺度的关键特征,得到多尺度注意力特征Fcondensed;步骤3:分类;将步骤2得到的多尺度注意力特征Fcondensed输入分类器获取最终的类预测。本发明通过构建同层多尺度注意力层来学习特征图中不同尺度的关键信息,以有效地挖掘细粒度图像中的全局特征和局部特征。
-
公开(公告)号:CN117523292A
公开(公告)日:2024-02-06
申请号:CN202311524196.X
申请日:2023-11-15
Applicant: 西安电子科技大学
IPC: G06V10/764 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/047 , G06N3/048 , G06N3/09 , G06V40/10
Abstract: 本发明公开了一种约束类别差异细粒度图像分类方法,本发明利用骨干神经网络提取样本图像的特征,将提取到的特征以及分布构建所有类别的类中心特征和类中心分布,接着利用样本与所属类中心的特征距离来约束类内差异;同时筛选样本的非目标最相似类别,优化样本特征与非目标最相似类中心特征之间的相似度来约束类间差异;之后约束类中心分布与输入样本分布之间的KL散度来使得输入样本的概率分布去拟合类中心概率分布,在缓解模型过拟合问题地基础上,引入类间的相互关系,保证了细粒度分类模型的高效准确。
-
公开(公告)号:CN114550708A
公开(公告)日:2022-05-27
申请号:CN202210151123.X
申请日:2022-02-14
Applicant: 西安电子科技大学重庆集成电路创新研究院
Abstract: 本发明涉及一种基于深度学习的流式实时语音识别方法,通过输入RAW声音波形信号的语音片段,构建语音识别声学模型并训练,在执行预测时,将得到的声学特征张量作为输入,并通过流式CTC解码器的解码算法进行解码;语音识别的语言模型采用统计N‑Gram模型,通过大规模语料库得到N元组统计数据;结合中文汉语拼音与汉字对应关系的字典,使用流式维特比解码算法进行解码,得到语音识别最终文本结果;在模型落地部署后调用API接口或模块,使用流式算法模式,结合流式实时语音激活检测方法,实现流式实时语音识别。该方法不存在上文信息对下文信息的长时依赖,上下文无关,或仅存在下文信息对上文信息的依赖,可实现算法模型推理时的流式实时语音识别。
-
公开(公告)号:CN109145704B
公开(公告)日:2022-02-22
申请号:CN201810615517.X
申请日:2018-06-14
Applicant: 西安电子科技大学
IPC: G06V40/16 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06F16/583
Abstract: 本发明涉及一种基于人脸属性的人脸画像识别方法,包括:获取训练样本集和测试样本集;利用所述训练样本集训练深度人脸属性表示模型;利用训练后的所述深度人脸属性表示模型获取所述测试样本集的人脸属性表示特征;利用所述人脸属性表示特征进行相似度计算以对所述测试样本集中的第二人脸画像进行识别。本发明的识别方法使用深度人脸属性表示模型对人脸画像和照片进行特征提取,克服现有技术进行人脸画像编码和照片编码时,编码特征信息没有考虑人脸属性信息的问题,使得本发明能够通过获取人脸的属性信息从而使得识别准确率更高,且对人脸画像的可分辨性更强。
-
公开(公告)号:CN106204451B
公开(公告)日:2019-04-23
申请号:CN201610537501.2
申请日:2016-07-08
Applicant: 西安电子科技大学
IPC: G06T3/40
Abstract: 本发明公开了一种基于约束固定邻域嵌入的图像超分辨重建方法,主要解决现有方法忽略高分辨块作用造成重建图像模糊的问题。其实现步骤是:1.构建高分辨、低分辨训练图像集合;2.从训练图像集合中构建低分辨、高分辨联合K近邻组;3.提取测试图像的亮度图像分量和色度图像分量;4.对亮度图像分量进行图像分块,并计算块均值,生成初始估计的高分辨特征块;5.查找所有初始估计高分辨特征块的最近邻联合K近邻组,重建高分辨估计图像块;6.组合所有高分辨估计图像块,得到高分辨亮度图像;7.融合高分辨亮度图像和色度图像分量,得到重建的高分辨图像。本发明减少了伪像的产生,提高了重构图像的清晰度,可用于高清晰视频显示。
-
公开(公告)号:CN107392213A
公开(公告)日:2017-11-24
申请号:CN201710602696.9
申请日:2017-07-21
Applicant: 西安电子科技大学
Abstract: 一种基于深度图模型特征学习的人脸画像合成方法。其步骤为:(1)生成样本集合;(2)生成图像块集合;(3)提取深度特征;(4)求解人脸画像重构块系数;(5)重构人脸画像块;(6)合成人脸画像。本发明使用深度卷积网络提取人脸照片块的深度特征,利用马尔科夫图模型求解深度特征图系数与人脸画像块重构系数,使用人脸画像块重构系数对人脸画像块加权求和得到重构人脸画像块,拼接重构人脸画像块得到合成人脸画像。本发明使用从深度卷积网络中提取的深度特征来代替图像块的原始像素值信息,对光照等环境噪声具有更好的鲁棒性,能合成质量极高的人脸画像。
-
公开(公告)号:CN106204451A
公开(公告)日:2016-12-07
申请号:CN201610537501.2
申请日:2016-07-08
Applicant: 西安电子科技大学
IPC: G06T3/40
CPC classification number: G06T3/4076 , G06T2207/20081
Abstract: 本发明公开了一种基于约束固定邻域嵌入的图像超分辨重建方法,主要解决现有方法忽略高分辨块作用造成重建图像模糊的问题。其实现步骤是:1.构建高分辨、低分辨训练图像集合;2.从训练图像集合中构建低分辨、高分辨联合K近邻组;3.提取测试图像的亮度图像分量和色度图像分量;4.对亮度图像分量进行图像分块,并计算块均值,生成初始估计的高分辨特征块;5.查找所有初始估计高分辨特征块的最近邻联合K近邻组,重建高分辨估计图像块;6.组合所有高分辨估计图像块,得到高分辨亮度图像;7.融合高分辨亮度图像和色度图像分量,得到重建的高分辨图像。本发明减少了伪像的产生,提高了重构图像的清晰度,可用于高清晰视频显示。
-
公开(公告)号:CN106023079A
公开(公告)日:2016-10-12
申请号:CN201610333375.9
申请日:2016-05-19
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种联合局部与全局特性的两阶段人脸画像生成方法。其步骤为:(1)划分样本;(2)划分图像块;(3)划分图像块子集;(4)生成初始合成画像块;(5)生成最终合成画像块;(6)合成画像。本发明采用了分阶段的方法,第一阶段将样本块划分为具有全局性的多个子集,在子集内合成初始画像块,第二阶段将样本块划分为具有局部性的多个子集,在子集内合成最终画像块,能合成背景干净且细节清晰的高质量画像。本发明仅使用简单的K均值聚类与样本块位置信息划分样本块集合,使用简单映射生合成画像,极大的提升了合成画像速度。
-
公开(公告)号:CN105844605A
公开(公告)日:2016-08-10
申请号:CN201610152915.3
申请日:2016-03-17
Applicant: 西安电子科技大学
IPC: G06T5/50
CPC classification number: G06T5/50 , G06T2207/20221 , G06T2207/20224 , G06T2207/30201
Abstract: 本发明公开了一种基于自适应表示的人脸画像合成方法,主要解决现有方法合成画像清晰度低和细节不完整的问题。其实现步骤是:首先对数据库进行处理,将所有的图像进行图像滤波后,对图像分块并提取图像块特征,得到一个训练画像块字典和两个照片块字典;其次根据测试照片块中是否包含边缘信息或者面部特征信息选择不同的字典,寻找近邻块;最后利用马尔可夫网络模型得到待合成画像块,并对所有的待合成画像块进行融合得到合成画像。本发明与现有方法相比,合成结果具有更高的清晰度、细节更完整,可用于人脸检索与识别。
-
-
-
-
-
-
-
-
-