-
-
公开(公告)号:CN102982513A
公开(公告)日:2013-03-20
申请号:CN201210512540.9
申请日:2012-12-04
Applicant: 电子科技大学
IPC: G06T5/00
Abstract: 本发明公开了一种基于纹理自适应的图像去雾方法,属于图像处理和计算机视觉技术领域。本发明通过对输入图像进行纹理分类,并将纹理分类结果与不同尺度的暗通道值相结合,计算出相应的场景透射系数,实现了一种基于纹理自适应的快速图像去雾。本发明的应用,能避免复杂的软抠图优化步骤,降低He方法去雾处理的运算复杂度,避免了去雾处理后容易导致的光晕现象,并且能更好的控制去雾处理后图像的饱和度,同时对大气光照向量的计算进行了修正以保证去雾图像的亮度,即本发明的图像去雾方法处理处理速度快,去雾处理的图像质量高、且能满足实时处理应用的需求。
-
公开(公告)号:CN102917226A
公开(公告)日:2013-02-06
申请号:CN201210419728.9
申请日:2012-10-29
Applicant: 电子科技大学
Abstract: 本发明提供一种自适应下采样与插值的帧内帧视频编码方法,包括:下采样步骤、方向性帧内预测步骤、采样点的编码步骤、方向性插值预测步骤、未采样点的编码步骤。本发明根据帧内模式指定的方向进行自适应的下采样和方向性插值,不同方向性帧内预测模式采样不同的采样结构,每种方向性帧内预测模式的采样结构最大地满足未采样点在主方向上找到前后两个相邻的采样点,同时保留未采样点的预测参差进行帧内预测编码。本发明根据图像局部的纹理方向进行采样可有效保留图像的细节特征,并减少插值重构时引入的失真。
-
公开(公告)号:CN102917225A
公开(公告)日:2013-02-06
申请号:CN201210411951.9
申请日:2012-10-25
Applicant: 电子科技大学
Inventor: 李宏亮
Abstract: 本发明提供一种HEVC帧内编码单元快速选择方法。由于用绝对误差和SAD近似得到的每个CU的率失真代价与CU的非归一化的梯度直方图有关。两个相等尺度的CU,其非归一化的梯度直方图相似程度越高,分割标识符越有可能相等。本发明使用基于非归一化的梯度直方图的模板匹配方式来实现CU的快速选择,从而提高HEVC帧内预测方法的编码速度的方法。利用非归一化的梯度直方图作为特征来判断每个CU是否需要分割成四个更小的CU。在满足模板匹配的条件下,省去了逐一比较编码率失真代价的步骤。
-
公开(公告)号:CN102768760A
公开(公告)日:2012-11-07
申请号:CN201210229929.2
申请日:2012-07-04
Applicant: 电子科技大学
IPC: G06T5/00
Abstract: 本发明提供一种基于图像纹理的图像快速去雾方法,包括以下步骤:步骤一、估计输入图像I(x)的大气环境光;步骤二、估计输入图像I(x)的传输矩阵t(x):步骤三、根据大气环境光与传输矩阵t(x)恢复出去雾后的图像。步骤二中依据输入图像的边缘检测结果,使用大小可变的滑动块块获得粗略的传输矩阵:在景深突变的地方采用较小的滑动块精确处理,在景深变化不大的地方采用较大的滑动块处理,提高运算速度。可变块处理的结果比用固定的块处理的结果精细,也能可以直接用此粗略的传输矩阵结果进行后续处理。
-
公开(公告)号:CN102096934B
公开(公告)日:2012-05-23
申请号:CN201110030099.6
申请日:2011-01-27
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于机器学习的人脸卡通画生成方法。本发明针对现有的人脸卡通画生成方法中的缺陷,包括生成的人脸卡通画形象不够逼真和缺少纹理特征,通过对人脸图像库及其对应的卡通图像库的图像进行轮廓提取及对齐,保证了生成的人脸卡通画与真实人脸之间的相似性,通过图像的分块处理和机器学习,产生一个最优滤波器组,使得生成的人脸卡通画具有较强的纹理特征。本发明的方法包括如下步骤:图像的轮廓提取及对齐;图像的分块处理;计算滤波器组;人脸卡通画的绘制合成。
-
公开(公告)号:CN119296103A
公开(公告)日:2025-01-10
申请号:CN202411617566.9
申请日:2024-11-13
Applicant: 电子科技大学
IPC: G06V20/70 , G06V10/764 , G06V10/26 , G06V10/82 , G06N3/0895 , G06N3/096
Abstract: 该发明公开了一种基于文本监督的第一视角场景解析方法,属于图像处理领域,特别是第一视角视觉场景解析领域。本发明提出了跨模态提示学习模块,引入视觉与文本可学习提示向量,针对在第三人称数据上预训练的视觉语言模型进行微调,使其能够应用于具有复杂目标关系的第一视角图像;此外,本发明还提出了表征知识迁移模块,将视觉语言预训练模型的特征级知识蒸馏到微调后的第一视角编码器中,提高第一视角模型的跨模态关联能力,从而基于类别文本对第一视角场景中的目标进行准确分割。本发明创新地提出了一种基于文本监督的第一视角场景解析方法,利用第一视角图像的类别文本生成对应的分割伪掩码以缓解像素级标注稀缺的问题。
-
公开(公告)号:CN118887382A
公开(公告)日:2024-11-01
申请号:CN202410896916.3
申请日:2024-07-05
Applicant: 电子科技大学
IPC: G06V10/25 , G06V10/22 , G06V10/766 , G06V10/764 , G06V10/74 , G06V10/774
Abstract: 本发明公开了一种基于预训练模型定位知识嵌入的零样本目标检测方法,属于深度学习目标检测领域。本发明在COCO数据集基础上,构建一个区域图像、IoU标签的数据集(Region‑IoU)。然后使用该数据集对传统的视觉语言模型CLIP进行微调以及学习对IoU敏感的语义提示。使得的IoU‑CLIP模型具备局部目标定位的相关知识,能够预测检测框的IoU分数以及生成类无关IoU敏感的视觉特征。最后将该特征与IoU分数集成进开放词汇零样本检测框架。本发明可以有效地提升开放词汇零样本目标检测任务的性能。
-
公开(公告)号:CN117746509A
公开(公告)日:2024-03-22
申请号:CN202410068386.3
申请日:2024-01-17
Applicant: 电子科技大学
IPC: G06V40/20 , G06V10/764 , G06V10/774 , G06V20/40 , G06N3/04 , G06N3/084
Abstract: 本发明提出一种基于可预见多模态泛化知识表示的持续行为识别方法,包括如下步骤:步骤S1:采集多模态行为活动数据,对行为活动数据进行预处理;步骤S2:进行任务划分;步骤S3:构建多模态行为识别模型;步骤S4:对基任务进行激励型训练;步骤S5:激励型训练结束后,评估多模态行为识别模型的识别精度,并选取一组表示均值向量和表示标准差向量进行存储;步骤S6:进行增量任务的训练;步骤S7:增量任务训练结束后,评估其识别精度,并选取一组表示均值向量和表示标准差向量进行存储以备后续任务;依次类推,直到最后一个任务结束。本发明缓解了由于模态不平衡性所带来的泛化性知识缺失问题,从而减少网络在持续任务中的灾难性遗忘问题。
-
公开(公告)号:CN117292385A
公开(公告)日:2023-12-26
申请号:CN202311241140.3
申请日:2023-09-25
Applicant: 电子科技大学
IPC: G06V30/18 , G06V30/146 , G06V30/302 , G06V30/19 , G06V10/82
Abstract: 该发明公开了一种基于字符特征摘要的端到端文本提取识别头方法,属于深度学习、计算机视觉、端到端文本提取领域。通过多阶段逐步提取字符全局特征,并在每个阶段进行历史特征摘要的方法,更好的进行了字符特征的提取。并通过在每个阶段都进行文本识别结果预测,在增加较少计算量的前提下,更好的收敛了网络、提升了最终结果准确率,具有简单且快速准确的特点。
-
-
-
-
-
-
-
-
-