-
公开(公告)号:CN109840914B
公开(公告)日:2022-12-16
申请号:CN201910152693.9
申请日:2019-02-28
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于用户交互式的纹理分割方法,包括以下步骤:S1、输入纹理图像,用户通过用户交互式操作进行交互式操作获得纹理图像中的一些种子区域,将纹理图像中的每个像素点看成一个样本,用户对纹理图像中的部分像素点进行标注作标注样本,未标注的像素点作为未标注样本。S2、利用局部频谱直方图对数据集中的每张纹理图像提取特征,具体的表现是图像中的每个像素点都对应一个特征向量;局部频谱直方图提取特征图像;S3、采用稀疏表达技术来构建弱监督下的纹理分割模型,通过迭代求解;S4、根据S3的分割结果,将相邻的区域合并。本发明只需要少量的人工交互,大大节省了时间成本和人力成本。
-
公开(公告)号:CN112102182B
公开(公告)日:2022-09-20
申请号:CN202010893079.0
申请日:2020-08-31
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的单图像去反射方法。本发明利用重影线索,利用双重反射合成建模,首先根据传统方法或者深度学习的方法进行重影卷积核参数估计,利用深度网络估计背景层图像和反射层图像提出自监督,从而达到更好的去反射的目的。本发明使用传统方法或者深度学习的方法对于重影卷积核k估计,更好的利用反射图像中重影线索,从而分离重影反射图像的背景层图像和反射层图像。本发明对于估计重影卷积核k和估计背景层图像T、反射层图像R的模型进行预训练,从而加快模型收敛速度,提高模型表现。本发明能够对大部分的自然场景重影反射图像产生较好的复原效果。
-
公开(公告)号:CN110232394B
公开(公告)日:2021-08-10
申请号:CN201810181370.8
申请日:2018-03-06
Applicant: 华南理工大学
Abstract: 本发明公开了一种多尺度图像语义分割方法,包括下述步骤:获取待分割图像和对应的标签;构建全卷积深度神经网络,所述全卷积深度神经网络包括卷积模块、空洞卷积模块、金字塔池化模块、1×1×depth卷积层、以及反卷积结构,将带洞卷积设置为逐通道的操作,有针对性地利用低、中、高尺度特征;训练全卷积深度神经网络,建立损失函数,通过训练样本图像确定全卷积深度神经网络的参数;将待分割图像输入到训练完成的全卷积深度神经网络,得到语义分割结果。本发明的方法能够在减小计算量和参数数量的同时较好地处理存在复杂细节、空洞和较大目标的图像语义分割问题,能够很好地分割目标边缘的同时,保留类别标签的一致性。
-
公开(公告)号:CN109840914A
公开(公告)日:2019-06-04
申请号:CN201910152693.9
申请日:2019-02-28
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于用户交互式的纹理分割方法,包括以下步骤:S1、输入纹理图像,用户通过用户交互式操作进行交互式操作获得纹理图像中的一些种子区域,将纹理图像中的每个像素点看成一个样本,用户对纹理图像中的部分像素点进行标注作标注样本,未标注的像素点作为未标注样本。S2、利用局部频谱直方图对数据集中的每张纹理图像提取特征,具体的表现是图像中的每个像素点都对应一个特征向量;局部频谱直方图提取特征图像;S3、采用稀疏表达技术来构建弱监督下的纹理分割模型,通过迭代求解;S4、根据S3的分割结果,将相邻的区域合并。本发明只需要少量的人工交互,大大节省了时间成本和人力成本。
-
公开(公告)号:CN118096853B
公开(公告)日:2024-07-16
申请号:CN202410511793.7
申请日:2024-04-26
Applicant: 华南理工大学
Abstract: 本发明公开了一种多目标运动场景的视频深度估计方法,首先针对当前多目标订场场景深度数据集较少的问题,本发明拍摄并标注了以多人物运动为主体的动态场景视频数据集,为后续模型训练提供数据支撑;其次通过构建视频深度估计模型,通过提取移动对象在不同帧中的实例特征并构建不同帧间的实例关系来预测深度值;同时通过几何线段匹配的方法来保证不同帧间移动对象的几何尺寸一致性,使得移动对象的深度预测连续性更加稳定;此外并基于几何尺寸约束的方法对连续帧的深度估计结果进行监督,从而提高了在复杂动态场景中深度估计的精度和可靠性,不仅适用于动态场景同时还适用于静态场景。
-
公开(公告)号:CN118195959A
公开(公告)日:2024-06-14
申请号:CN202410079399.0
申请日:2024-01-19
Applicant: 华南理工大学
IPC: G06T5/77 , G06T5/94 , G06T5/60 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/09 , G06N3/084
Abstract: 本发明公开了一种基于多尺度视网膜分解的深度学习单图像去阴影方法及系统,所述方法包括:获取阴影图像数据集并进行预处理;将预处理后阴影图像数据集中的阴影图像输入图像阴影去除深度神经网络中的卷积层,提取阴影图像的浅层特征;将浅层特征输入图像阴影去除深度神经网络中的编解码器,在各尺度阴影掩膜的引导下通过掩膜引导去阴影模块进行阴影特征的修复,再经过卷积层后得到去阴影图像;利用预处理后阴影图像数据集对图像阴影去除深度神经网络进行训练;将待去除阴影的图像输入训练好的图像阴影去除深度神经网络中,得到去阴影图像。本发明通过利用图像阴影去除深度神经网络能够有效地对单张图像去阴影,同时保留非阴影区域的特征信息。
-
公开(公告)号:CN118096853A
公开(公告)日:2024-05-28
申请号:CN202410511793.7
申请日:2024-04-26
Applicant: 华南理工大学
Abstract: 本发明公开了一种多目标运动场景的视频深度估计方法,首先针对当前多目标订场场景深度数据集较少的问题,本发明拍摄并标注了以多人物运动为主体的动态场景视频数据集,为后续模型训练提供数据支撑;其次通过构建视频深度估计模型,通过提取移动对象在不同帧中的实例特征并构建不同帧间的实例关系来预测深度值;同时通过几何线段匹配的方法来保证不同帧间移动对象的几何尺寸一致性,使得移动对象的深度预测连续性更加稳定;此外并基于几何尺寸约束的方法对连续帧的深度估计结果进行监督,从而提高了在复杂动态场景中深度估计的精度和可靠性,不仅适用于动态场景同时还适用于静态场景。
-
公开(公告)号:CN114926352B
公开(公告)日:2024-05-28
申请号:CN202210387641.1
申请日:2022-04-14
Applicant: 华南理工大学
IPC: G06T5/77 , G06T5/60 , G06N3/0464 , G06N3/092 , G06N3/084
Abstract: 本发明公开了一种图像去反射方法、系统、装置及存储介质,其中方法包括:根据反射图像构建包含背景层图像和反射层图像的合成数据集;确定基础滤波器,根据基础滤波器构造多种形态滤波器;将合成数据集中的反射图像输入深度强化学习网络,输出所述反射图像的价值V和策略π两部分;根据策略π从动作集A中选择形态滤波器,对输入的反射图像去反射,得到对应的背景层图像和反射层图像;根据背景层图像和反射层图像对深度强化学习网络进行训练;将反射图像输入深度强化学习网络,输出处理结果。本发明通过深度强化学习方法学习形态滤波器的选择,增加图像去反射过程中的可解释性,提高图像去反射的性能,可广泛应用于数字图像复原领域。
-
公开(公告)号:CN117591548A
公开(公告)日:2024-02-23
申请号:CN202311347674.4
申请日:2023-10-17
Applicant: 华南理工大学
IPC: G06F16/2453 , G06F16/2455 , G06F16/242 , G06F16/2458
Abstract: 本发明公开了一种基于优化器的流式SQL执行计划优化方法,包括:针对具有历史输入的数据源流,收集所需的统计信息,并实现基于成本的规则,使优化器能够生成多种执行计划;构建符合流式计算的成本模型,并采用收集的统计信息,对优化器基于成本的规则生成的多种执行计划进行成本的计算,并根据计算的成本对比选出成本最小的最终执行计划;得到最终执行计划,进行最终流式SQL的执行。本发明提出的成本模型考虑CPU、I/O、内存和网络传输开销,并且更加符合流式计算的实际执行过程,综合考虑了流式计算特有的状态管理的成本开销,使得成本计算更加精准,能够选择执行性能较高、计算资源较少的执行计划进行执行。
-
公开(公告)号:CN113011506B
公开(公告)日:2023-08-25
申请号:CN202110311743.0
申请日:2021-03-24
Applicant: 华南理工大学
IPC: G06V10/764 , G06V10/762 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/084 , G06N3/0985 , G06N3/09
Abstract: 本发明公开了一种基于深度重分形频谱网络的纹理图像分类方法,包括获取纹理图像及其对应的类别标签数据库;对纹理图像进行预处理,作为深度重分形频谱网络模型的输入;构建深度重分形频谱网络模型,并进行训练,所述深度重分形频谱网络模型包括对纹理图像进行特征提取,提取后的特征分别输入两个旁支进行计算得到特征向量,再通过双线性池化层对两个特征向量进行耦合,最后通过全连接层与Softmax函数映射成训练数据集所对应的类别数相等的类别预测概率向量,概率向量数值大的向量元素所对应的索引即为预测类别;利用训练后的深度重分形频谱网络模型,实现纹理图像的分类。本发明在真实场景下分类准确率更高。
-
-
-
-
-
-
-
-
-