一种基于深度引导扩展块匹配的三维视频帧率提升方法

    公开(公告)号:CN105933714B

    公开(公告)日:2017-06-09

    申请号:CN201610247833.7

    申请日:2016-04-20

    Applicant: 济南大学

    Abstract: 本发明公开了一种基于深度引导扩展块匹配的三维视频帧率提升方法,包括:对视频帧进行基于图像块的双向运动估计,利用估计得到的运动向量进行补偿得到初始深度插入帧根据初始深度插入帧,计算插入帧中每个深度图像块的二维结构张量,根据二维结构张量将图像块分成边缘图像块和非边缘图像块;将边缘图像块分成子块,利用基于深度信息引导的扩展块匹配方法估计每个子块的运动向量;以图像块为单位,对非边缘图像块和边缘图像子块进行适应性运动补偿,实现插入帧的重建。本发明有效的解决了三维视频帧率提升中插入帧前景物体边缘模糊的问题。

    基于超像素的深度图像预处理和深度空洞填充方法

    公开(公告)号:CN106341676A

    公开(公告)日:2017-01-18

    申请号:CN201610865067.0

    申请日:2016-09-29

    Applicant: 济南大学

    CPC classification number: H04N13/128 H04N13/161 H04N19/597

    Abstract: 本发明公开了基于超像素的深度图像预处理和深度空洞填充方法,包括以下步骤:步骤一:待处理的深度图像的超像素分割:对于该待处理的深度图像对应的彩色图像进行超像素分割,然后利用彩色图像的分割结果对该待处理的深度图像进行分割;步骤二:基于超像素的深度图像预处理;步骤三:虚拟视点深度图像超像素分割:利用待处理的深度图像对应的彩色图像和预处理后的深度图像进行三维变换,生成虚拟视点初始彩色图像和虚拟视点初始深度图像,对虚拟视点初始深度图像进行超像素分割;步骤四:虚拟视点深度图像填充。本发明采用基于超像素的深度图像预处理和基于超像素的深度空洞处理,空洞填充准确性较高,计算量较小,有利于视点合成的实时实现。

    一种基于边缘增强网络的SAR图像目标检测优化方法

    公开(公告)号:CN119068341A

    公开(公告)日:2024-12-03

    申请号:CN202411269884.0

    申请日:2024-09-11

    Applicant: 济南大学

    Abstract: 本申请公开了一种基于边缘增强网络的SAR图像目标检测优化方法。其实现方法的实现步骤为:构造边缘增强网络模块;将边缘增强网络模块引入到一般的基于卷积神经网络的物体检测模型中;划分物体检测数据集;对数据集中的图像进行预测处理;使用训练数据用物体检测模型和边缘增强网络模块进行协同训练;将验证数据送入到检测模型进行检测;得到检测结果;本发明利用构建的边缘增强网络模块和一般的基于深度卷积神经网络的物体检测模型进行协同训练,用来增强检测模型的特征提取网络来用于SAR图像物体检测,在计算代价相当的同时提高了物体检测精度。

    基于眼动注意力引导的空间通道自适应事故预测方法及系统

    公开(公告)号:CN118470484A

    公开(公告)日:2024-08-09

    申请号:CN202410672169.5

    申请日:2024-05-28

    Applicant: 济南大学

    Abstract: 本发明属于计算机视觉领域,提供了一种基于眼动注意力引导的空间通道自适应事故预测方法及系统,包括获取行车记录仪图像,利用训练好的骨干网络进行特征提取,得到行车记录仪空间通道特征图;利用骨干网络不同尺度的的残差块输出生成不同尺度的补丁,将不同尺度的补丁进行拼接后得到多尺度多视图特征;基于自定义初始历史时序特征图,经过时间自注意力模块、空间交叉注意力模块以及前馈神经网络提取时间特征,得到当前时序特征图,其中空间交叉注意力模块将多尺度多视图特征作为输入以提取空间信息,将当前时序特征图作为下一时间戳的历史时序特征图进行递归提取;将当前时序特征图与行车记录仪空间通道特征图进行融合分类,得到事故预测结果。

    一种面向虚拟实验的多模态语义融合人机交互系统和方法

    公开(公告)号:CN111665941B

    公开(公告)日:2023-12-22

    申请号:CN202010509144.5

    申请日:2020-06-07

    Applicant: 济南大学

    Abstract: 本发明涉及一种面向虚拟实验的多模态语义融合人机交互系统和方法,包括交互信息集成模块,还包括交互信息获取模块、交互意图推理模块和交互任务直行模块,其中,所述交互信息模块采用多模态融合模型来准确识别操作者的真实意图,并将获取到的信息提供给交互意图推理模块;所述交互意图推理模块根据手势语义和语言语义结合场景当前的交互情景来识别用户的交互意图,预测潜在的交互行为;所述交互任务执行模块根据交互意图推理模块预测的交互动作,生成用户期望的实验动作,生成响应的实验效果,返回对应的操作反馈,最后,实验效果和反馈通过不同的通道输出给用户。本发明解决了当下虚拟实验中面临的交互困难的问题。

    基于轻量化驱动和三尺度编码的视频帧插值方法及系统

    公开(公告)号:CN115880149A

    公开(公告)日:2023-03-31

    申请号:CN202211489722.9

    申请日:2022-11-25

    Applicant: 济南大学

    Abstract: 本发明公开了基于轻量化驱动和三尺度编码的视频帧插值方法及系统,获取待插值视频的第i帧原始图像和第i+1帧原始图像;分别对第i帧原始图像和第i+1帧原始图像进行尺度缩放,得到第i帧缩小尺度的图像、第i+1帧缩小尺度的图像、第i帧放大尺度的图像、第i+1帧放大尺度的图像;将原始图像和尺度缩放后的图像均输入到训练后的视频帧插值模型中,输出插值图像;其中,训练后的视频帧插值模型,对原始图像和尺度缩放后的图像,分别进行三个尺度的特征提取,采用通道注意力机制模块对三个尺度的特征进行融合,采用双重注意力机制模块对融合后的特征进行增强;再对增强后的特征进行帧扭曲操作,得到插值图像。

    基于数据流聚类的工业设备运行状态划分方法及系统

    公开(公告)号:CN115221959A

    公开(公告)日:2022-10-21

    申请号:CN202210842724.5

    申请日:2022-07-18

    Applicant: 济南大学

    Abstract: 本发明提出了基于数据流聚类的工业设备运行状态划分方法及系统,涉及工业设备运行状态划分领域。包括:获取工业设备用电数据;对用电数据提取特征并对提取的特征进行预处理;为预处理后的数据分配动态权重,并将预处理后的数据合并在微簇结构中,更新微簇结构;利用基于自然邻居的密度峰值聚类方法对微簇结构中的数据进行聚类,根据聚类结果匹配工业设备的运行状态。本发明采用动态权重的方法来更加精确的描述以及更新数据的概要信息,采用基于自然邻居的密度峰值聚类算法来完成最终的聚类任务,提升了工业设备运行状态的判断准确度。

Patent Agency Ranking