-
公开(公告)号:CN114627196B
公开(公告)日:2024-07-02
申请号:CN202210011776.8
申请日:2022-01-06
Applicant: 福州大学
IPC: G06T9/00 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提出一种基于变分自动编码器的潜变量空间解耦方法,包括编码器模型设计、解码器模型设计、损失函数设计。编码器模型设计阶段使用了自注意力机制和残差网络,使得图像生成模型更有效地捕捉长期依赖关系,增强模型的维度适应性;解码器模型设计阶段将潜变量空间编码z解码,实现图像重构;损失函数设计阶段使得潜变量空间编码维度与属性值趋向单调关系,从而达到优化训练的目的。通过设计良好的编解码模型和损失函数,实现对图像数据的特征映射和参数调整,实现有效的数据降维,并保留高度的图像特征。在确保图像重建精度的前提下让解耦的潜变量空间具备更好的可解释性和模块化特征,提高潜变量空间解耦性能。
-
公开(公告)号:CN111104913B
公开(公告)日:2023-03-24
申请号:CN201911335327.3
申请日:2019-12-23
Applicant: 福州大学
Abstract: 本发明涉及一种基于结构及相似度的视频提取PPT方法,首先,采集视频的第一帧图像;对帧图像进行颜色空间转换、高斯滤波、膨胀、Canny边缘检测、轮廓检测,找到其中的目标区域;然后,利用多边形拟合、透视变换对目标区域进行处理,将目标区域转化为矩形;相隔2秒在视频中再取新帧,重复上述的操作,获取第二图的PPT目标区域;最后,对两PPT图片进行相似度比较和差异度比较,接着留下第二幅PPT图,重复执行上述操作直至视频结束;对所有保存的图片进行再裁剪和时间序列筛选处理,以PDF文件形式保存。本发明提供一种从视频中简单、快速提取PPT内容图片并且以PDF文件形式保存的方法。
-
公开(公告)号:CN114627196A
公开(公告)日:2022-06-14
申请号:CN202210011776.8
申请日:2022-01-06
Applicant: 福州大学
Abstract: 本发明提出一种基于变分自动编码器的潜变量空间解耦方法,包括编码器模型设计、解码器模型设计、损失函数设计。编码器模型设计阶段使用了自注意力机制和残差网络,使得图像生成模型更有效地捕捉长期依赖关系,增强模型的维度适应性;解码器模型设计阶段将潜变量空间编码z解码,实现图像重构;损失函数设计阶段使得潜变量空间编码维度与属性值趋向单调关系,从而达到优化训练的目的。通过设计良好的编解码模型和损失函数,实现对图像数据的特征映射和参数调整,实现有效的数据降维,并保留高度的图像特征。在确保图像重建精度的前提下让解耦的潜变量空间具备更好的可解释性和模块化特征,提高潜变量空间解耦性能。
-
公开(公告)号:CN111104913A
公开(公告)日:2020-05-05
申请号:CN201911335327.3
申请日:2019-12-23
Applicant: 福州大学
Abstract: 本发明涉及一种基于结构及相似度的视频提取PPT方法,首先,采集视频的第一帧图像;对帧图像进行颜色空间转换、高斯滤波、膨胀、Canny边缘检测、轮廓检测,找到其中的目标区域;然后,利用多边形拟合、透视变换对目标区域进行处理,将目标区域转化为矩形;相隔2秒在视频中再取新帧,重复上述的操作,获取第二图的PPT目标区域;最后,对两PPT图片进行相似度比较和差异度比较,接着留下第二幅PPT图,重复执行上述操作直至视频结束;对所有保存的图片进行再裁剪和时间序列筛选处理,以PDF文件形式保存。本发明提供一种从视频中简单、快速提取PPT内容图片并且以PDF文件形式保存的方法。
-
-
-