一种基于局部及整体运动差异补偿的视频稳定方法

    公开(公告)号:CN106101535A

    公开(公告)日:2016-11-09

    申请号:CN201610453067.X

    申请日:2016-06-21

    Inventor: 黄华 黄建峰 张磊

    CPC classification number: H04N5/23248 H04N5/23267

    Abstract: 一种基于局部及整体运动差异补偿的视频稳定方法,包括以下步骤:1)使用光流法获得相邻视频帧中特征点的运动轨迹,并将视频帧网格化,根据内容保存约束和相似不变约束,计算出每个网格以及整体视频帧的相机路径;2)计算整体相机路径与网格相机路径之间的补偿矩阵,并根据路径平滑和重叠的约束,计算一条优化的整体相机路径;3)根据优化的整体相机路径与网格相机路径之间的补偿矩阵,计算出优化的网格相机路径;4)根据优化前后的网格相机路径,求出每个网格的变形矩阵,并对网格进行变形从而获得稳定的视频帧。与已有方法相比,本方法用补偿矩阵将需要优化的路径数量从网格数减少到了一条整体路径,减少了计算时间,提高了计算效率。

    一种基于帧间运动几何平滑性的视频抖动检测方法

    公开(公告)号:CN105681663A

    公开(公告)日:2016-06-15

    申请号:CN201610108473.2

    申请日:2016-02-26

    Inventor: 张磊 陈晓权 黄华

    CPC classification number: H04N5/23264 G06T5/003 G06T2207/20201

    Abstract: 本发明涉及一种基于帧间运动几何平滑性的视频抖动检测方法,属于视频处理技术领域。该方法包括以下步骤:1、根据帧间相似程度进行分段;2、然后对每个分段利用特征点检测和匹配进行运动估计;3、接着计算分段内相邻帧平移量的平均值、方差,以及平移向量夹角的平均值,通过这三个几何量来衡量运动几何平滑性;4、将以上三个几何量与设定阈值进行比较,据此判断分段是否抖动。与已有方法相比,本发明方法使用与帧间平移向量相关的三个几何量来衡量一个分段的抖动程度,计算效率快,准确性高。

    一种基于Curvelet变换和相位一致的无参考图像质量评价方法

    公开(公告)号:CN103200421B

    公开(公告)日:2015-06-10

    申请号:CN201310116763.8

    申请日:2013-04-07

    Abstract: 本发明涉及一种基于Curvelet变换和相位一致的无参考图像质量评价方法,包括以下步骤:①将图像分别变换到Curvelet域和相位一致域中;②从Curvelet域和相位一致域中提取一系列自然场景统计特征,包括Curvelet系数和相位一致系数的对数直方图峰值坐标,方向能量分布特性和尺度能量分布特性;③使用一种二步框架,利用步骤②中提取的一系列特征和支持向量机首先对未知类型的失真图像进行分类,再根据分类结果对失真图像进行特定类型的非线性回归,以图像的客观质量评价结果(预测DMOS)。本发明提出的基于Curvelet变换和相位一致的无参考图像质量评价方法具有人眼主观一致性高,时间复杂度小的特点,具有较强的应用价值。

    一种基于内容的H.264压缩域视频检索方法

    公开(公告)号:CN104683815A

    公开(公告)日:2015-06-03

    申请号:CN201410663715.5

    申请日:2014-11-19

    Inventor: 王萍 种怡晨 黄华

    Abstract: 本发明公开了一种基于内容的H.264压缩域视频检索方法,为了解决现有H.264压缩域视频检索中计算量大,以及检索准确率低的问题,本发明提出一种基于内容的H.264压缩域视频检索方法,属于视频处理领域。该方法针对H.264压缩视频,提出了直接从I帧编码码流中提取预测模式作为纹理特征,并结合残差DCT的能量直方图作为视频检索的特征签名,用夹角余弦的方法来衡量签名的相似性,有效地对H.264视频进行相似性检索。

    一种基于信息熵特征的无参考图像质量评价方法

    公开(公告)号:CN103475898B

    公开(公告)日:2015-05-20

    申请号:CN201310421710.7

    申请日:2013-09-16

    Inventor: 刘利雄 刘宝 黄华

    Abstract: 本发明涉及一种图像质量评价方法,特别涉及一种基于信息熵特征的无参考图像质量评价方法,属于图像分析领域。本方法首先对失真图像进行Contourlet变换,得到N×M个变换子带,再将每个变换子带和未变换的原始失真图像进行分块处理,然后在每个分块系数矩阵上计算空域信息熵和频域信息熵,筛选分块特征并计算均值得到每个变换子带的质量特征值。然后利用支持向量机的方法和无参考图像质量评价的两步框架,在测试集上进行测试,利用训练得到的分类模型、评价模型和测试集对应的质量特征向量,进行质量预测和评估。本方法具有主观一致性高,时间复杂度小、通用性好的特点;可以嵌入到与图像质量相关的应用系统中,具有很强的应用价值。

    一种基于改进维特比算法的连续动作识别方法

    公开(公告)号:CN104573665A

    公开(公告)日:2015-04-29

    申请号:CN201510035514.5

    申请日:2015-01-23

    Inventor: 张磊 白栋天 黄华

    CPC classification number: G06K9/00342 G06K9/66

    Abstract: 本发明属于视频处理领域,具体涉及一种基于改进维特比算法的连续动作识别方法,用于高效地识别人体全身连续动作。首先通过建立以人体关节为基准的坐标系消除人旋转平移等因素造成的动作差异性。其次通过按照人体模型的约束对人体骨架坐标进行进一步处理,消除因为人体形的差异,然后通过K-means对人体关节点数据进行编码,然后为每个动作训练对应的隐式马尔科夫模型,接着通过活跃关节的变化、速度快慢、角度大小进行连续动作序列的分割,然后为每个子序列筛选出较好的候选动作,最后通过改进的维特比算法找出最佳路径,进而得到最佳的动作序列。与已有的方法相比,该方法能够高效地识别出连续动作序列中包含的动作。

    一种视频场景聚类及浏览方法

    公开(公告)号:CN103440640A

    公开(公告)日:2013-12-11

    申请号:CN201310317750.7

    申请日:2013-07-26

    Inventor: 张磊 徐千昆 黄华

    Abstract: 本发明涉及一种视频场景聚类及浏览方法,包括以下步骤:镜头边界检测与分割;镜头关键帧提取;镜头间相似度计算;镜头聚类;场景聚类;场景图表示。本发明使用场景聚类,从而得到视频场景层次的内容图结构,获得了基于场景的视频的高层语义信息;并使用二维图结构表述视频结构,为用户提供了一种有引导的非线性视频浏览方式,提高了浏览效率。

    油气弹簧的密封组合装置
    88.
    发明授权

    公开(公告)号:CN101070892B

    公开(公告)日:2011-07-20

    申请号:CN200710118959.5

    申请日:2007-06-15

    Abstract: 本发明涉及一种用于油气弹簧的密封组合装置,所述密封组合装置包括压紧部件、接头总成或端部总成以及锁紧螺母,其中接头总成或端部总成通过压紧部件压紧,再使用锁紧螺母将压紧部件轴向锁死。采用本发明的油气弹簧能够大幅减少漏油、漏气现象的出现,从而有效提高油气弹簧抗泄漏的可靠性,保证车辆及乘员的行驶安全。

    一种抑制语音要素异常点的文本驱动语音合成方法

    公开(公告)号:CN114842829B

    公开(公告)日:2025-03-28

    申请号:CN202210323200.5

    申请日:2022-03-29

    Abstract: 本发明涉及一种抑制语音要素异常点的文本驱动语音合成的方法,属于语音信号处理和人工智能的技术领域。首先,以一种更具鲁棒性的注意力对齐机制,实现音素到梅尔频谱图的对齐,在音素长度扩展到梅尔频谱图长度的过程中,利用截断误差计算,能够有效避免极端值对整体数据的影响,使数据的描述结果更加合理与稳定。然后,采用对异常点处理更好的平均绝对误差重新计算损失函数,可以避免误差相互抵消的问题,可以准确反映实际预测误差的大小,提高模型的拟合效果。本方法充分利用音素、梅尔频谱图等语音生成过程中的特征要素,抑制语音生成要素中的异常点,提升了网络模型的泛化能力及语音质量,能够扩展至来源复杂、音频质量参差不齐的场景。

    一种基于扩散模型的高真实感神经渲染方法

    公开(公告)号:CN117315117A

    公开(公告)日:2023-12-29

    申请号:CN202310825876.9

    申请日:2023-07-06

    Inventor: 黄华 赵天琦

    Abstract: 一种基于扩散模型的高真实感神经渲染方法,属于多模态视觉生成领域。采用扩散模型作为条件生成模型,利用语义编码器将人脸模型与目标人脸部图像压缩到语义空间提取条件信息,进而生成在语义条件隐变量下人脸模型的渲染结果,提高生成人脸图像的高真实感和准确性。通过显示地学习三维人脸模型到二维图像的映射关系,在采样过程中加入引导机制,控制生成效果的多样性,允许多种方式的动画编辑。本发明适用于电影、虚拟现实等领域,用于动画制作场景中的三维人脸模型渲染任务,通过应用扩散模型技术,避免生成对抗网络训练不稳定以及缺乏控制样本多样性能力的弊端,提高训练效率,增强人脸模型渲染真实感。

Patent Agency Ranking