ERP全景视频VVC快速CU划分方法及存储介质

    公开(公告)号:CN117041736A

    公开(公告)日:2023-11-10

    申请号:CN202310928368.3

    申请日:2023-07-26

    Abstract: 本发明请求保护一种ERP全景视频VVC快速CU划分方法及存储介质,属于视频编码领域,该方法包括以下步骤:利用ERP全景视频的采样特性,将编码帧划分为不同纬度区域;基于不同纬度区域CU四叉树深度的分布特性和相邻CU的相关性,对当前CU的划分模式进行提前终止决策;对需继续划分CU,利用梯度差异评估当前CU纹理特性,跳过冗余的水平或垂直划分模式,针对纹理模糊CU,通过纬度采样权重加权二次比较,判断是否跳过垂直划分模式;最后利用二维哈尔小波变换系数评估子CU间的差异,判断是否跳过三叉树划分模式。本发明能显著降低ERP全景视频VVC的计算复杂度,适合ERP全景视频编码应用场景。

    一种H.266/VVC帧间编码CU快速划分方法及存储介质

    公开(公告)号:CN113014925B

    公开(公告)日:2022-08-23

    申请号:CN202110112537.7

    申请日:2021-01-27

    Abstract: 本发明请求保护一种H.266/VVC帧间编码CU快速划分方法及存储介质,属于视频编码领域,该方法包括步骤:S1,判断当前CU的相邻MV是否存在且一致,如果是则进入下一步骤,否则进入S4;S2,通过当前CU坐标与MV相加得到参考帧对应位置坐标;S3,判断当前CU是否为正方形,如果是正方形,则使用9MV模型选择部分划分模式,如果是长方形,则使用横向6MV或者纵向6MV模型选择部分划分模式;S4,结束CU划分模式的初始化。本发明能够有效降低H.266/VVC在CU划分过程中的运算复杂度,缩短视频编码器的编码时间,可应用于移动端等需要较低视频编码运算复杂度的场景。

    一种H.266/VVC的快速运动估计方法及存储介质

    公开(公告)号:CN112911308A

    公开(公告)日:2021-06-04

    申请号:CN202110137388.X

    申请日:2021-02-01

    Abstract: 本发明请求保护一种H.266/VVC的快速运动估计方法及存储介质,属于视频编码领域,该方法包括步骤:S1,在编码器当前编码CU完成常规运动估计后,获取正在编码的CU数据。S2,根据步骤S1的CU数据,若当前编码的CU存在父CU且父CU为skip模式,则进入下一步骤S3,否则进入S6。S3,若常规运动估计的最优模式为双向预测L2,则进行L0,L1,L2的4‑affine运动估计并进入S4,否则进行L0,L1的4‑affine运动估计并进入S5。S4,若4‑affine运动估计的最优预测模式为L2,则进行L0,L1,L2的6‑affine运动估计并进入S6,否则进入S5。S5,进行L0,L1的6‑affine运动估计,并进入S6。S6,比较已经进行过的各个模式的率失真代价值,并选出率失真代价最小的模式作为最优的预测模式。

    一种基于压缩感知的语音线谱频率编码及自适应快速重构方法

    公开(公告)号:CN109545234A

    公开(公告)日:2019-03-29

    申请号:CN201811268384.X

    申请日:2018-10-29

    Inventor: 李强 王怡曼

    Abstract: 本发明提出一种基于压缩感知的语音线谱频率编码及自适应快速重构方法,具体实施方法包括:编码端对语音子帧进行话音激活检测后,n个子帧组成1个超帧,对不同类型超帧的线谱频率采用压缩感知方法得到观测序列,对观测序列进行矢量量化和编码;解码端通过解码和反量化得到观测序列,判断出超帧类型后,自适应地选择调整参数,调整感知矩阵的维度,根据观测序列和调整后的感知矩阵,计算出待重构超帧线谱频率的稀疏系数矩阵前一部分原子,后一部分原子用0代替,然后进行稀疏反变换快速重构出超帧的线谱频率。本发明提出的方法可用于语音信号单帧或多帧联合编码,具有线谱频率参数量化效率高,重构速度快的优点。

    一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法

    公开(公告)号:CN105118513B

    公开(公告)日:2018-12-28

    申请号:CN201510434127.9

    申请日:2015-07-22

    Abstract: 本发明请求保护一种基于MELP的1.2kb/s低速率语音编解码方法,包括:编码端首先对语音信号以30ms为子帧长度进行分帧处理,将相邻两子帧组成一个超帧,对提取的语音特征参数LSF、Pitch、VP、Fsmag和G进行多帧联合量化编码。利用帧结构中剩余比特对重要的语音特征参数进行差错控制编码,最后组成二进制比特流进行传送。解码端从接收到的比特流中解析出各语音特征参数的量化索引值,通过量化索引得到语音特征参数的初值,然后进行语音特征参数完整性重构,利用重构的语音特征参数生成激励信号,再经过自适应谱增强、合成滤波器、增益控制和散布脉冲滤波后得到合成的语音信号。本发明能有效地降低语音编码速率,接收端合成的语音具有较高的清晰度和可懂度。

    一种基于SILK的语音编码器编码效率提高方法

    公开(公告)号:CN108231083A

    公开(公告)日:2018-06-29

    申请号:CN201810040152.2

    申请日:2018-01-16

    Abstract: 本发明提出一种基于SILK的语音编码器编码效率提高方法。具体实施方法包括:首先,对输入语音信号中添加特定噪声,生成模拟信号,然后对该模拟信号进行长时和短时预测,提高预测滤波器的预测增益,减少量化索引的熵,从而提高编码效率;其次,在编码端通过最小化感知加权重建误差来确定激励信号,在解码端采用后置滤波来压缩量化噪声和信号之间具有较高相关性的频谱区域,通过对噪声整形量化器的输入和重构信号添加不同的加权滤波器,使得以上两个功能在编码端的量化器中得到联合。采用本发明提出的方法,既不需要边带信息,也不用改变比特流格式,又能提高SILK的编码效率。

    一种网络舆情地理位置实时监控系统和方法

    公开(公告)号:CN103092950B

    公开(公告)日:2016-01-06

    申请号:CN201310014356.6

    申请日:2013-01-15

    Abstract: 本发明公布了一种网络舆情地理位置实时监控系统和方法。通过统一微博、博客、论坛数据的获取方式,相似度分析去重,得到话题关键词列表;采取首尾边界切割技术提取地理位置和时间信息,通过事先建立好的网站结构表获取首尾边界,避免程序需要根据网站结构进行调整的情况出现;根据每一个关键词获取数据并进行数据处理,在GIS地理模型上动态还原其传播态势,分析网民参与人数。通过将网络地理位置转换成经纬度坐标,实现网络环境和真实环境的映射,对数据按时间段分批输入GIS软件实现动态演示传播过程。

    面向异构无线传感器网络的协议一致性的云测试框架

    公开(公告)号:CN105049435A

    公开(公告)日:2015-11-11

    申请号:CN201510430490.3

    申请日:2015-07-21

    CPC classification number: H04L69/03 H04L1/244 H04L67/02 H04W84/18

    Abstract: 本发明请求保护一种面向异构无线传感器网络的协议一致性的云测试框架,包括云测试平台、测试代理及被测系统;其中云测试平台负责测试进行与测试过程的控制管理;所述测试代理是被测系统与云测试平台之间的通信桥梁,相应的测试代理接收到云测试平台的命令后转发给对应的被测系统的网络中的设备,并为测试设备分配角色形成对应的测试网络;其中云测试平台主要包括基础设施服务层IaaS、平台服务层PaaS及应用服务层SaaS,测试用户通过应用服务层SaaS提供的Web界面通过Internet访问云测试平台,提交测试需求及相关测试配置后云测试平台根据测试需求分配测试资源,相关虚拟服务器进行测试,并通过应用服务层SaaS对测试过程进行监控,最后获得完整的测试报告。

    一种基于多高斯计数模型的人流量统计方法

    公开(公告)号:CN102542289A

    公开(公告)日:2012-07-04

    申请号:CN201110423349.2

    申请日:2011-12-16

    Abstract: 本发明涉及智能视频监控及图像处理与分析,公开了一种人流量统计方法,首先利用带人数标记的训练视频序列图像样本建立多高斯计数模型,然后基于多高斯计数模型对未知人数的视频进行实时统计人流量。具体为,首先根据运动目标检测,提取前景运动目标,然后根据运动目标面积,外接矩形框长宽等特征提取特征向量,进而在特征向量集的基础上建立多高斯计数模型,最后基于多高斯计数模型分析未知运动目标区域中包含的行人个数,从而实现人流量统计。本发明通过建立多个高斯计数模型,避免了对单个行人进行识别和跟踪带来的困难,能够较好地统计不同检测区域中运动目标区域包含的行人个数,提高了行人个数统计精度,从而提高了人流量统计的准确性。

Patent Agency Ranking