一种适合于多路话音编解码设备的网络控制方法

    公开(公告)号:CN101958895A

    公开(公告)日:2011-01-26

    申请号:CN201010287715.1

    申请日:2010-09-19

    Inventor: 毛峡 陈立江

    Abstract: 本发明一种适合于多路话音编解码设备的网络控制方法,多路话音编解码设备作为以太网服务器端,上位机作为客户端。服务器端在无客户端控制请求时,由硬件开关控制多路话音编解码设备的工作状态,在接收到客户端控制请求时,由客户端控制多路话音编解码设备的工作状态并且该设备定时向客户端进行状态反馈;本发明还涉及一种网络控制系统,包括服务器端的FPGA软硬件设计和客户端的控制程序设计。本发明能够降低成本、具有很强的实用性、易用性和鲁棒性。

    基于趋势一致高斯过程隐变量模型的面部运动信息提取方法

    公开(公告)号:CN104011739B

    公开(公告)日:2017-02-15

    申请号:CN201280065062.X

    申请日:2012-10-19

    CPC classification number: G06K9/00315 G06K9/6297

    Abstract: 一种基于趋势一致高斯过程隐变量模型的面部运动信息提取方法,其中趋势一致高斯过程隐变量模型描述如下:(1)构造基于马尔可夫假设的求解低维隐变量序列高斯过程隐变量模型目标函数;(2)添加趋势一致限制条件构造趋势一致高斯过程隐变量模型目标函数。其中基于趋势一致的高斯过程隐变量模型的面部运动信息提取,具体方法描述如下:(1)采用主成分分析方法(PCA)得到用于趋势一致高斯过程隐变量模型目标函数的面部序列隐变量空间初始值;(2)采用尺度共轭梯度法(Scaled Conjugate Gradient)求解隐变量,得到对应面部运动序列的低维隐变量序列。该方法在提取与身份信息无关的运动信息同时,保留由于面部运动幅度不同产生的隐空间序列变化范围差异。

    基于边缘信息的灰度目标自动跟踪方法

    公开(公告)号:CN103077531B

    公开(公告)日:2015-11-18

    申请号:CN201210514733.8

    申请日:2012-12-04

    Abstract: 一种基于边缘信息的灰度目标自动跟踪方法,步骤为:(1)对灰度目标图像进行预处理,包括图像去噪和Sobel微分算子滤波;(2)利用预处理后的灰度目标图像建立边缘信息特征空间;(3)提取目标边缘信息作为特征模版;(4)利用目标直方图计算候选目标的反向投影,并以此描述候选目标;(5)利用Kalman滤波器预测当前帧中目标的起始搜索位置;(6)利用Mean Shift方法在Kalman滤波器预测的目标起始位置附近搜索目标的最优位置;(7)结合Canny算子对目标区域进行更新。本方法充分利用目标的边缘信息,在目标形状、尺寸、灰度分布以及背景发生变化的情况下,实现了对灰度目标快速、稳健的跟踪。

    语音处理方法及装置
    46.
    发明公开

    公开(公告)号:CN104851421A

    公开(公告)日:2015-08-19

    申请号:CN201510169121.3

    申请日:2015-04-10

    Abstract: 本申请实施例提供了一种语音处理方法及装置。方法包括:获取语音信号和与所述语音信号同步的电声门图EGG信号;至少根据所述EGG信号,将所述语音信号划分为多个音段。本实施例提供了一种分割音段的方案。

    基于边缘信息的灰度目标自动跟踪方法

    公开(公告)号:CN103077531A

    公开(公告)日:2013-05-01

    申请号:CN201210514733.8

    申请日:2012-12-04

    Abstract: 一种基于边缘信息的灰度目标自动跟踪方法,步骤为:(1)对灰度目标图像进行预处理,包括图像去噪和Sobel微分算子滤波;(2)利用预处理后的灰度目标图像建立边缘信息特征空间;(3)提取目标边缘信息作为特征模版;(4)利用目标直方图计算候选目标的反向投影,并以此描述候选目标;(5)利用Kalman滤波器预测当前帧中目标的起始搜索位置;(6)利用Mean Shift方法在Kalman滤波器预测的目标起始位置附近搜索目标的最优位置;(7)结合Canny算子对目标区域进行更新。本方法充分利用目标的边缘信息,在目标形状、尺寸、灰度分布以及背景发生变化的情况下,实现了对灰度目标快速、稳健的跟踪。

    一种适合于多路话音编解码设备的网络控制方法

    公开(公告)号:CN101958895B

    公开(公告)日:2012-11-07

    申请号:CN201010287715.1

    申请日:2010-09-19

    Inventor: 毛峡 陈立江

    Abstract: 本发明一种适合于多路话音编解码设备的网络控制方法,多路话音编解码设备作为以太网服务器端,上位机作为客户端。服务器端在无客户端控制请求时,由硬件开关控制多路话音编解码设备的工作状态,在接收到客户端控制请求时,由客户端控制多路话音编解码设备的工作状态并且该设备定时向客户端进行状态反馈;本发明还涉及一种网络控制系统,包括服务器端的FPGA软硬件设计和客户端的控制程序设计。本发明能够降低成本、具有很强的实用性、易用性和鲁棒性。

    结合声门激励和声道调制信息的汉语语音情感提取及建模方法

    公开(公告)号:CN102750950A

    公开(公告)日:2012-10-24

    申请号:CN201210211283.5

    申请日:2011-09-30

    Inventor: 毛峡 陈立江

    Abstract: 本发明一种结合声门激励和声道调制信息的汉语语音情感提取及建模方法,该汉语声门激励信息的提取方法为:制定电声门图情感语音数据库规范;收集电声门图情感语音数据;电声门图情感语音主观评测,即由至少十名评测者对电声门图情感语音进行评测。结合声门激励和声道调制信息的汉语情感建模方法为:首先根据电声门图提取声门激励信息;其次根据电声门图和语音信号的关系提取语音信号中的声道调制信息;最后,利用所有备选特征的Fisher比率为每种情感选择合适的情感特征,并训练一对多支持向量机模型。本发明通过电声门图信号提取声门激励信息,将语音信号中的声门激励信息和声道调制信息分离,更准确的反映语音中的情感信息。

Patent Agency Ranking