一种基于稀疏表示的短语音说话人识别方法

    公开(公告)号:CN103345923B

    公开(公告)日:2016-05-11

    申请号:CN201310319824.0

    申请日:2013-07-26

    Abstract: 本发明公开了一种基于稀疏表示的短语音说话人识别方法,属于语音信号处理与模式识别技术领域,其旨在决现有方法在语音数据有限条件下识别率低的问题。其主要包括以下步骤:①对所有语音样本预处理,然后提取梅尔倒谱系数及其一阶差分系数作为特征;②由背景语音库训练高斯背景模型,并提取高斯超向量作为二次特征;③将训练语音样本的高斯超向量排列在一起构成字典;⑤利用稀疏求解算法求解表示系数,并重构信号,根据最小化残差确定识别结果。本发明经自适应得到的高斯超向量,能够极大地缓解语音数据有限带来说话人个性特征表现不足的问题;利用稀疏表示的重构残差进行分类,能够处理语义信息不匹配导致的说话人模型失配的问题。

    一种基于动态规划和均值漂移的结构光光条中心提取方法

    公开(公告)号:CN103411562B

    公开(公告)日:2016-01-13

    申请号:CN201310369448.6

    申请日:2013-08-22

    Abstract: 本发明提供一种基于动态规划和均值漂移的结构光光条中心提取方法,其属于机器视觉技术领域,包括以下步骤:首先对光条图像进行图像增强;然后对线状光条增强图像进行动态规划处理,获得光条中心点的初始位置向量;最后使用一维均值漂移算法进行迭代,计算出光条中心的精确位置,获得光条中心点的最终位置向量。本发明运算量小、计算速度快且精度上也能达到较高的要求;另外,本发明由于采用动态规划算法时,寻找的是全局最优的光条中心点路径,且迭代时只在光条的像素点中进行,可以在一定程度上避免噪声的影响,抗干扰性强,通用性良好。

    一种高分辨率遥感图像分割方法

    公开(公告)号:CN103400389B

    公开(公告)日:2016-05-04

    申请号:CN201310347917.4

    申请日:2013-08-12

    Abstract: 本发明提供一种高分辨率遥感图像分割方法,属于遥感图像处理领域,包括以下步骤:S1、计算待处理图像所有相邻像素的相似度,按相似度从大到小的顺序对所有像素对进行排序;S2、按顺序选择像素对,计算两个像素所在两个相邻区域的光谱特征和纹理特征;S3、根据获取到光谱特征和纹理特征确定两个区域是否合并,最终完成分割;其中,所述待处理图像为高分辨率遥感图像,所述纹理特征指待合并区域的LBP值分布。本发明在结合统计区域合并算法的基础上,结合改进的旋转不变一直模式LBP算子,充分利用了高分辨率遥感图像的信息,大大提高了分割精度,有效将大量光谱信息接近的不同区域分割出来,灵活控制图像的分割尺度。

    一种基于动态规划和均值漂移的结构光光条中心提取方法

    公开(公告)号:CN103411562A

    公开(公告)日:2013-11-27

    申请号:CN201310369448.6

    申请日:2013-08-22

    Abstract: 本发明提供一种基于动态规划和均值漂移的结构光光条中心提取方法,其属于机器视觉技术领域,包括以下步骤:首先对光条图像进行图像增强;然后对线状光条增强图像进行动态规划处理,获得光条中心点的初始位置向量;最后使用一维均值漂移算法进行迭代,计算出光条中心的精确位置,获得光条中心点的最终位置向量。本发明运算量小、计算速度快且精度上也能达到较高的要求;另外,本发明由于采用动态规划算法时,寻找的是全局最优的光条中心点路径,且迭代时只在光条的像素点中进行,可以在一定程度上避免噪声的影响,抗干扰性强,通用性良好。

    一种高分辨率遥感图像分割方法

    公开(公告)号:CN103400389A

    公开(公告)日:2013-11-20

    申请号:CN201310347917.4

    申请日:2013-08-12

    Abstract: 本发明提供一种高分辨率遥感图像分割方法,属于遥感图像处理领域,包括以下步骤:S1、计算待处理图像所有相邻像素的相似度,按相似度从大到小的顺序对所有像素对进行排序;S2、按顺序选择像素对,计算两个像素所在两个相邻区域的光谱特征和纹理特征;S3、根据获取到光谱特征和纹理特征确定两个区域是否合并,最终完成分割;其中,所述待处理图像为高分辨率遥感图像,所述纹理特征指待合并区域的LBP值分布。本发明在结合统计区域合并算法的基础上,结合改进的旋转不变一直模式LBP算子,充分利用了高分辨率遥感图像的信息,大大提高了分割精度,有效将大量光谱信息接近的不同区域分割出来,灵活控制图像的分割尺度。

    一种基于稀疏表示的短语音说话人识别方法

    公开(公告)号:CN103345923A

    公开(公告)日:2013-10-09

    申请号:CN201310319824.0

    申请日:2013-07-26

    Abstract: 本发明公开了一种基于稀疏表示的短语音说话人识别方法,属于语音信号处理与模式识别技术领域,其旨在决现有方法在语音数据有限条件下识别率低的问题。其主要包括以下步骤:①对所有语音样本预处理,然后提取梅尔倒谱系数及其一阶差分系数作为特征;②由背景语音库训练高斯背景模型,并提取高斯超向量作为二次特征;③将训练语音样本的高斯超向量排列在一起构成字典;④利用稀疏求解算法求解表示系数,并重构信号,根据最小化残差确定识别结果。本发明经自适应得到的高斯超向量,能够极大地缓解语音数据有限带来说话人个性特征表现不足的问题;利用稀疏表示的重构残差进行分类,能够处理语义信息不匹配导致的说话人模型失配的问题。

Patent Agency Ranking