基于空间限制邻域混合模型的图像分割方法

    公开(公告)号:CN104392458B

    公开(公告)日:2017-02-22

    申请号:CN201410766009.3

    申请日:2014-12-12

    Abstract: 基于空间限制邻域混合模型的图像分割方法,属于图像处理领域。为了解决目前在进行图像分割时,采用EM算法求取混合模型参数存在耦合性的问题。所述方法包括如下步骤:步骤一:根据独立混合模型建立空间限制邻域混合模型:首先,从独立混合模型的每个像素位置处,选择一个邻域,由邻域内的先验概率共同决定选择一个模型分量;然后,再由确定的模型分量生成每个像素位置对应邻域内的一组观测值;最后,根据确定的模型分量和生成的观测值,得到空间限制邻域混合模型的似然函数;步骤二:利用图像的像素的视觉观测值,求得空间限制邻域混合模型的模型参数;步骤三:利用所得的空间限制邻域混合模型的模型参数,获取分割后的图像。本发明用于图像分割。

    三编码周期灰度梯形相移结构光三维信息获取方法

    公开(公告)号:CN102519390A

    公开(公告)日:2012-06-27

    申请号:CN201110431402.3

    申请日:2011-12-21

    Abstract: 本发明提供了一种的三编码周期灰度梯形相移结构光三维信息获取方法。本发明方法通过选择三个不同的编码周期,在保留相位编码方法对投影角连续划分的优点同时,对相位编码法的测量范围拓展了第三个编码周期倍,对同一个编码周期,投射三幅移动1/3周期的编码图案,可以提高抗干扰能力,同时减少了环境光照和被测物表面反射系数不一致对三维信息获取结果的影响。本发明提高相移编码结构光测量范围,减小测量误差,提高测量精度,克服被测物表面反射率不一致和环境光对测量影响。

    三个编码周期的三基色三角形相移三维信息获取方法

    公开(公告)号:CN102494638A

    公开(公告)日:2012-06-13

    申请号:CN201110431404.2

    申请日:2011-12-21

    Abstract: 本发明提出了一种三个编码周期的三基色三角形相移三维信息获取方法,本发明方法通过选择三个基色空间中不同的编码周期,在保留相位编码方法对投影角连续划分的优点同时,对相位编码法的测量范围拓展了第三个编码周期倍。本发明是一种提高相移编码结构光测量范围,减小测量误差,提高测量精度,克服被测物表面反射率不一致和环境光对测量影响的基于三个编码周期三基色三角形相移采样点三维信息获取技术。

    可扩展精度Logistic混沌序列的并行计算方法

    公开(公告)号:CN101834717A

    公开(公告)日:2010-09-15

    申请号:CN201010152456.1

    申请日:2010-04-22

    Abstract: 本发明公开了一种可扩展精度Logistic混沌序列的并行计算方法,其步骤为:(1)初始参数x0、μ整数量化保存到一维数组中,设定要求达到的精度或者指定迭代的次数;(2)并行计算算法第一部分:x=x×(1-x),利用矩阵保存计算中间结果,修改动态数组的长度,保存计算结果在动态数组中;(3)并行计算算法第二部分:x=μ×x,保存计算结果在动态数组中;(4)如果精度或者迭代次数达到要求的值,动态数组中即为得到混沌序列,计算结束;否则,转到(2)。本发明充分利用了混沌系统的特性,提供更加扩大的映射空间的混沌序列。可用于保密通信、信息安全等领域,特别适合于图形图像、多媒体等信息的加密存储和网络传输。

    基于重构群延迟-常数Q变换语谱图的声纹欺诈检测方法

    公开(公告)号:CN114639387B

    公开(公告)日:2024-09-10

    申请号:CN202210221453.1

    申请日:2022-03-07

    Abstract: 本发明公开了一种声纹欺诈检测方法,将能量谱经由Q‑DCT和Q‑IDCT平滑处理的重构群延迟‑常数Q变换(以下称为RGD‑CQT)语谱图特征进行检测语音欺诈攻击的方法,解决了欺诈语音特征区分性不强及欺诈语音检测系统错误率高的问题。在训练时,先对语音序列进行填充或截取操作,进而将语音序列的每一位与索引序号加一的值进行相乘,获得新的语音序列。将两个语音序列分别进行常数Q变换(CQT,constant Q transform),获得两个语谱图X和Y。分别提取两张语谱图的实部和虚部,对语谱图X进行Q‑DCT和Q‑IDCT,之后进行修改的群延迟的计算,最后进行归一化和取对数得到最终的语谱图。将其作为resnet18+cbam网络的输入;然后通过交叉熵损失和Adam优化器训练出一个最优的网络模型作为用于测试的模型。最终根据网络模型的分数,如果分数大于0则认为是真实语音,反之,则判断为欺诈语音。

    基于概率有监督总变化空间学习的语种识别方法

    公开(公告)号:CN115762473A

    公开(公告)日:2023-03-07

    申请号:CN202211186809.9

    申请日:2022-09-27

    Abstract: 本发明公开了一种基于概率有监督总变化空间学习的语种识别方法,解决了传统i‑vector语种识别系统先验信息利用不充分的问题。在训练阶段,利用开发集移位差分倒谱(SDC)特征训练通用背景模型(UBM),再将数据集中每段语音的SDC特征作为输入,在UBM上进行自适应得到每段语音的GMM均值超矢量;然后将开发集均值超矢量和类别标签作为模型输入,建立基于概率有监督总变化空间学习的语种识别模型。在识别阶段,分别得到开发集、注册集、测试集中全部语音在概率有监督总变化空间上的i‑vector特征,然后利用线性判别分析(LDA)进行降维,最后利用概率线性判别分析(PLDA)分类器进行评分。该方法能够充分利用先验信息,以此提高系统性能。本发明可以应用于语种识别领域。

    基于区分性字典与分类器联合学习的说话人识别方法

    公开(公告)号:CN115512708A

    公开(公告)日:2022-12-23

    申请号:CN202211218439.2

    申请日:2022-10-05

    Abstract: 本发明公开了一种基于区分性字典与分类器联合学习的说话人识别方法,该方法在训练数据中增加分类器参数和正则化参数,提高了传统说话人识别系统的正确率,是在传统字典学习基础上的创新。本发明在训练阶段,首先对语音提取i‑vector,将其和One‑Hot拼接后作为稀疏分解的输入;然后初始化字典和分类器参数,获取i‑vector在字典上的稀疏表示;最后利用K均值‑奇异值分解(KSVD)算法更新字典。在识别阶段,首先利用字典与其二范数的商作为识别阶段的字典,同理得到分类器参数;然后计算测试语音在字典上的稀疏表示,分类器参数和稀疏表示的积是说话人在不同字典上的得分;最后判断得分最高说话人是否是测试说话人。本发明可以应用于说话人识别领域。

    基于事件检测的微博网络情感社区识别方法

    公开(公告)号:CN110347897B

    公开(公告)日:2021-09-21

    申请号:CN201910577138.0

    申请日:2019-06-28

    Abstract: 本发明是基于事件检测的微博网络情感社区识别方法。本发明基于Python爬虫爬取微博网络用语的数据,提取微博网络中的社会热点事件,构造事件热点评估函数;度量微博用户对社会热点事件的情感极性,生成微博用户对多个社会热点事件的情感极性标签;初始化微博用户的情感极性标签,构造社区标签更新迭代规则,直至标签收敛时终止循环,将具有相同标签的节点划分到同一社区。本发明解决目前社区识别算法无法刻画用户的情感倾向性,导致输出的社区结果内聚性较低、稳定性不足,在网络演化过程中容易引发社区分裂的问题。本发明保证了输出的社区结果具有较高的内聚性及稳定性,对网络演化产生的网络结构及属性改变具有较高的适应性。

    一种基于旋律特征聚类与优化的哼唱检索方法

    公开(公告)号:CN113377994A

    公开(公告)日:2021-09-10

    申请号:CN202110773772.9

    申请日:2021-07-08

    Abstract: 本申请涉及一种基于旋律特征聚类与优化的哼唱检索方法,包括:对训练数据进行旋律特征提取,该特征为音高向量;对音高向量进行聚类并利用聚类标签训练DBN网络;利用训练好的DBN模型对测试数据提取特征;与训练集旋律特征库中的旋律特征进行匹配并找到所属类别,在类内继续匹配输出检索结果。本方法将优化初始聚类中心的k‑means算法引入到哼唱检索中,其能够依据高密度优先聚类的思想,有效提升密度差异较大数据集的聚类效果,聚类后同簇的旋律特征具有更高的结构相似性。本发明不仅检索稳定高效,而且检索精度高。

Patent Agency Ranking