基于时空关联算法的PIND检测信号分类判识系统

    公开(公告)号:CN117195068A

    公开(公告)日:2023-12-08

    申请号:CN202311111186.3

    申请日:2023-08-30

    Abstract: 基于时空关联算法的PIND检测信号分类判识系统,属于航天科学技术中多余物检测信号检测识别领域。为了解决现有的PIND检测信号分类方法存在准确率低、效率低的问题,本发明首先对将波形信号进行分窗并基于脉冲信号得到脉冲位置,根据脉冲信号确定其是否为线上脉冲或线下脉冲,然后确定每个脉冲对应的关联视界和干扰视界范围并计算每一个脉冲的关联脉冲数量、线下关联脉冲数量、线上关联脉冲数量和干扰脉冲数量、线下干扰脉冲数量、线上干扰脉冲数量,然后进行时空连续组搜索并将时空连续组内关联脉冲数的最大值作为时空连续组内的每一个脉冲的关联脉冲数,最后基于关联脉冲和干扰脉冲以及判识规则,判定各脉冲其是组件脉冲还是多余物脉冲。

    基于自适应半监督非负矩阵分解的跨语料情感识别方法

    公开(公告)号:CN110120231B

    公开(公告)日:2021-04-02

    申请号:CN201910408086.4

    申请日:2019-05-15

    Abstract: 基于自适应半监督非负矩阵分解的跨语料情感识别方法,它属于语音中的情感识别技术领域。本发明解决了话者语音不匹配现象导致的现有跨语料语音情感识别方法对情感识别的准确率低的问题。本发明通过特征空间与标签空间共享编码信息的方式,可以学习到更具判别性的语音情感特征表示,同时采用最大平均差异来度量特征表示中存在的差异,减少话者语音的不匹配,并根据流形一致性假设,使得新的特征表示尽可能保留原始特征空间的信息,增强了语音情感特征表示的健壮性。本发明在四组跨语料语音情感识别任务中的未加权平均召回率达到43.74%,加权平均召回率达到43.84%,有效提高了跨语料语音情感识别的准确率。本发明可以应用于语音中的情感识别技术领域。

    一种基于局部学习的鲁棒声学场景识别方法

    公开(公告)号:CN110176250A

    公开(公告)日:2019-08-27

    申请号:CN201910464699.X

    申请日:2019-05-30

    Abstract: 本发明提供一种基于局部学习的鲁棒声学场景识别方法,属于声音信号处理技术领域。本发明首先采集不同声学场景声音信号,进行频域特征提取;并对提取的特征数据预处理;然后对归一化后的数据进行均值平移、使用mixup方法进行数据扩充;再根据局部学习思想建立卷积神经网络模型,将经过数据扩充后的训练样本集输入该模型进行训练,得到训练好的模型;最后对待识别样本,依次进行频域特征提取、数据预处理,输入到所述训练好的模型中进行识别,得到声学场景识别结果。本发明解决了音频信道不匹配以及不同信道样本数目不平衡的情况下,声学场景识别准确度不高的问题。本发明可适用于信道多样且不同信道样本数目不平衡的声学场景识别。

    一种基于跨模态自动对齐和预训练语言模型的情感分析方法、系统及设备

    公开(公告)号:CN113704552B

    公开(公告)日:2024-09-24

    申请号:CN202111012714.0

    申请日:2021-08-31

    Abstract: 一种基于跨模态自动对齐和预训练语言模型的情感分析方法、系统及设备,它属于机器的多模态感知技术领域。本发明解决了现有情感分析技术需要人工对各模态序列进行对齐标注的问题。本发明对现有大规模预训练语言模型的多模态情感分析方法进行改进,使本发明方法不需要人工的对齐标注,因而适合目前大规模数据量、未对齐的多模态序列场景的情形,极大地提高了其实用性。而且,将本发明提出的方法在公开的最常使用的多模态情感分析的2个数据集上进行验证,结果表明其分类性能较基线系统有很大提高。本发明可以应用于情感分析。

    一种基于公共子空间表示学习的声学事件识别方法

    公开(公告)号:CN113361592B

    公开(公告)日:2022-11-08

    申请号:CN202110620415.9

    申请日:2021-06-03

    Abstract: 一种基于公共子空间表示学习的声学事件识别方法,涉及一种声学事件识别方法。本发明是为了解决不同语义特征间子空间不一致导致的声学事件识别任务准确率较低的问题。本发明首先对每一个原始声学事件信号进行采样、量化、帧级特征提取、段级特征提取及扩展;然后通过学习公共子空间获得其语义特征表示;计算训练集的核矩阵,并用以训练分类器得到分类模型。在测试时,对每一个原始声学事件信号进行采样、量化、帧级特征提取、段级特征提取及其扩展;在已学习到的公共子空间指导下获得其语义特征表示;最后,计算测试集的核矩阵,并在分类模型的指导下进行模型匹配,来得到预测结果。主要用于声学事件的识别。

    基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法

    公开(公告)号:CN110211574B

    公开(公告)日:2022-03-11

    申请号:CN201910477034.2

    申请日:2019-06-03

    Abstract: 基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法,属于建模方法领域。传统的注意力模型存在识别性能较差,注意力尺度单一等问题。一种基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法,采用深度置信网络提取瓶颈特征作为前端,能够增加模型的鲁棒性,而后端则采用由不同尺度的卷积核组成的多尺度多头注意力模型,分别对音素、音节、词等级别的语音基元进行建模,逐个计算出循环神经网络隐含层状态序列以及输出序列;使用每个头的注意力网络所对应的解码网络计算输出序列在位置处的元素,最终将所有输出序列采整合成一个新的输出序列。本发明能够提高语音识别系统的识别效果。

    一种基于公共子空间表示学习的声学事件识别方法

    公开(公告)号:CN113361592A

    公开(公告)日:2021-09-07

    申请号:CN202110620415.9

    申请日:2021-06-03

    Abstract: 一种基于公共子空间表示学习的声学事件识别方法,涉及一种声学事件识别方法。本发明是为了解决不同语义特征间子空间不一致导致的声学事件识别任务准确率较低的问题。本发明首先对每一个原始声学事件信号进行采样、量化、帧级特征提取、段级特征提取及扩展;然后通过学习公共子空间获得其语义特征表示;计算训练集的核矩阵,并用以训练分类器得到分类模型。在测试时,对每一个原始声学事件信号进行采样、量化、帧级特征提取、段级特征提取及其扩展;在已学习到的公共子空间指导下获得其语义特征表示;最后,计算测试集的核矩阵,并在分类模型的指导下进行模型匹配,来得到预测结果。主要用于声学事件的识别。

    基于多层时序池化的音频表示学习方法

    公开(公告)号:CN110334243A

    公开(公告)日:2019-10-15

    申请号:CN201910626365.8

    申请日:2019-07-11

    Abstract: 本发明提供基于多层时序池化的音频表示学习方法,属于音频分类技术领域。本发明首先提取训练集和待表示音频中每个音频样本的频谱特征,并切分成长度相等的片段,利用训练集的片段级别时频特征集合训练CNN网络,然后用训练好的CNN网络提取待表示音频的片段级别特征表示;再将提取的待表示音频的片段级别特征表示作为多层时序池化网络的输入,所述多层时序池化网络的每个时序池化层依次对输入数据进行非线性特征映射和时序编码操作,最终输出待表示音频的表示向量。本发明解决了现有缺少能够灵活、高效地捕捉任意时长音频样本的时序动态信息的特征表示技术的问题。本发明可用于鲁棒和高级的音频表示。

    基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法

    公开(公告)号:CN110211574A

    公开(公告)日:2019-09-06

    申请号:CN201910477034.2

    申请日:2019-06-03

    Abstract: 基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法,属于建模方法领域。传统的注意力模型存在识别性能较差,注意力尺度单一等问题。一种基于瓶颈特征和多尺度多头注意力机制的语音识别模型建立方法,采用深度置信网络提取瓶颈特征作为前端,能够增加模型的鲁棒性,而后端则采用由不同尺度的卷积核组成的多尺度多头注意力模型,分别对音素、音节、词等级别的语音基元进行建模,逐个计算出循环神经网络隐含层状态序列以及输出序列;使用每个头的注意力网络所对应的解码网络计算输出序列在位置处的元素,最终将所有输出序列采整合成一个新的输出序列。本发明能够提高语音识别系统的识别效果。

    基于总变化空间与分类器联合优化的说话人身份识别方法

    公开(公告)号:CN110148417A

    公开(公告)日:2019-08-20

    申请号:CN201910439064.4

    申请日:2019-05-24

    Abstract: 基于总变化空间与分类器联合优化的说话人身份识别方法,它属于说话人识别技术领域。本发明解决了目前的总变化空间估计方法对说话人身份识别的等错误率高的问题。本发明首先求得训练集均值超矢量在初始总变化空间上的表示;然后对该表示进行长度规整,并输入分类器PLDA;接着在分类器PLDA的监督下,更新分类器的参数与总变化空间的参数,重复上述步骤,直至达到设置的最大迭代次数,获得最终的分类器参数与总变化空间参数;测试时,利用测试语音的均值超矢量和目标说话人的均值超矢量,计算其在总变化空间上的表示,然后对该表示进行长度规整,并计算其在分类器上的联合概率密度作为最终分类的依据。本发明可以应用于说话人识别技术领域。

Patent Agency Ranking