一种电话场景下热词在线定制更新的自动语音记录方法

    公开(公告)号:CN114283796A

    公开(公告)日:2022-04-05

    申请号:CN202111393878.2

    申请日:2021-11-23

    Abstract: 本发明公开了一种电话场景下热词在线定制更新的自动语音记录方法,首先训练基于深度神经网络的自动语音识别模型:然后通过电话音频文件对自动语音识别模型进行再训练,生成预训练模型;定制差异化语言模型自更新模型与热词表,并实时调整解码阶段的权重,组成自适应语音识别热词系统。本发明提出了基于不同场景的电话客服可在线定制热词的语音识别系统,生成不同场景下的热词表,提高了语音转写成文本效率的准确性;提出了热词权重实时更新算法,在线统计热词词频,依据词频在声学模型的解码阶段实时更新模型参数采用迁移学习的方式对8K电话音频进行再学习,提高了电话场景下音频语音识别的准确率。

    基于深度网络迁移特征与增广自编码的城市噪声识别方法

    公开(公告)号:CN110751044A

    公开(公告)日:2020-02-04

    申请号:CN201910886926.8

    申请日:2019-09-19

    Abstract: 本发明公开了一种基于深度网络迁移特征与增广自编码的城市噪声识别方法。本发明步骤如下:1、对采集到的每一类城市噪声信号进行预处理,包括去噪、分帧和加窗;2、将处理后的噪声信号转换成声谱图;3、使用多个预训练的深度卷积神经网络对步骤2得到的声谱图进行特征提取;4、利用增广自编码器对得到的特征向量x进行融合;5、在步骤4的融合特征的基础上,构建多层one-class分类模型;6、计算ML-OCRLS的输出权重和决策阈值;7、对未知信号进行分类预测。本发明提出的增广自编码器的隐含层神经元能够对所有特征进行调优,基于增广自编码器的ML-OCRLS可提取主要信息,减少特征冗余,同时有效的融合多种迁移学习特征,从而提高分类器的分类精度。

    一种基于四维数据特征的海陆杂波分类方法

    公开(公告)号:CN110501683A

    公开(公告)日:2019-11-26

    申请号:CN201910764890.6

    申请日:2019-08-19

    Abstract: 本发明公开一种基于四维数据特征的海陆杂波分类方法,由于传统的海陆杂波背景下的目标检测方法主要是基于对雷达杂波的统计建模,造成了检测结果强依赖于杂波统计模型的准确度,而实际情况是海洋和陆地回波信号因自身环境的复杂性和受天气,温度,人工干扰等情况的影响,造成较难建立与实际情况一致的杂波统计模型。因此,提出一种基于雷达数据本身特性和模型参数相结合的四维特征分类方法,将回波数据的短时能量,过零率和相关性特性与统计模型的形状参数共同构建特征向量空间,在此基础上,用机器学习算法极限学习机解析分类结果,无复杂的迭代过程,以提高实时性和泛化性能。

    基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法

    公开(公告)号:CN106610451B

    公开(公告)日:2019-01-04

    申请号:CN201611205653.9

    申请日:2016-12-23

    Abstract: 本发明公开了一种基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法。本发明包括如下步骤:1、根据T种不同周期的周期信号的基频,得到其组成的基频集合S;2、获得未知基频周期信号数据s(m),其基频μx属于基频集合S;3、对信号数据s(m)进行分帧,得到所有数据帧的集合;4、对每一帧数据,使用倒谱法提取出基频估计值,而所有帧的基频组成基频估计值序列;5、求基频估计值序列的均值;6、依据贝叶斯决策得到准确的基频μx。

    一种基于尺度变换激活函数的超限学习机的改进方法

    公开(公告)号:CN106991480A

    公开(公告)日:2017-07-28

    申请号:CN201710059378.2

    申请日:2017-01-24

    CPC classification number: G06N20/00

    Abstract: 本发明公开了一种基于尺度变换激活函数的超限学习机的改进方法。本发明包含以下步骤:1、随机产生隐藏层节点参数(wi,bi),i=1,2,…,L;2、用训练数据集的所有训练样本构建隐藏层数据矩阵V;3、将V中的(N×L)个元素按升序排列成(N×L)维隐藏层数据向量vasc;4、给出原激活函数g(·)及其期望输出的区间5、由构建输出向量6、设计需要求解的激活函数尺度变换参数为s和t,计算出最小时对应的s和t;7、以新的尺度变换激活函数g(s·V+t)求其隐藏层的输出矩阵H,输出权重β,得到训练模型完成训练。本发明能够自适应的调整隐藏层中激活函数的参数,使得隐藏层输出能够均匀的分布在期望的输出区间内,此时,隐藏层输出数据的信息熵达到最大,从而提高超限学习机的泛化性能。

    一种基于多层矩阵随机神经网络的城市噪声识别方法

    公开(公告)号:CN113643722B

    公开(公告)日:2024-04-19

    申请号:CN202110995007.1

    申请日:2021-08-27

    Abstract: 本发明公开了一种基于多层矩阵随机神经网络的城市噪声识别方法。本发明包括如下步骤:1、对采集到的城市噪声进行预处理,包括去噪、预加重、分帧、加窗等,其中帧长为L,帧移为#imgabs0#2、将经过预处理的噪声信号转换成时频图;3、构建矩阵随机自编码器,以城市噪声二维时频图作为矩阵随机自编码器的输入,通过输出重建输入的方式进行训练,获得最优的输出权重作为编码器;同时将上一个相邻矩阵随机自编码器的编码输出作为下一个矩阵随机自编码器的输入,堆叠K个矩阵随机自编码器;4、构建矩阵均方误差损失函数,进行城市噪声分类识别。本发明加快了矩阵随机自编码器的训练速度。免去矢量化步骤、保留时频图信息同时实现有效的城市噪声识别。

    基于全卷积网络和卡尔曼滤波的雷达小目标跟踪方法

    公开(公告)号:CN113808174B

    公开(公告)日:2024-03-26

    申请号:CN202110995010.3

    申请日:2021-08-27

    Abstract: 本发明公开了一种基于全卷积网络和卡尔曼滤波的雷达小目标跟踪方法。本发明步骤:1、对雷达接收机采集的回波信号进行预处理,获取信号的R‑D图;2、构建全卷积神经网络并利用网络预测特征图像素点对应R‑D图中每个感受野区域分别属于目标和背景的类别概率,以及该区域包含目标时,特征图像素点在每个网格划分区域中相对于左上单元的偏移量,从而判断存在目标时的目标位置;3、将目标位置的俯仰角、方位角及径向距离作为雷达系统的量测值,通过坐标转换卡尔曼滤波器实现目标跟踪。本发明利用特征图像素点对应的感受野替代传统深度学习方案的滑窗技术,大幅提升模型训练及检测的速度,并通过坐标转换卡尔曼滤波器跟踪目标,更准确快速得到目标轨迹。

    一种基于视听跨模态生成的重型工程器械识别方法及系统

    公开(公告)号:CN116704352A

    公开(公告)日:2023-09-05

    申请号:CN202310726447.6

    申请日:2023-06-19

    Abstract: 本发明公开了一种基于视听跨模态生成的重型工程器械识别方法及系统。首先进行重型工程器械数据集的处理和标注;将得到的样本数据输入第一级变分自编码器网络进行训练得到每个模态对应的潜在向量;再将潜在向量进行融合得到联合模态表示,同时在训练阶段对缺失模态数据采用模态重建处理,映射得到近似模态数据;之后将联合模态数据输入第二级对抗变分自编码器网络进行训练,解码得到最后的生成数据。最后将最后生成的数据输入预训练好的识别模块进行识别。本发明为了解决变分自编码器模型生成数据模糊的问题,提出了使用生成对抗模型中的对抗学习方法,更好的学习数据分布的细微特征和模式,从而提高模型的表达能力。

Patent Agency Ranking