一种基于双神经网络模型的语音降噪方法

    公开(公告)号:CN115547353A

    公开(公告)日:2022-12-30

    申请号:CN202211212035.2

    申请日:2022-09-30

    Abstract: 本发明公开了一种基于双神经网络模型的语音降噪方法。本发明根据嵌入式系统所能提供的资源确定系统的总计算量和总参数量,对接收到的语音数字信号进行分帧和FFT变换,将每帧的FFT谱作为两个神经网络模型的输入,两个神经网络模型分别使用卷积结构的多层网络和RNN结构的多层网络,利用两个神经网络模型的输出和预设的分频带混合参数计算得到每个频带的总语音保留系数,分频带混合参数与该帧的FFT谱对应的频带值相乘,得到处理后每帧FFT谱,逆快速傅里叶变换和去帧后成为时域输出。本发明使用的模型参数量与计算量较小,适合低内存低算力的嵌入式设备使用。本发明针对不同用户的需求,不需要重新训练修改模型,节省了时间与成本。

    基于神经网络特征识别的数据压缩方法

    公开(公告)号:CN111368976B

    公开(公告)日:2022-09-02

    申请号:CN202010126059.0

    申请日:2020-02-27

    Abstract: 本发明公开了基于神经网络特征识别的数据压缩方法。本发明方法首先对神经网络识别模型的特征数据进行约束,然后对模型进行重训练,模型经验证集测试,若测试结果满足要求,则固化模型参数,得到推断模型,该推断模型输出的特征数据的分布满足后续压缩需求。根据推断模型和库数据得到类特征数据。对类特征数据进行量化,然后对类内特征数据依次按特征相近度排序,依据排序结果进行差值存储,实现类内特征数据压缩。得到压缩后的特征比对库,结合推断模型,将其部署到实际的设备中。本发明方法部署到存储有限的离线端或移动端设备的模型,在保证模型的鲁棒识别性能基础上,既降低了库模型所需内存,又不额外增加解码计算量。

    一种视频运动字幕检测方法

    公开(公告)号:CN113727176A

    公开(公告)日:2021-11-30

    申请号:CN202111003875.3

    申请日:2021-08-30

    Abstract: 本发明公开了一种视频运动字幕检测方法。目前的视频图像处理技术往往针对所有像素采取一样的图像处理手段,而不会对运动字幕区域采取单独的处理方式。本发明方法首先输入连续两帧视频逐行序列,然后提取运动像素区域,再提取运动字幕区域,优化、展宽运动字幕区域后,输出运动字幕区域。本发明方法利用输入两帧逐行图像序列的差值,选取运动像素区域,进而从中选取运动字幕区域,可以有效提取视频中的运动字幕区域,从而可以对运动字幕进行单独的图像处理,达到改善运动字幕显示效果的目的。

    一种基于帧内数据差值神经网络加速方法

    公开(公告)号:CN112836797A

    公开(公告)日:2021-05-25

    申请号:CN202110117712.1

    申请日:2021-01-28

    Abstract: 本发明公开了一种基于帧内数据差值神经网络加速方法。本发明方法流程包括:通道相关性重排、权重累加预处理、第一层作为当前计算层、当前层输入数据差值处理、矩阵乘加、是否进行过行列方向差值、行或者列方向差值恢复,激活函数处理、是否为最后一层,下一层作为当前层。本发明方法通过对神经网络的数据进行通道方向、行或者列方向进行差值得到差值后数据,相比原始数据稀疏性增强。本发明方法通过对神经网络全连接层权重进行累加预处理,对神经网络卷积层进行差值恢复处理,使得可以使用差值后数据作为计算输入。当神经网络计算支持稀疏矩阵计算加速时,相比直接采用原始数据,采用差值后数据作为输入提升了稀疏矩阵计算的加速效果。

    一种图像插值卷积核的设计方法

    公开(公告)号:CN111524069A

    公开(公告)日:2020-08-11

    申请号:CN202010299716.1

    申请日:2020-04-16

    Abstract: 本发明公开了一种图像插值卷积核的设计方法。现有插值方法都具有局部性的特点,曲线上的点的值只对附近的插值点有影响。本发明方法通过对卷积核进行相位采样实现插值卷积核的离散化,构造带约束的边缘波动率优化的插值目标函数,对目标函数进行非线性最小值优化求解卷积核,再对解出的卷积核进行函数拟合,得到图像插值所需要的卷积核。本发明提出的图像插值所需要的卷积核插值所获得的插值图像可以减少斜边的波动率,提升了对图像斜边的观看质量。本发明方法优化的卷积核只需要进行2N×2N点插值,计算量低,而且不需要场景判断,适合在机顶盒或电视机上的VLSI上用流水线实现。

    基于神经网络特征识别的数据压缩方法

    公开(公告)号:CN111368976A

    公开(公告)日:2020-07-03

    申请号:CN202010126059.0

    申请日:2020-02-27

    Abstract: 本发明公开了基于神经网络特征识别的数据压缩方法。本发明方法首先对神经网络识别模型的特征数据进行约束,然后对模型进行重训练,模型经验证集测试,若测试结果满足要求,则固化模型参数,得到推断模型,该推断模型输出的特征数据的分布满足后续压缩需求。根据推断模型和库数据得到类特征数据。对类特征数据进行量化,然后对类内特征数据依次按特征相近度排序,依据排序结果进行差值存储,实现类内特征数据压缩。得到压缩后的特征比对库,结合推断模型,将其部署到实际的设备中。本发明方法部署到存储有限的离线端或移动端设备的模型,在保证模型的鲁棒识别性能基础上,既降低了库模型所需内存,又不额外增加解码计算量。

Patent Agency Ranking