基于激励CTC及子词解码的海南方言语音识别方法

    公开(公告)号:CN119252231A

    公开(公告)日:2025-01-03

    申请号:CN202411660670.6

    申请日:2024-11-20

    Abstract: 本发明公开了一种基于激励CTC及子词解码的海南方言语音识别方法,属于语音识别技术领域,包括以下步骤:获取海南方言语音信号,将海南方言语音信号进行处理提取声学特征;获取文本数据,将文本数据进行处理提取语言特征;构建语音识别模型,语音识别模型包含声学模型、RNN语言模型、改进CTC损失函数以及解码器,在训练过程中,基于改进CTC损失函数对声学模型、RNN语言模型进行参数优化,最终得到训练后的语音识别模型;引入子词模型,构建TSLG解码图,基于TSLG解码图采用训练后的语音识别模型进行海南方言识别,得到海南方言识别结果;通过该方法,能够得到准确的语音识别结果。

    一种海南方言语音识别系统及装置

    公开(公告)号:CN117577094A

    公开(公告)日:2024-02-20

    申请号:CN202311428936.X

    申请日:2023-10-31

    Abstract: 本发明涉及语音识别技术领域,公开了一种海南方言语音识别系统,包括特征提取模块和音素识别模块;特征提取模块通过对原始海南方言语音提取出各种语音特征,音素识别模块将所述语音特征依次通过卷积神经网络、残差网络、多头注意力机制以及长短期记忆网络组合而成的声学模型得到发音底层特征,通过全连接层映射到合适的维度,生成音素串;经过CTC损失函数计算预测的音素串与真实的音素串的差值,通过Ad‑am算法对模型中的参数进行优化,得到音素错误率;根据发音底层特征,利用海南方言发音底层特征进行方言语音识别。本发明能够有效提取不同方言特有的音素串发音底层特征,同时多种语音特征的融入使得方言语音识别性能得到大幅度提升。

    一种临高话和普通话混合语音识别模型训练方法及系统

    公开(公告)号:CN117373438A

    公开(公告)日:2024-01-09

    申请号:CN202311428942.5

    申请日:2023-10-31

    Abstract: 本发明涉及语音识别技术领域,公开了一种临高话和普通话混合语音识别模型训练方法,基于Conformer模型构建的端到端混合语音识别模型,所述方法包括:输入包含临高话和普通话的混合语音信号,并提取混合语音信号的声学特征序列;将特征序列输入到预设编码器,进行降采样以减少特征冗余信息,再经编码器编码生成隐藏向量;解码器对向量进行解码,在解码图中,依据转移弧上的权重逐帧进行搜索,计算每条路径中的权重得分;选择得分最高的路径作为最优路径,不断更新状态信息;输出最优路径对应的标签序列作为最终识别结果。本发明增强了模型提取局部细微特征的能力,提升了模型的语言建模能力,提高了模型识别的准确率。

    一种基于预训练和微调的方言语音识别方法及系统

    公开(公告)号:CN118298814A

    公开(公告)日:2024-07-05

    申请号:CN202410481956.1

    申请日:2024-04-22

    Abstract: 本发明公开了一种基于预训练和微调的方言语音识别方法及系统,涉及语音识别技术领域,包括获取待识别语音数据,根据待识别语音数据,获取待识别语音标识信息,根据语音识别数据集,获取方言语音识别模型,根据待识别语音标识信息,基于方言语音识别模型,获取语音识别信息。本发明通过待识别语音标识信息,提高了语音识别的准确度,通过音频数据质量指数,提高了数据的准确性和可靠性,为语音识别模型提供数据基础,通过数据集标准片段信息,对现有的语音识别模型进行训练,获取方言语音识别模型,根据语音匹配指数,对语音识别可能信息进行筛选,获取语音识别模糊修正信息,提高了模型的泛化能力和语音识别的准确性。

    基于深度学习的水下图像增强及目标检测方法

    公开(公告)号:CN118097394A

    公开(公告)日:2024-05-28

    申请号:CN202410355351.8

    申请日:2024-03-27

    Abstract: 本发明提供基于深度学习的水下图像增强及目标检测方法,所述方法包括以下步骤:S1、分别设计水下图像增强网络模型和设计多尺度策略目标检测网络;S2、在水下图像增强网络模型中通过多路径扩张卷积快和级联注意力机制对输入的图像进行特征提取;S3、对于提取到的图像特征进行跨层连接,并且输出联合单变量特征图像;S4、对于输出联合单变量特征图像进行增强恢复;S5、在多尺度策略目标检测网络中将增强恢复后的图像进行特征融合以及扩大感受野;S6、对于特征融合以及扩大感受野的图像进行池化操作。本发明能够有效地提升水下图像的质量和可视化效果,以及能够有效提高水下复杂背景下的目标检测精度。

    一种基于数据驱动建模技术的流固耦合数值模拟计算方法

    公开(公告)号:CN117993189A

    公开(公告)日:2024-05-07

    申请号:CN202410118315.X

    申请日:2024-01-29

    Abstract: 本发明提供一种基于数据驱动建模技术的流固耦合数值模拟计算方法,包括步骤:S101、获取流固耦合系统数据,对流固耦合系统数据进行预处理,获得预处理数据;S102、将预处理数据输入到SPOD算法中,进行特征提取,得到流固耦合系统的低维特征表示;S103、将低维特征表示输入至GAN模型中,通过GAN模型进行预测,生成高维的数值模拟结果;S104、对比数值模拟结果与试验或数值模拟结果的误差,对GAN模型进行优化,本发明可以有效降低流固耦合问题计算的数据维度,减少计算量,提高数值模拟效率,同时具有较好的鲁棒性和泛化性能。

    一种网络运维监控装置
    7.
    实用新型

    公开(公告)号:CN221151480U

    公开(公告)日:2024-06-14

    申请号:CN202322133796.5

    申请日:2023-08-09

    Abstract: 本实用新型公开了一种网络运维监控装置,包括安装板、防护壳、监控设备、多效散热组件、屏幕清理组件和角度调节组件,所述防护壳设于安装板的下方,且所述角度调节组件设于防护壳与安装板之间,所述监控设备滑动设于防护壳内,所述多效散热组件设于防护壳内,所述屏幕清理组件设于监控设备的镜头一侧上,所述防护壳与安装板之间铰接设有伸缩调节杆,所述防护壳的顶部设有固定组件。本实用新型属于监控设备技术领域,具体是提供了一种散热效果好,通过散热扇与开合设置的固定框,实现内部壳体的散热,且对监控设备的镜头具有自清洁功能,对监控设备的防护性好的网络运维监控装置。

Patent Agency Ranking