-
公开(公告)号:CN111090981A
公开(公告)日:2020-05-01
申请号:CN201911241042.3
申请日:2019-12-06
Applicant: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
IPC: G06F40/191 , G06F40/211 , G06N3/04
Abstract: 本发明属于自然语言处理技术领域,公开一种基于双向长短时记忆网络的中文文本自动断句与标点生成模型构建方法及系统,该方法包括:将中文文本语料进行处理,去除无用符号,同时为每个字符添加设计好的标签;利用双向长短时记忆网络作为中文文本自动断句与标点生成模型的基准网络结构;采用对数似然损失函数,通过加入长句惩罚因子对对数似然损失函数进行改进,以最小化改进后的对数似然损失函数为目标,从正反两个方向对添加标签后的中文文本语料进行训练,完成中文文本自动断句与标点生成模型构建;该系统包括:语料处理模块、网络结构选择模块及模型构建与优化模块。本发明解决了语音转写文本中,无法自动断句以及标点符号缺失的问题。
-
公开(公告)号:CN109545201B
公开(公告)日:2023-06-06
申请号:CN201811537321.X
申请日:2018-12-15
Applicant: 中国人民解放军战略支援部队信息工程大学
IPC: G10L15/14
Abstract: 本发明涉及语音识别技术领域,公开基于深层混合因子分析的声学模型的构建方法,包括:利用训练数据,采用HMM‑GMM模型生成基线系统;根据HMM‑GMM模型参数,对DMFA模型进行初始化,DMFA模型由两层MFA模型组成,采用GMM聚类和概率主成分分析方法初始化DMFA模型参数;利用训练数据,通过HMM‑GMM模型的基线系统,采用贪婪EM算法估计声学特征空间的DMFA模型的整体模型参数;估计DMFA模型的第一层MFA模型的状态模型参数,所述状态模型参数包括状态相关参数及状态无关参数;估计DMFA模型的第二层MFA模型的状态模型参数。本发明将深层混合因子分析模型引入到状态模型的建模过程中,提出了基于深层混合因子分析的声学模型,具备更好的抗过拟合能力。
-
公开(公告)号:CN116011469A
公开(公告)日:2023-04-25
申请号:CN202211519654.6
申请日:2022-11-30
Applicant: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
Abstract: 本发明属于机器翻译处理技术领域,特别涉及一种离线机器翻译程序加速处理装置、方法及系统,利用与用户端主机Thunderbolt接口连接的GPU扩展坞接收用户端主机传送的计算参数,并依据计算参数来执行离线机器翻译程序中的模型计算;并利用与用户端主机USB接口连接的USB存储设备来预置固化离线机器翻译程序、依赖类库和模型。本发明将机器翻译系统中的模型计算部分从CPU转移至外接的GPU设备,利用USB接口外接存储设备,将翻译程序依赖的模型、类库和执行步骤固化,能够实现整个离线机器翻译程序的高效、便捷部署安装,机器翻译执行和处理效率可以成倍的提升,且根据实际应用可适合扩展到其他需要大量计算的系统中,具有较好的应用前景。
-
公开(公告)号:CN111090981B
公开(公告)日:2022-04-15
申请号:CN201911241042.3
申请日:2019-12-06
Applicant: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
IPC: G06F40/191 , G06F40/211 , G06N3/04
Abstract: 本发明属于自然语言处理技术领域,公开一种基于双向长短时记忆网络的中文文本自动断句与标点生成模型构建方法及系统,该方法包括:将中文文本语料进行处理,去除无用符号,同时为每个字符添加设计好的标签;利用双向长短时记忆网络作为中文文本自动断句与标点生成模型的基准网络结构;采用对数似然损失函数,通过加入长句惩罚因子对对数似然损失函数进行改进,以最小化改进后的对数似然损失函数为目标,从正反两个方向对添加标签后的中文文本语料进行训练,完成中文文本自动断句与标点生成模型构建;该系统包括:语料处理模块、网络结构选择模块及模型构建与优化模块。本发明解决了语音转写文本中,无法自动断句以及标点符号缺失的问题。
-
公开(公告)号:CN113505611A
公开(公告)日:2021-10-15
申请号:CN202110780410.2
申请日:2021-07-09
Applicant: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
Abstract: 本发明提供一种在生成对抗中获得更好的语音翻译模型的训练方法和系统。该方法包括收集训练数据,利用训练数据中的转录‑翻译数据对训练MT模型;利用收缩机制对ST模型的输入长度进行压缩,使得语音和文本的编码层输出长度近似相同,包括:先采用CTC损失帮助ST模型预测语音的转录,捕捉语音的声学信息;然后利用CTC存在的峰值现象去除ST模型编码层状态中的冗余信息;采用对抗器通过“最大最小”的方法,使ST模型的编码层输出分布拟合MT模型的编码层输出分布,帮助ST模型捕捉到更多的语义信息;以CTC损失作为附加损失,结合端到端ST模型的损失对整个语音翻译模型进行联合训练。本发明能提升语音翻译模型的识别性能,进而提高语音翻译效率和质量。
-
公开(公告)号:CN108769576B
公开(公告)日:2021-02-02
申请号:CN201810443112.2
申请日:2018-05-10
Applicant: 郑州信大先进技术研究院 , 中国人民解放军战略支援部队信息工程大学
Abstract: 本发明提供一种智能视频处理方法和系统,具体包括视频监控终端、多个远端机、多个近端机以及云端服务器,本发明从视频监控终端获取监控视频数据,将监控视频数据和当前位置信息、时间信息组合成多维视频帧保存在远端机中,同时从监控视频数据中提取出特征数据并与当前位置信息、时间信息组合成多维特征帧,将多维视频帧与多维特征帧关联并将多维特征帧发送到近端机;近端机将多维特征帧汇聚到云端服务器,以实现特定对象(人员、车辆)的追踪分析。本发明适用于已部署传统视频监控系统但智能化改造难度较大的场景,在不改变现有的视频监控系统部署架构的基础上,实现智能监控的功能,且有效降低了工程改造量和建设成本。
-
公开(公告)号:CN108630199A
公开(公告)日:2018-10-09
申请号:CN201810702540.2
申请日:2018-06-30
Applicant: 中国人民解放军战略支援部队信息工程大学
Abstract: 本发明提供一种声学模型的数据处理方法。该声学模型包括编码网络、注意力网络和解码网络,数据处理方法包括:步骤1、编码网络对语音特征序列(x1,x2,...,xT)进行编码得到高层特征序列(h1,h2,...,hT),xT表示待识别语音经过语音特征提取预处理后在T时刻的语音特征,hT表示所述语音特征xT在T时刻的高层特征;步骤2、注意力网络根据高层特征序列(h1,h2,...,hT)计算目标向量,目标向量用于对所述高层特征序列(h1,h2,...,hT)进行压缩;步骤3、解码网络根据高层特征序列(h1,h2,...,hT)和目标向量计算待识别语音每个位置上所有音素的后验概率以得到概率序列(y1,y2,...,yO),yO表示待识别语音经解码网络输出后在位置o上所有音素的后验概率。本发明能够减少参数训练规模,提升训练速度以及提升音素和语音特征对齐的准确度。
-
公开(公告)号:CN111046962B
公开(公告)日:2022-10-04
申请号:CN201911300222.4
申请日:2019-12-16
Applicant: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
IPC: G06V10/764 , G06V10/56 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于稀疏注意力的卷积神经网络模型的特征可视化方法及系统,该方法包括:对输入彩色图像进行特征提取,输出多通道特征图;使用像素级注意力对特征图进行加权调整;采用交叉熵损失函数作为分类损失函数,对像素级注意力进行L1正则化约束,并对分类损失函数进行改进,对加权调整后的特征图进行训练,得出分类结果;将调整后的特征图与原始输入的彩色图像进行叠加,得出彩色图像重要特征的可视化展示,从而给出对分类结果的可视化解释;该系统包括特征提取模块、注意力模块、分类模块及特征可视化模块。本发明提升图像分类准确率的同时,采用特征可视化展示出该图像最重要的特征区域。
-
公开(公告)号:CN113505610B
公开(公告)日:2022-05-06
申请号:CN202110779788.0
申请日:2021-07-09
Applicant: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
Abstract: 本发明公开一种基于模型增强的语音翻译模型训练方法、系统及语音翻译方法和设备,该训练方法包括:收集语音翻译数据集,所述语音翻译数据集由多个语音‑翻译‑转录三元组构成;利用语音翻译数据集中的语音‑转录数据对训练语音识别模型,利用语音翻译数据集中的转录‑翻译数据对训练机器翻译模型;用语音识别模型初始化语音翻译模型的编码层,用机器翻译模型初始化语音翻译模型的解码层;对语音翻译模型的隐含层输出进行掩码,利用语音翻译数据集、结合损失函数对语音翻译模型进行训练;语音翻译模型训练好后,去掉掩码,对训练好的语音翻译模型进行微调。本发明提升了语音翻译模型的识别性能,可以有效提高语音翻译效率和质量。
-
公开(公告)号:CN113505610A
公开(公告)日:2021-10-15
申请号:CN202110779788.0
申请日:2021-07-09
Applicant: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
Abstract: 本发明公开一种基于模型增强的语音翻译模型训练方法、系统及语音翻译方法和设备,该训练方法包括:收集语音翻译数据集,所述语音翻译数据集由多个语音‑翻译‑转录三元组构成;利用语音翻译数据集中的语音‑转录数据对训练语音识别模型,利用语音翻译数据集中的转录‑翻译数据对训练机器翻译模型;用语音识别模型初始化语音翻译模型的编码层,用机器翻译模型初始化语音翻译模型的解码层;对语音翻译模型的隐含层输出进行掩码,利用语音翻译数据集、结合损失函数对语音翻译模型进行训练;语音翻译模型训练好后,去掉掩码,对训练好的语音翻译模型进行微调。本发明提升了语音翻译模型的识别性能,可以有效提高语音翻译效率和质量。
-
-
-
-
-
-
-
-
-