-
公开(公告)号:CN112684999A
公开(公告)日:2021-04-20
申请号:CN202011538558.7
申请日:2020-12-23
Applicant: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
Abstract: 本发明提供一种跟读模式语音采集方法、系统、设备和存储介质。该方法包括:步骤1:录入被采集人员的身份信息;步骤2:在本地跟读模板库中选择跟读模板,调用跟读模板界面,在所述界面上播放跟读语音内容并展示跟读语音波形和跟读字幕,以供被采集人员通过头戴式耳机收听所述跟读语音内容并进行跟读;步骤3:实时接收USB拾音器发送的被采集人员的跟读语音信息,检测所述跟读语音信息的语音质量和语音时长是否符合要求,若符合要求,则保存所述被采集人员的身份信息和跟读语音信息。本发明旨在解决特殊情况下(例如遇到被采集人员不识字的情况)的语音采集问题。
-
公开(公告)号:CN109545201A
公开(公告)日:2019-03-29
申请号:CN201811537321.X
申请日:2018-12-15
Applicant: 中国人民解放军战略支援部队信息工程大学
IPC: G10L15/14
Abstract: 本发明涉及语音识别技术领域,公开基于深层混合因子分析的声学模型的构建方法,包括:利用训练数据,采用HMM-GMM模型生成基线系统;根据HMM-GMM模型参数,对DMFA模型进行初始化,DMFA模型由两层MFA模型组成,采用GMM聚类和概率主成分分析方法初始化DMFA模型参数;利用训练数据,通过HMM-GMM模型的基线系统,采用贪婪EM算法估计声学特征空间的DMFA模型的整体模型参数;估计DMFA模型的第一层MFA模型的状态模型参数,所述状态模型参数包括状态相关参数及状态无关参数;估计DMFA模型的第二层MFA模型的状态模型参数。本发明将深层混合因子分析模型引入到状态模型的建模过程中,提出了基于深层混合因子分析的声学模型,具备更好的抗过拟合能力。
-
公开(公告)号:CN109545201B
公开(公告)日:2023-06-06
申请号:CN201811537321.X
申请日:2018-12-15
Applicant: 中国人民解放军战略支援部队信息工程大学
IPC: G10L15/14
Abstract: 本发明涉及语音识别技术领域,公开基于深层混合因子分析的声学模型的构建方法,包括:利用训练数据,采用HMM‑GMM模型生成基线系统;根据HMM‑GMM模型参数,对DMFA模型进行初始化,DMFA模型由两层MFA模型组成,采用GMM聚类和概率主成分分析方法初始化DMFA模型参数;利用训练数据,通过HMM‑GMM模型的基线系统,采用贪婪EM算法估计声学特征空间的DMFA模型的整体模型参数;估计DMFA模型的第一层MFA模型的状态模型参数,所述状态模型参数包括状态相关参数及状态无关参数;估计DMFA模型的第二层MFA模型的状态模型参数。本发明将深层混合因子分析模型引入到状态模型的建模过程中,提出了基于深层混合因子分析的声学模型,具备更好的抗过拟合能力。
-
公开(公告)号:CN306531764S
公开(公告)日:2021-05-11
申请号:CN202030648405.2
申请日:2020-10-29
Applicant: 郑州信大先进技术研究院
Abstract: 1.本外观设计产品的名称:电脑的声纹采集终端系统图形用户界面。
2.本外观设计产品的用途:用于运行软件、显示信息、存储文件。
3.本外观设计产品的设计要点:在于电脑中的图形用户界面。
4.最能表明设计要点的图片或照片:主视图。
5.无设计要点,省略后视图;无设计要点,省略左视图;无设计要点,省略右视图;无设计要点,省略俯视图;无设计要点,省略仰视图。
6.图形用户界面的用途:集目标人员的高保真语音信息。
7.图形用户界面在产品中的区域:图形用户界面。
8.图形用户界面的人机交互方式:主视图为本外观设计的图形操作页面,变化状态图1为授权用户在主视图中输入账号、密码、验证码登录系统后的初始化页面;变化状态图2为在变化状态图1填写人员基本信息后点击“开始采集”按钮并“结束采集”后的图形界面;变化状态图3为点击变化状态图1中“采集查询”按钮后的图形界面;变化状态图4为双击变化状态图3中具体人员信息后的图形界面;变化状态图5为点击变化状态图1中“设备注册”按钮后呈现语音采集设备注册情况的图形界面;变化状态图6为点击变化状态图1中“系统管理”按钮后呈现图形界面。
9.图形用户界面的变化状态说明:主视图为本外观设计的图形操作页面,变化状态图1为授权用户在主视图中输入账号、密码、验证码登录系统后的初始化页面;变化状态图2为在变化状态图1填写人员基本信息后点击“开始采集”按钮并“结束采集”后的图形界面;变化状态图3为点击变化状态图1中“采集查询”按钮后的图形界面;变化状态图4为双击变化状态图3中具体人员信息后的图形界面;变化状态图5为点击变化状态图1中“设备注册”按钮后呈现语音采集设备注册情况的图形界面;变化状态图6为点击变化状态图1中“系统管理”按钮后呈现图形界面。-
公开(公告)号:CN306713001S
公开(公告)日:2021-07-27
申请号:CN202030648404.8
申请日:2020-10-29
Applicant: 郑州信大先进技术研究院
Abstract: 1.本外观设计产品的名称:电脑的智能机器翻译软件系统图形用户界面。
2.本外观设计产品的用途:用于运行软件、显示信息、存储文件。
3.本外观设计产品的设计要点:在于图形用户界面。
4.最能表明设计要点的图片或照片:主视图。
5.无设计要点,省略左视图;无设计要点,省略右视图;无设计要点,省略后视图;无设计要点,省略俯视图;无设计要点,省略仰视图。
6.图形用户界面的用途:将一种源语言文本内容翻译成另一种目标语言文本内容。
7.图形用户界面在产品中的区域:图形用户界面。
8.图形用户界面的人机交互方式:主视图为本外观设计的图形操作页面,变化状态图1为授权用户在主视图中输入账号、密码、验证码登录系统后的初始化页面;变化状态图2为点击状态变化图1中“文件翻译”按钮后的图形界面;变化状态图3为点击变化状态图2中“即时翻译”按钮并输入内容翻译后的图形界面;变化状态图4为点击变化状态图2“结果查询”按钮后的图形界面;变化状态图5为点击变化状态图4“任务详情”后的图形界面;变化状态图6为点击变化状态图5“详情”后的图形界面;变化状态图7为点击变化状态图1“系统管理”按钮后的图形界面;变化状态图8为点击变化状态图7中“模型训练”按钮后的图形界面。
9.图形用户界面的变化状态说明:主视图为本外观设计的图形操作页面,变化状态图1为授权用户在主视图中输入账号、密码、验证码登录系统后的初始化页面;变化状态图2为点击状态变化图1中“文件翻译”按钮后的图形界面;变化状态图3为点击变化状态图2中“即时翻译”按钮并输入内容翻译后的图形界面;变化状态图4为点击变化状态图2“结果查询”按钮后的图形界面;变化状态图5为点击变化状态图4“任务详情”后的图形界面;变化状态图6为点击变化状态图5“详情”后的图形界面;变化状态图7为点击变化状态图1“系统管理”按钮后的图形界面;变化状态图8为点击变化状态图7中“模型训练”按钮后的图形界面。
-
-
-
-