-
公开(公告)号:CN107808661A
公开(公告)日:2018-03-16
申请号:CN201710995917.3
申请日:2017-10-23
Applicant: 中央民族大学
CPC classification number: G10L15/063 , G06K9/6256 , G06K9/6267 , G06N7/005 , G10L15/144 , G10L2015/0631
Abstract: 本发明公开了一种基于协作式批量主动学习的藏语语音语料标注方法及系统,其中系统包括:样本选择模块,手工标注模块,标注决策模块,标注者评估模块,训练集生成模块。本发明通过临近最优批量样本选择方法解决样本评价函数的构造及其submodular函数性质的证明,通过标注委员会协作标注方法,解决标注决策函数的构造、标注者评估模型和标注者辅助学习模型的建模。此外,本发明的系统能够实现样本的优化选择、用户的标注评估、标注信息和藏语语音知识的共享、标注者辅助学习等功能,拟提高藏语语音数据的标注质量,加快语音语料建设。
-
公开(公告)号:CN109040407A
公开(公告)日:2018-12-18
申请号:CN201810779683.3
申请日:2018-07-16
Applicant: 中央民族大学
Abstract: 本申请公开了一种基于移动终端的语音采集方法及装置。该方法包括:接收用户的文件选择指令,向用户展示对应的第一文字信息;接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作;采用接收用户的文件选择指令,向用户展示对应的第一文字信息的方式,通过接收用户的录音操作指令,生成录音文件并执行对应的文件处理操作,达到了准确、高效采集语音的目的,进而解决了相关技术中语音采集效率低下的问题。
-
公开(公告)号:CN107808661B
公开(公告)日:2020-12-11
申请号:CN201710995917.3
申请日:2017-10-23
Applicant: 中央民族大学
Abstract: 本发明公开了一种基于协作式批量主动学习的藏语语音语料标注方法及系统,其中系统包括:样本选择模块,手工标注模块,标注决策模块,标注者评估模块,训练集生成模块。本发明通过临近最优批量样本选择方法解决样本评价函数的构造及其submodular函数性质的证明,通过标注委员会协作标注方法,解决标注决策函数的构造、标注者评估模型和标注者辅助学习模型的建模。此外,本发明的系统能够实现样本的优化选择、用户的标注评估、标注信息和藏语语音知识的共享、标注者辅助学习等功能,拟提高藏语语音数据的标注质量,加快语音语料建设。
-
公开(公告)号:CN109036387A
公开(公告)日:2018-12-18
申请号:CN201810779665.5
申请日:2018-07-16
Applicant: 中央民族大学
IPC: G10L15/06
CPC classification number: G10L15/063
Abstract: 本申请公开了一种视频语音识别方法及系统。该方法包括:对所述音频信息进行特征提取,得到所述音频信息的第一特征向量;根据所述第一特征向量对语音识别模型进行模型训练,得到训练后的所述第一语音识别模型;根据所述第一语音识别模型对所述音频信息进行语音识别,得到第一语音识别结果;采用对所述音频信息进行特征提取,得到所述音频信息的第一特征向量的方式,通过对语音识别模型进行模型训练,得到训练后的所述第一语音识别模型,达到了根据所述第一语音识别模型对所述音频信息进行语音识别,得到第一语音识别结果的目的,进而解决了相关技术中对视频中的语音不能及时识别和处理的问题。
-
-
-