-
公开(公告)号:CN115083423B
公开(公告)日:2022-11-15
申请号:CN202210861979.6
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种语音鉴别的数据处理方法和装置,涉及语音识别技术、人工智能和计算机技术领域,上述数据处理方法包括:获取待鉴别音频;对上述待鉴别音频进行特征提取,得到初始声学特征;对上述初始声学特征进行量化处理,得到量化声学特征;将上述量化声学特征输入至目标语音鉴别模型中进行处理,输出得到上述待鉴别音频的真伪结果,上述目标语音鉴别模型为参数预训练好且经过量化后的语音鉴别模型。在确保语音真伪鉴别准确率的基础上能够提升语音真伪鉴别的鉴别速度,提升数据处理的效率。
-
公开(公告)号:CN115083421B
公开(公告)日:2022-11-15
申请号:CN202210859650.6
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种自动寻参的语音鉴别模型的构建方法及装置,能自动调整超参数至最优,该方法包括:获取训练集中的语音数据;基于预训练语音特征提取模型,对语音数据进行特征提取,得到语音特征;将语音特征输入至轻量化可微结构并作为初始节点,根据搜索空间预定义的候选操作进行网络结构搜索,得到包含所有候选分支路径和候选节点的候选网络结构;其中候选操作表征从前一节点到后一节点的网络连接关系;将语音数据为真伪语音的真实结果作为训练标签,在训练过程中对候选网络结构的节点之间候选操作对应的结构权重进行调整;根据训练完成的结构权重,对候选网络结构进行精简,得到目标网络结构;根据目标网络结构,生成语音鉴别模型。
-
公开(公告)号:CN102354495B
公开(公告)日:2012-11-14
申请号:CN201110254211.4
申请日:2011-08-31
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供了一种半开放式口语试题的测试方法及系统,从关键内容检测和文本无关评估技术入手,跳过了对语音识别的依赖,实现了对半开放口语试题的全自动评分。本发明提出把口语语音的评估分成内容、发音、流利、韵律四个部分,为口语评估工作奠定了基础。
-
公开(公告)号:CN114937455B
公开(公告)日:2022-10-11
申请号:CN202210861977.7
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L17/04 , G10L15/187 , G10L17/02 , G10L17/14 , G06K9/62
Abstract: 本公开涉及一种语音检测方法及装置、设备及存储介质,所述方法包括:接收待检测语音,根据待检测语音的编码状态序列中每一个编码状态向量及其对应的权重值确定语义声学特征;将待检测语音输入预先训练好的语音检测模型,将所述语音检测模型的隐藏层的输出作为语音声学特征;拼接所述语义声学特征和所述语音声学特征,并将拼接后的声学特征输入所述语音检测模型的输出层,输出待检测语音是真实的还是伪造的检测结果,结合待检测语音的语义声学特征检测语音的真伪,通过语义声学特征中待检测语音的编码状态向量与解码状态向量之间的相关性,能够结合待检测语音的上下文之间的相关性检测语音的真伪,提高检测的准确性。
-
公开(公告)号:CN115083421A
公开(公告)日:2022-09-20
申请号:CN202210859650.6
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种自动寻参的语音鉴别模型的构建方法及装置,能自动调整超参数至最优,该方法包括:获取训练集中的语音数据;基于预训练语音特征提取模型,对语音数据进行特征提取,得到语音特征;将语音特征输入至轻量化可微结构并作为初始节点,根据搜索空间预定义的候选操作进行网络结构搜索,得到包含所有候选分支路径和候选节点的候选网络结构;其中候选操作表征从前一节点到后一节点的网络连接关系;将语音数据为真伪语音的真实结果作为训练标签,在训练过程中对候选网络结构的节点之间候选操作对应的结构权重进行调整;根据训练完成的结构权重,对候选网络结构进行精简,得到目标网络结构;根据目标网络结构,生成语音鉴别模型。
-
公开(公告)号:CN114937455A
公开(公告)日:2022-08-23
申请号:CN202210861977.7
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L17/04 , G10L15/187 , G10L17/02 , G10L17/14 , G06K9/62
Abstract: 本公开涉及一种语音检测方法及装置、设备及存储介质,所述方法包括:接收待检测语音,根据待检测语音的编码状态序列中每一个编码状态向量及其对应的权重值确定语义声学特征;将待检测语音输入预先训练好的语音检测模型,将所述语音检测模型的隐藏层的输出作为语音声学特征;拼接所述语义声学特征和所述语音声学特征,并将拼接后的声学特征输入所述语音检测模型的输出层,输出待检测语音是真实的还是伪造的检测结果,结合待检测语音的语义声学特征检测语音的真伪,通过语义声学特征中待检测语音的编码状态向量与解码状态向量之间的相关性,能够结合待检测语音的上下文之间的相关性检测语音的真伪,提高检测的准确性。
-
公开(公告)号:CN102324229B
公开(公告)日:2012-11-28
申请号:CN201110265473.0
申请日:2011-09-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种语音输入设备使用异常的检测方法及系统。本发明采用对远讲语音信号表征更全面、更趋近于人感知的特征提取方式,从而可以粗略的判断背景语音,正常语音和远讲语音。在音频信号分类的基础上,采用现代信号处理技术和统计机器学习理论相结合的方法,克服了传统方法对前端语音输入的诸多限制问题,使得信号级质量评分更趋近于人的评分。本发明解决了在大规模口语测试中,由于人为设备使用错误而导致的前端输入语音质量差异问题。
-
公开(公告)号:CN102426834A
公开(公告)日:2012-04-25
申请号:CN201110252779.2
申请日:2011-08-30
Applicant: 中国科学院自动化研究所
IPC: G10L11/00
Abstract: 本发明公开了一种测试英文口语韵律水平的方法。该方法包括:步骤A,对原始英语语音信号进行预处理;步骤B,在进行预处理后的原始英语语音信号中提取用于韵律测试的多知识源特征参数,该多知识源特征参数包括韵律表现特征、韵律产生特征和韵律影响特征;步骤C,由多数多知识源特征参数获取所述原始英语语音的韵律水平测试分数。本发明测试英文口语韵律水平的方法,以使用多知识源信息进行细化并融合的策略取得更佳的测试效果,提高测试的客观性和准确性。
-
公开(公告)号:CN101740024B
公开(公告)日:2012-02-08
申请号:CN200810226672.9
申请日:2008-11-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明为基于广义流利的口语流利度自动化评估方法,包括:利用语音输入设备,分不同年龄和口语水平收集语音数据;采用基于广义流利度的特征和机器学习训练流利度评测模型;根据语音数据不同话题的脚本和发音者的性别,配置相应参数的语音识别系统;利用对语音数据中语速连贯、内容理解、高级技巧和重构标特征进行量化,从专家评估角度综合提取语音数据中流利度的特征;采用回归拟合分析和数据挖掘中的决策树方法对异常流利度错误的检测和流利度评分、诊断。得到的机器流利度分数可以达到与评分专家接近的水平,在相关度指标上超过一般5个专家中的2-3个;速度快,可以嵌入到口语自动化评分系统中,作为重要模块评测发音质量中流利度指标。
-
公开(公告)号:CN101826263B
公开(公告)日:2012-01-04
申请号:CN200910078868.2
申请日:2009-03-04
Applicant: 中国科学院自动化研究所
Abstract: 本发明为基于客观标准的自动化口语评估系统,包括识别对齐单元、量化评估单元和标准调整单元,识别对齐单元接收口语语音信息、答题范围和评估指标信息,对输入口语语音信息进行识别和对齐,将口语语音信息生成文字,并将文字和语音进行对齐;标准调整单元,是由考试组织机构根据具体考试对象、目标和要求进行量化评估标准调整,生成并输出最终的量化评估标准;量化评估单元分别与识别对齐单元和标准调整单元连接,量化评估单元接收评估量化指标信息、标准调整单元输出的量化评估标准信息和识别对齐单元输出的文字识别对齐信息,根据所述三个信息提取口语评估特征,进行自动化评估和诊断,生成评估结果和诊断报告信息。
-
-
-
-
-
-
-
-
-