-
公开(公告)号:CN101739867A
公开(公告)日:2010-06-16
申请号:CN200810226673.3
申请日:2008-11-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明一种运用计算机对口语翻译质量进行评分的方法综合使用计算机语音识别、语音发音评估、文本翻译质量确认技术得到被测试人员的口语翻译质量,包含建立针对被测试发音人群特点的数据库,然后在此数据库基础上使用大词汇连续语音声学模型训练平台训练得到声学模型,然后对每个翻译题型收集对应的专家知识和翻译文本语料,以制成识别需要的语言模型、评分模型、标准调整模型;最后综合语音识别器的输出结果及语言学处理机制,输出被测试人员口语翻译质量的得分,并给出反馈意见。本发明机器评测的效果已经基本达到与专家打分接近的水平,同时还可以在评测过程中给出被测试人员发音、词汇使用、句型使用的一些意见,指导被测试人员矫正。
-
公开(公告)号:CN112905754B
公开(公告)日:2024-09-06
申请号:CN201911294260.3
申请日:2019-12-16
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/583 , G06N3/045 , G06N3/0499 , G06N3/044
Abstract: 本发明提供了一种基于人工智能的视觉对话方法、装置、电子设备及存储介质;方法包括:获取与图片对应的对话问题及对话历史;将所述图片和所述对话历史中的至少一个确定为通道信息;根据所述对话问题和所述通道信息,进行追踪处理和定位处理中的至少一种处理,得到对应的通道特征;根据所述通道特征,将所述图片、所述对话问题和所述对话历史进行融合处理,得到融合特征;根据所述融合特征进行预测处理,得到所述对话问题对应的对话答案。通过本发明,能够加深对话问题的多模态表示,提升得到的对话答案的准确性,提升视觉对话的精度。
-
公开(公告)号:CN101814131A
公开(公告)日:2010-08-25
申请号:CN200910078564.6
申请日:2009-02-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种增强模糊指纹保险箱安全性的方法,该方法包括以下步骤:A、根据指纹细节点的局部脊线方向信息,构造对应于每一个细节点的脊线采样点方向向量,并由该方向向量导出一个对应于每一个细节点的不变值;B、使用细节点不变值为形变函数的输入,得到指纹细节点的平移参数和旋转参数,继而得到形变后的指纹细节点模板;C、提取指纹奇异点邻域内的细节点拓扑结构信息作为用于配准的帮助信息;D、将形变后的细节点模板以及奇异点邻域拓扑结构信息存储到模糊保险箱中,在形变域内进行指纹模糊保险箱的编码和解码操作。
-
公开(公告)号:CN115083422B
公开(公告)日:2022-11-15
申请号:CN202210859678.X
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种语音溯源取证方法及装置、设备及存储介质,所述方法包括:本提取待测试语音的至少两种不同的声学特征;对提取的待测试语音的至少两种不同的声学特征进行融合,得到第一融合声学特征;基于预先训练的语音溯源取证模型,从所述第一融合声学特征中提取帧级别的算法指纹特征,对帧级别的算法指纹特征进行池化平均,根据池化平均得到的特征加权平均向量和加权标准差向量计算段级别的算法指纹特征,以基于段级别的算法指纹特征预测出待测试语音的生成算法;将预测出的待测试语音的生成算法作为语音溯源取证结果,通过提取算法指纹,不仅可以判断音频的真实性,而且可以进一步溯源取证,得到虚假音频的生成来源。
-
公开(公告)号:CN115083423A
公开(公告)日:2022-09-20
申请号:CN202210861979.6
申请日:2022-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种语音鉴别的数据处理方法和装置,涉及语音识别技术、人工智能和计算机技术领域,上述数据处理方法包括:获取待鉴别音频;对上述待鉴别音频进行特征提取,得到初始声学特征;对上述初始声学特征进行量化处理,得到量化声学特征;将上述量化声学特征输入至目标语音鉴别模型中进行处理,输出得到上述待鉴别音频的真伪结果,上述目标语音鉴别模型为参数预训练好且经过量化后的语音鉴别模型。在确保语音真伪鉴别准确率的基础上能够提升语音真伪鉴别的鉴别速度,提升数据处理的效率。
-
公开(公告)号:CN112905754A
公开(公告)日:2021-06-04
申请号:CN201911294260.3
申请日:2019-12-16
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/583 , G06N3/04
Abstract: 本发明提供了一种基于人工智能的视觉对话方法、装置、电子设备及存储介质;方法包括:获取与图片对应的对话问题及对话历史;将所述图片和所述对话历史中的至少一个确定为通道信息;根据所述对话问题和所述通道信息,进行追踪处理和定位处理中的至少一种处理,得到对应的通道特征;根据所述通道特征,将所述图片、所述对话问题和所述对话历史进行融合处理,得到融合特征;根据所述融合特征进行预测处理,得到所述对话问题对应的对话答案。通过本发明,能够加深对话问题的多模态表示,提升得到的对话答案的准确性,提升视觉对话的精度。
-
公开(公告)号:CN101814131B
公开(公告)日:2012-08-22
申请号:CN200910078564.6
申请日:2009-02-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种增强模糊指纹保险箱安全性的方法,该方法包括以下步骤:A、根据指纹细节点的局部脊线方向信息,构造对应于每一个细节点的脊线采样点方向向量,并由该方向向量导出一个对应于每一个细节点的不变值;B、使用细节点不变值为形变函数的输入,得到指纹细节点的平移参数和旋转参数,继而得到形变后的指纹细节点模板;C、提取指纹奇异点邻域内的细节点拓扑结构信息作为用于配准的帮助信息;D、将形变后的细节点模板以及奇异点邻域拓扑结构信息存储到模糊保险箱中,在形变域内进行指纹模糊保险箱的编码和解码操作。
-
公开(公告)号:CN101739867B
公开(公告)日:2012-03-28
申请号:CN200810226673.3
申请日:2008-11-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明一种运用计算机对口语翻译质量进行评分的方法综合使用计算机语音识别、语音发音评估、文本翻译质量确认技术得到被测试人员的口语翻译质量,包含建立针对被测试发音人群特点的数据库,然后在此数据库基础上使用大词汇连续语音声学模型训练平台训练得到声学模型,然后对每个翻译题型收集对应的专家知识和翻译文本语料,以制成识别需要的语言模型、评分模型、标准调整模型;最后综合语音识别器的输出结果及语言学处理机制,输出被测试人员口语翻译质量的得分,并给出反馈意见。本发明机器评测的效果已经基本达到与专家打分接近的水平,同时还可以在评测过程中给出被测试人员发音、词汇使用、句型使用的一些意见,指导被测试人员矫正。
-
公开(公告)号:CN102324229A
公开(公告)日:2012-01-18
申请号:CN201110265473.0
申请日:2011-09-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种语音输入设备使用异常的检测方法及系统。本发明采用对远讲语音信号表征更全面、更趋近于人感知的特征提取方式,从而可以粗略的判断背景语音,正常语音和远讲语音。在音频信号分类的基础上,采用现代信号处理技术和统计机器学习理论相结合的方法,克服了传统方法对前端语音输入的诸多限制问题,使得信号级质量评分更趋近于人的评分。本发明解决了在大规模口语测试中,由于人为设备使用错误而导致的前端输入语音质量差异问题。
-
公开(公告)号:CN101727903A
公开(公告)日:2010-06-09
申请号:CN200810225406.4
申请日:2008-10-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于多特征和多系统融合的发音质量评估和错误检测方法,利用多种特征参数描述发音质量并使用多种评检系统相互融合的方法对发音质量进行评估和错误检测,包括以下步骤:语音识别及其自动切分对齐;提取用于发音质量评估和检错的特征参数;获取发音质量评估和检错模型训练数据;训练多个发音质量评估和检错系统;多个发音质量评估和检错系统的融合;以及对发音质量进行评估和对发音错误进行检测。利用本发明,有效地利用了多种语音特征,充分使用了多种评估和检测系统并进行信息融合,从而在最大程度上发挥了各种特征和系统的优势,保证了发音评估和检错的准确性和可靠性。
-
-
-
-
-
-
-
-
-