-
公开(公告)号:CN101777115A
公开(公告)日:2010-07-14
申请号:CN200910241541.2
申请日:2009-11-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种安全的指纹认证方法及系统,利用图像采集单元、认证特征提取单元、辅助特征提取单元、模板加密单元、模板存储单元、配准参数计算单元和模板解密单元等构建安全的指纹认证系统。提出的方法和系统以模糊保险箱方法为基本框架;采用指纹细节点的位置及其与邻近三个细节点之间的脊线条数为认证特征;并且提取指纹中稳定的参考点,及其周围特定邻域的分块方向场信息作为辅助特征,使用基于方向场互信息的方法来评价指纹配准的叠合程度,并且采用从粗到细的搜索策略寻找最优的参数,即为模板指纹和查询指纹的配准参数。利用配准参数对查询指纹特征进行变换,使用变换后的查询指纹认证特征对模板指纹进行解密和认证操作。
-
公开(公告)号:CN101740024A
公开(公告)日:2010-06-16
申请号:CN200810226672.9
申请日:2008-11-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明为基于广义流利的口语流利度自动化评估方法,包括:利用语音输入设备,分不同年龄和口语水平收集语音数据;采用基于广义流利度的特征和机器学习训练流利度评测模型;根据语音数据不同话题的脚本和发音者的性别,配置相应参数的语音识别系统;利用对语音数据中语速连贯、内容理解、高级技巧和重构标特征进行量化,从专家评估角度综合提取语音数据中流利度的特征;采用回归拟合分析和数据挖掘中的决策树方法对异常流利度错误的检测和流利度评分、诊断。得到的机器流利度分数可以达到与评分专家接近的水平,在相关度指标上超过一般5个专家中的2-3个;速度快,可以嵌入到口语自动化评分系统中,作为重要模块评测发音质量中流利度指标。
-
公开(公告)号:CN101739867A
公开(公告)日:2010-06-16
申请号:CN200810226673.3
申请日:2008-11-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明一种运用计算机对口语翻译质量进行评分的方法综合使用计算机语音识别、语音发音评估、文本翻译质量确认技术得到被测试人员的口语翻译质量,包含建立针对被测试发音人群特点的数据库,然后在此数据库基础上使用大词汇连续语音声学模型训练平台训练得到声学模型,然后对每个翻译题型收集对应的专家知识和翻译文本语料,以制成识别需要的语言模型、评分模型、标准调整模型;最后综合语音识别器的输出结果及语言学处理机制,输出被测试人员口语翻译质量的得分,并给出反馈意见。本发明机器评测的效果已经基本达到与专家打分接近的水平,同时还可以在评测过程中给出被测试人员发音、词汇使用、句型使用的一些意见,指导被测试人员矫正。
-
公开(公告)号:CN112905754A
公开(公告)日:2021-06-04
申请号:CN201911294260.3
申请日:2019-12-16
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/583 , G06N3/04
Abstract: 本发明提供了一种基于人工智能的视觉对话方法、装置、电子设备及存储介质;方法包括:获取与图片对应的对话问题及对话历史;将所述图片和所述对话历史中的至少一个确定为通道信息;根据所述对话问题和所述通道信息,进行追踪处理和定位处理中的至少一种处理,得到对应的通道特征;根据所述通道特征,将所述图片、所述对话问题和所述对话历史进行融合处理,得到融合特征;根据所述融合特征进行预测处理,得到所述对话问题对应的对话答案。通过本发明,能够加深对话问题的多模态表示,提升得到的对话答案的准确性,提升视觉对话的精度。
-
公开(公告)号:CN101814131B
公开(公告)日:2012-08-22
申请号:CN200910078564.6
申请日:2009-02-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种增强模糊指纹保险箱安全性的方法,该方法包括以下步骤:A、根据指纹细节点的局部脊线方向信息,构造对应于每一个细节点的脊线采样点方向向量,并由该方向向量导出一个对应于每一个细节点的不变值;B、使用细节点不变值为形变函数的输入,得到指纹细节点的平移参数和旋转参数,继而得到形变后的指纹细节点模板;C、提取指纹奇异点邻域内的细节点拓扑结构信息作为用于配准的帮助信息;D、将形变后的细节点模板以及奇异点邻域拓扑结构信息存储到模糊保险箱中,在形变域内进行指纹模糊保险箱的编码和解码操作。
-
公开(公告)号:CN101739867B
公开(公告)日:2012-03-28
申请号:CN200810226673.3
申请日:2008-11-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明一种运用计算机对口语翻译质量进行评分的方法综合使用计算机语音识别、语音发音评估、文本翻译质量确认技术得到被测试人员的口语翻译质量,包含建立针对被测试发音人群特点的数据库,然后在此数据库基础上使用大词汇连续语音声学模型训练平台训练得到声学模型,然后对每个翻译题型收集对应的专家知识和翻译文本语料,以制成识别需要的语言模型、评分模型、标准调整模型;最后综合语音识别器的输出结果及语言学处理机制,输出被测试人员口语翻译质量的得分,并给出反馈意见。本发明机器评测的效果已经基本达到与专家打分接近的水平,同时还可以在评测过程中给出被测试人员发音、词汇使用、句型使用的一些意见,指导被测试人员矫正。
-
公开(公告)号:CN102324229A
公开(公告)日:2012-01-18
申请号:CN201110265473.0
申请日:2011-09-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种语音输入设备使用异常的检测方法及系统。本发明采用对远讲语音信号表征更全面、更趋近于人感知的特征提取方式,从而可以粗略的判断背景语音,正常语音和远讲语音。在音频信号分类的基础上,采用现代信号处理技术和统计机器学习理论相结合的方法,克服了传统方法对前端语音输入的诸多限制问题,使得信号级质量评分更趋近于人的评分。本发明解决了在大规模口语测试中,由于人为设备使用错误而导致的前端输入语音质量差异问题。
-
公开(公告)号:CN101727903A
公开(公告)日:2010-06-09
申请号:CN200810225406.4
申请日:2008-10-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于多特征和多系统融合的发音质量评估和错误检测方法,利用多种特征参数描述发音质量并使用多种评检系统相互融合的方法对发音质量进行评估和错误检测,包括以下步骤:语音识别及其自动切分对齐;提取用于发音质量评估和检错的特征参数;获取发音质量评估和检错模型训练数据;训练多个发音质量评估和检错系统;多个发音质量评估和检错系统的融合;以及对发音质量进行评估和对发音错误进行检测。利用本发明,有效地利用了多种语音特征,充分使用了多种评估和检测系统并进行信息融合,从而在最大程度上发挥了各种特征和系统的优势,保证了发音评估和检错的准确性和可靠性。
-
公开(公告)号:CN112905754B
公开(公告)日:2024-09-06
申请号:CN201911294260.3
申请日:2019-12-16
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/583 , G06N3/045 , G06N3/0499 , G06N3/044
Abstract: 本发明提供了一种基于人工智能的视觉对话方法、装置、电子设备及存储介质;方法包括:获取与图片对应的对话问题及对话历史;将所述图片和所述对话历史中的至少一个确定为通道信息;根据所述对话问题和所述通道信息,进行追踪处理和定位处理中的至少一种处理,得到对应的通道特征;根据所述通道特征,将所述图片、所述对话问题和所述对话历史进行融合处理,得到融合特征;根据所述融合特征进行预测处理,得到所述对话问题对应的对话答案。通过本发明,能够加深对话问题的多模态表示,提升得到的对话答案的准确性,提升视觉对话的精度。
-
公开(公告)号:CN101814131A
公开(公告)日:2010-08-25
申请号:CN200910078564.6
申请日:2009-02-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种增强模糊指纹保险箱安全性的方法,该方法包括以下步骤:A、根据指纹细节点的局部脊线方向信息,构造对应于每一个细节点的脊线采样点方向向量,并由该方向向量导出一个对应于每一个细节点的不变值;B、使用细节点不变值为形变函数的输入,得到指纹细节点的平移参数和旋转参数,继而得到形变后的指纹细节点模板;C、提取指纹奇异点邻域内的细节点拓扑结构信息作为用于配准的帮助信息;D、将形变后的细节点模板以及奇异点邻域拓扑结构信息存储到模糊保险箱中,在形变域内进行指纹模糊保险箱的编码和解码操作。
-
-
-
-
-
-
-
-
-