语音输入设备使用异常的检测方法及系统

    公开(公告)号:CN102324229A

    公开(公告)日:2012-01-18

    申请号:CN201110265473.0

    申请日:2011-09-08

    Abstract: 本发明公开了一种语音输入设备使用异常的检测方法及系统。本发明采用对远讲语音信号表征更全面、更趋近于人感知的特征提取方式,从而可以粗略的判断背景语音,正常语音和远讲语音。在音频信号分类的基础上,采用现代信号处理技术和统计机器学习理论相结合的方法,克服了传统方法对前端语音输入的诸多限制问题,使得信号级质量评分更趋近于人的评分。本发明解决了在大规模口语测试中,由于人为设备使用错误而导致的前端输入语音质量差异问题。

    对多级透镜多视角场景的三维重建的方法

    公开(公告)号:CN101938668A

    公开(公告)日:2011-01-05

    申请号:CN201010278130.3

    申请日:2010-09-10

    Inventor: 黄向生 徐波

    Abstract: 本发明是一种对多级透镜多视角场景的三维重建的方法,通过多级透镜三维成像系统获取多视角二维图像,通过运用全息重建、立体视觉或是立体视觉和全息重建结合的方法对多视角的二维图像进行三维重建,得到场景中物体经过最后一级透镜所得的实像的深度信息,最后将得到的实像的深度信息沿着光线进入多级透镜三维成像系统的反方向,根据透镜的焦距、物距及像距之间的关系式逐级递推,从而获得场景中物体的三维信息。

    基于多特征和多系统融合的发音质量评估和错误检测方法

    公开(公告)号:CN101727903A

    公开(公告)日:2010-06-09

    申请号:CN200810225406.4

    申请日:2008-10-29

    Abstract: 本发明公开了一种基于多特征和多系统融合的发音质量评估和错误检测方法,利用多种特征参数描述发音质量并使用多种评检系统相互融合的方法对发音质量进行评估和错误检测,包括以下步骤:语音识别及其自动切分对齐;提取用于发音质量评估和检错的特征参数;获取发音质量评估和检错模型训练数据;训练多个发音质量评估和检错系统;多个发音质量评估和检错系统的融合;以及对发音质量进行评估和对发音错误进行检测。利用本发明,有效地利用了多种语音特征,充分使用了多种评估和检测系统并进行信息融合,从而在最大程度上发挥了各种特征和系统的优势,保证了发音评估和检错的准确性和可靠性。

    用于注射模塑成型机的自适应温度控制方法及其电路

    公开(公告)号:CN100423929C

    公开(公告)日:2008-10-08

    申请号:CN200510093317.5

    申请日:2005-08-25

    Abstract: 本发明涉及自适应温度控制技术领域,特别是一种用于注射模塑成型机的基于专家规则的自适应温度控制方法及其电路。整个系统由数据采集系统、规则库、知识库、自适应算法以及控制输出单元组成,具体如下:1)温度数据获取;2)专家规则库与知识库;3)参数自适应调整;4)控制输出。电路包括隔离输出电路(1)、达林顿驱动(2)、继电器输出(3)、过流保护电路(4)、输出滤波电路(5)、交流接触器输出(6)。该方法满足高精度注塑要求,稳定性和鲁棒性高,能够显著提高产品的正品率。

    一种语音识别结果纠错方法

    公开(公告)号:CN1979638A

    公开(公告)日:2007-06-13

    申请号:CN200510127447.6

    申请日:2005-12-02

    Abstract: 本发明涉及语音识别技术领域,特别是一种语音识别结果纠错方法。利用可纠错知识库对识别结果进行纠错的方法,该方法的最基本的特征,一是以语料库中的连续语言片段作为纠错模版,利用语料库建立纠错模版库;二是对纠错模版库建立索引,使用检索技术对纠错模版进行快速查找;三是依据纠错模式,利用置信度将识别结果切分成短的识别片段,并将识别片段中的可信赖部分提交的纠错模版系统进行快速查找,得到与识别片段相关性高的纠错模版候选;四是利用声学混淆度矩阵从纠错模版候选中挑选与识别片段声学特征相近的模版进行替换纠错。

    用于注射模塑成型机的自适应温度控制方法及其电路

    公开(公告)号:CN1919579A

    公开(公告)日:2007-02-28

    申请号:CN200510093317.5

    申请日:2005-08-25

    Abstract: 本发明涉及自适应温度控制技术领域,特别是一种用于注射模塑成型机的基于专家规则的自适应温度控制方法及其电路。整个系统由数据采集系统、规则库、知识库、自适应算法以及控制输出单元组成,具体如下:1)温度数据获取;2)专家规则库与知识库;3)参数自适应调整;4)控制输出。电路包括隔离输出电路(1)、达林顿驱动(2)、继电器输出(3)、过流保护电路(4)、输出滤波电路(5)、交流接触器输出(6)。该方法满足高精度注塑要求,稳定性和鲁棒性高,能够显著提高产品的正品率。

    基于子带能量和特征检测技术的语音信号端点检测方法

    公开(公告)号:CN1181466C

    公开(公告)日:2004-12-22

    申请号:CN01140334.9

    申请日:2001-12-17

    Abstract: 一种基于子带能量和特征检测技术的语音信号端点检测方法,包括步骤:确定频域子带带宽;计算子带能量;检测语音信号端点的能量变化特征;确定判决逻辑。本发明可用于自动语音识别和其他目的地自动语音处理中,以信号的频域子带能量为检测依据,并通过为语音信号边界的能量变化建立数学模型,用特征检测的方法检测语音的起始和终止端点。本发明可广泛应用于语音识别和语音信号处理领域。

    基于熵的端点检测方法
    39.
    发明公开

    公开(公告)号:CN1426048A

    公开(公告)日:2003-06-25

    申请号:CN01144156.9

    申请日:2001-12-13

    Inventor: 贾川 徐波

    Abstract: 一种基于熵的端点检测方法,包括步骤:1)计算信号开始时N1帧的能量E_noise;2)根据步骤1)得到的噪声估计值E_noise,指定相应的K值;3)使用步骤2)选定的K值,利用公式(4)、(3)计算每帧的负熵Entropy;4)以当前帧前面数帧的平均负熵值Mean+V1作为第一个门限Th1,以Mean+V2作为第一个门限Th2。不断推进当前帧,直到找到满足判决机制的帧作为语音的起始点;5)找到起始点后,将K取为K0,利用公式(4)、(3)计算其后每帧的负熵;6)找到起始点之后,向前推进直到某帧负熵Entropy小于Th3,从此处向后寻找谷底,且将其作为当前帧。不断推进当前帧,直到找到满足判决机制的帧作为语音的终点;7)重复步骤3到步骤6,直到信号结束。8)对每一起点、终点对,如果其帧数小于最短句子帧数,则认为其间的数据不是语音,而是噪声;如果在两段语音之间的间隙小于最短停顿帧数,则认为两段语音可合为一段语音。

    提示词压缩方法、装置、电子设备、存储介质和程序产品

    公开(公告)号:CN120031123A

    公开(公告)日:2025-05-23

    申请号:CN202411859790.9

    申请日:2024-12-17

    Abstract: 本发明提供一种提示词压缩方法、装置、电子设备、存储介质和程序产品,涉及人工智能技术领域,所述方法包括:基于查询文档中标记token之间的自注意力,构建最大生成树;最大生成树是自注意力总和最大的生成树;基于社区检测算法对最大生成树进行语义分割,得到多个语义单元;每个语义单元包括多个token;根据每个语义单元的重要性得分,对多个语义单元进行过滤;每个语义单元的重要性得分是每个语义单元中所有token的重要性得分的平均值;将过滤后的语义单元中的token按照原始顺序进行组合,得到压缩后的提示词。本发明实现压缩后的提示词能够保持重要的语义信息。

Patent Agency Ranking