汉语语音识别中重复出现词识别错误的自动修正方法

    公开(公告)号:CN102324233B

    公开(公告)日:2014-05-07

    申请号:CN201110220842.4

    申请日:2011-08-03

    Abstract: 本发明提供一种汉语语音识别中重复出现词识别错误的自动修正方法,包括:(1)对每句话经识别后得到的字混淆网络与词组库中的词组及中间识别结果进行相似性匹配,以查找重复出现词组;其中,字混淆网络是所有可能识别结果的集合,字混淆网络包括最优识别结果即原有最优识别结果和最优识别结果中的每个字对应的中间识别结果;词组库包括词组及其对应的中间识别结果;(2)根据查找得到的词组信息,重新计算相似概率值和字识别概率值;(3)根据新的概率值,对字混淆网络按照概率值大小排序;和(4)使用排序结果替换字混淆网络的最优识别结果以及中间识别结果。优点在于:利用之前已修正的识别结果中的经验知识,自动修正当前识别语句中重复出现词的识别错误,从而提高识别错误的修正效率,加快识别错误修正速度。

    一种电话连续语音识别系统性能的评测方法及其系统

    公开(公告)号:CN100426376C

    公开(公告)日:2008-10-15

    申请号:CN200510011285.X

    申请日:2005-01-28

    Abstract: 本发明公开一种电话连续语音识别系统性能的评测方法及系统,该系统包括录音模块、被测的电话连续语音识别系统、语法库、语法展开模块、语料筛选模块、槽解析模块以及自动评测模块。先对电话查询的若干领域,按其语法定义若干槽;在各个领域按其语法展开,从生成的句子中选择出作为评测语料的句子并录制测试语音;将测试语音输入要评测的电话连续语音识别系统,将每个句子的语音识别结果解析为所包含的槽后输出;将系统输出的识别结果与标准答案对照,计算槽识别正确率,得到系统性能的评判指标。本发明方法比目前常用的听写机式的评测方法更符合电话连续语音识别系统的特点,能够更准确地评价电话连续语音识别系统性能。

    一种广告检测识别方法及系统

    公开(公告)号:CN101221622A

    公开(公告)日:2008-07-16

    申请号:CN200810057162.3

    申请日:2008-01-30

    Abstract: 本发明提供一种广告检测识别方法,包括:对待检测的广播电视节目数据进行预处理,得到所述数据音频流的短时能量包络;根据音频的短时能量特征,将所得到的短时能量包络切分为能量包络单元,得到待检测的广播电视节目数据的能量包络单元图;利用跳单元的策略和基于能量包络单元的相似性度量方法,对所述待检测的广播电视节目数据的能量包络单元图与已知广告的能量包络单元图进行比较,根据比较结果实现对广告的检测识别。本发明以音频特征取代视频特征、音视频特征结合等进行广告检测,具有计算复杂度低,检测效率高的优点;通过将待测数据与已知广告的音频特征进行比较,可以实现对特定广告的识别;本发明还具有应用范围广的优点。

    一种盲文计算机点字输入系统和装置以及方法

    公开(公告)号:CN101135940A

    公开(公告)日:2008-03-05

    申请号:CN200710121525.0

    申请日:2007-09-07

    Abstract: 本发明公开了一种盲文计算机点字输入系统和装置以及方法。该系统包括电脑手写板,计算机,还包括盲文点字输入导板,点字笔,以及盲文点字处理模块;所述盲文点字输入导板与所述电脑手写板的书写区域的尺寸相一致,安装在手写板的书写表面;所述电脑手写板通过接口与所述计算机相连接;所述盲文点字处理模块,用于当使用者利用所述点字笔和所述盲文点字输入导板在所述电脑手写板上进行点字时,对来自手写板的点字输入信号进行处理,并转换成文字。其通用性强,成本低,使用方便。

    一种方言语音数据切分及标注方法、系统

    公开(公告)号:CN113781999B

    公开(公告)日:2024-02-20

    申请号:CN202111066861.6

    申请日:2021-09-13

    Abstract: 本发明提出一种方言语音数据切分及标注方法和系统,使用普通话语音识别模型对第一方言语音进行语音数据切分及标注,得到第一方言语音的汉字识别结果,并基于第一方言语音及其对应汉字文本和汉字识别结果,构建方言词汇库;获取待切分和标注的语音数据作为第二方言语音,基于方言词汇库和第二方言语音对应的汉字文本,得到第二方言语音对应的音素序列,并采用音素对齐算法和普通话语音识别模型,得到第二方言语音的语音切分标注结果;基于经人工校对的语音切分标注结果及其对应的语音数据训练得到方言语音声学模型,将方言语音数据输入至方言语音声学模型,得到方言语音数据的切分和标注结果。

    一种汉字到通用盲文的转换方法及系统

    公开(公告)号:CN114429127A

    公开(公告)日:2022-05-03

    申请号:CN202111566326.7

    申请日:2021-12-20

    Abstract: 本发明提出一种汉字到通用盲文的转换方法和系统,包括:构建深度学习模型,且该深度学习模型具有两个共享特征编码的子任务分支,其中一条子任务分支用于根据盲文规则将汉语文本分词,另一条子任务分支用于为每个汉字标注拼音及对应声调;使用已标记盲文分词的汉字语料和汉字拼音的对照语料,交替训练该深度学习模型的两个子任务分支,直到两子任务分支的损失函数均收敛或达到预设迭代次数,保存当前深度学习模型作为识别模型;将待通用盲文转换的汉字数据输入该识别模型,得到该汉字数据的分词信息和带调拼音信息,并基于该分词信息和该带调拼音信息,以将该汉字数据转换为对应的通用盲文文本。本发明可以实现汉字到盲文的实时准确转换。

    一种盲文方自适应定位方法及系统

    公开(公告)号:CN108062548B

    公开(公告)日:2020-11-03

    申请号:CN201711071082.9

    申请日:2017-11-03

    Abstract: 本发明涉及一种盲文方自适应定位方法及系统,包括:获取盲文图像的盲文点位置信息;对盲文点位置信息进行纵坐标的聚类,以得到多条预选盲文方水平行线的位置;根据各预选盲文方水平行线的纵坐标,从上往下判断是否存在符合标准的水平行线,若存在,则从三条水平行线开始,根据统计得到的盲文方点距、行距等信息分别向上、向下拓展,且拓展的过程中生成以最新拓展的一组三条水平行线为基准,同时剔除位置错误的水平行线,直到达到盲文图像上下两端,得到包含多组以三条水平行线为一组的盲文方水平线;同理得到盲文方竖直线;以盲文方竖直线和盲文方竖直线的相交点,构成盲文方网格。

Patent Agency Ranking