流式语音识别方法、装置、电子设备及存储介质

    公开(公告)号:CN115019785A

    公开(公告)日:2022-09-06

    申请号:CN202210576178.5

    申请日:2022-05-24

    Inventor: 王方圆 徐波

    Abstract: 本发明提供一种流式语音识别方法、装置、电子设备及存储介质,其中流式语音识别方法包括:获取原始音频数据,基于原始音频数据生成原始特征序列;将原始特征序列输入音频编码器,生成目标音频编码特征序列,其中,音频编码器包括分块自注意力机制编码层和移位块自注意力机制编码层;将目标音频编码特征序列输入音频解码器,生成语音识别文本。基于音频编码器的分块自注意力机制编码层对原始音频数据进行编码,并引入移位块自注意力编码层,实现了自注意力得分的跨块计算,确保了音频编码器的线性时间复杂度;从而快速生成具有全局上下文信息的目标音频编码特征序列,对该特征序列进行解码并生成语音识别文本,有效提高了流式语音识别的准确率。

    基于卷积神经网络的短文本分类方法

    公开(公告)号:CN104834747B

    公开(公告)日:2018-04-27

    申请号:CN201510271672.0

    申请日:2015-05-25

    Abstract: 本发明是一种基于卷积神经网络的短文本分类方法,该卷积神经网络共分五层:第一层,获取短文本中的多尺度候选语义单元;第二层,计算每一个候选语义单元与向量空间中所有词表示向量的欧式距离并找出最近邻的词表示,选择所有满足欧式距离预设阈值的最近邻词表示构建语义扩展矩阵;第三层,用多个不同宽度、不同权值的核矩阵分别对短文本的映射矩阵和语义扩展矩阵进行二维卷积运算提取局部卷积特征并生成多层局部卷积特征矩阵;第四层,对多层局部卷积特征矩阵进行下采样并得到多层全局特征矩阵,将所述全局特征矩阵进行非线性正切变换并转换为定长的语义特征向量;第五层,将语义特征向量赋予分类器,对短文本的类别进行预测。

    长视频中目标内容的快速统计与自动审核方法及装置

    公开(公告)号:CN103297851B

    公开(公告)日:2016-04-13

    申请号:CN201310182156.1

    申请日:2013-05-16

    Abstract: 本发明公开了一种长视频中目标内容的快速统计与自动审核方法,该方法包括以下步骤:抽取长视频和目标视频的关键帧序列;提取关键帧序列的局部二值模式直方图特征和空间灰度序特征;在长视频序列中快速查找目标视频,进行目标视频的粗定位;采用时空约束极大连通区域方法,在长视频序列中精确定位目标视频;判断目标视频在长视频中是否定位完成;根据定位结果,进行长视频内容统计和可疑目标的自动审核。本发明能够对大规模长视频进行自动处理,能够进行长视频内容的快速统计和可疑目标内容的自动审核。

    基于语义图谱的短文本特征扩展方法

    公开(公告)号:CN104391942A

    公开(公告)日:2015-03-04

    申请号:CN201410686237.X

    申请日:2014-11-25

    CPC classification number: G06F17/2715 G06F17/2785 G06K9/6267

    Abstract: 本发明公开了一种基于语义图谱的短文本特征扩展方法,包括以下步骤:利用短文本训练数据集进行主题建模,抽取主题词分布;对主题词分布进行重排序;构建候选关键词词典和主题-关键词语义图谱;基于链接分析的方法计算候选关键词和种子关键词的综合相似度评价,选择最相似的候选关键词完成对短文本的扩展。本发明方法较基于语言模型的短文本特征表示方法操作简单,执行效率高,而且充分利用关键词之间的语义关联信息,较传统的基于词袋模型的短文本特征表示方法,有效缓解了数据稀疏性问题和语义敏感性问题,不依赖于外部大规模辅助训练语料或者搜索引擎。

    模型检查点参数域平均方法、装置、电子设备及存储介质

    公开(公告)号:CN115081614A

    公开(公告)日:2022-09-20

    申请号:CN202210576193.X

    申请日:2022-05-24

    Inventor: 王方圆 徐波

    Abstract: 本发明提供一种模型检查点参数域平均方法、装置、电子设备及存储介质,该方法涉及人工智能技术领域,包括:在对待训练深度神经网络模型训练过程中,保存多个检查点和所述多个检查点分别对应的多个模型参数;所述检查点用于表示在训练过程中不同阶段的模型;确定在各所述检查点分别对应的所述模型的损失函数的总损失值;基于所述总损失值,从所述多个检查点中确定待平均检查点;对所述待平均检查点对应的多个模型参数进行参数平均,得到所述模型的参数平均值。本发明提供的方法,结合了在训练集和验证集上模型的损失函数的总损失值,同时考虑了模型的偏差和方差,提升了模型的性能。

    一种近似重复视频片段自动定位方法

    公开(公告)号:CN102779184B

    公开(公告)日:2014-05-14

    申请号:CN201210226094.5

    申请日:2012-06-29

    Abstract: 本发明公开了一种近似重复视频片段自动定位方法,该方法包括以下步骤:抽取查询视频片段和目标视频的关键帧序列;提取关键帧序列的视频二值时间灰度序特征;提取关键帧序列的视频时空统一灰度序特征;对目标视频进行三层自动定位过滤,得到目标视频中与查询视频片段近似重复的视频片段。本发明方法较基于空间灰度序的定位方法平均能够节省约62%的响应时间,较基于时间灰度序的定位方法平均能够节省约89%的响应时间,并能够使定位查询在召回率平均值为1.0时,精度平均值达到0.965,高于基于空间灰度序方法的0.934,以及基于时间灰度序方法的0.775。由上可知,本发明方法大幅提高了定位过滤的执行效率,能够在召回率较高的情况下,显著提高定位精度。

Patent Agency Ranking