-
公开(公告)号:CN112053686B
公开(公告)日:2024-01-02
申请号:CN202010739039.0
申请日:2020-07-28
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种音频中断方法、装置以及计算机可读存储介质,包括:获取音频数据的多个特征向量数据;针对多个所述特征向量数据,生成用于表征所述音频数据为特定音频的置信度;根据所生成的置信度,停止当前音频信息的输出。由此,通过利用特征向量数据所生成的置信度来决定停止当前音频信息的输出,不需要通过现有技术中语音识别解码器得到识别结果,大大减少了计算量,进而降低了打断的延迟,提升了用户体验。
-
公开(公告)号:CN111339859A
公开(公告)日:2020-06-26
申请号:CN202010096198.3
申请日:2020-02-17
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种多模态风险控制方法、装置以及计算机可读存储介质,包括:获取目标对象在答题时的生物特征;根据所获取的生物特征,确定对应于所述生物特征的第一风险评分;至少根据所确定的第一风险评分,确定对应于所述目标对象的风险标签。由此,通过在目标对象答题时获取其多个生物特征,以多模态的生物特征来确定该目标对象的风险标签,从而使得一些欺诈者不易蒙混过关,提高了金融交易的安全性。
-
公开(公告)号:CN110334244B
公开(公告)日:2020-06-09
申请号:CN201910624692.X
申请日:2019-07-11
Applicant: 出门问问信息科技有限公司
Abstract: 本发明提供了一种数据处理的方法、装置及电子设备,用于解决现有技术中无法确定关键词在音频数据中的位置,影响关键词检出系统的性能的问题。包括:获取音频数据中的目标帧;确定目标帧的顶层特征向量序列;根据顶层特征向量序列确定出目标帧锚框的后验概率向量序列、以及目标帧锚框的空间变换参数向量序列;确定目标帧锚框的后验概率向量序列中的最大值、以及最大值对应的目标锚框;若最大值大于设定阈值,则确定最大值对应的目标锚框的第一时刻存在关键词;根据第一时刻以及目标锚框的长度,确定目标锚框对应的第二时刻;根据目标锚框的起始位置和结束位置,以及锚框对应的空间变换参数向量,确定出关键词的实际起止位置。
-
公开(公告)号:CN110675855A
公开(公告)日:2020-01-10
申请号:CN201910952464.5
申请日:2019-10-09
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例公开了一种语音识别方法、电子设备及计算机可读存储介质,通过将接收到的待识别语音的特征信息输入至语言识别系统进行识别,以获取语音识别结果,其中,语言识别系统包括预先创建的发音字典、声学模型和语言模型,所述发音字典包括根据音素级语音识别系统构建的第二语种词语的发音图,所述音素级语音识别系统包括所述声学模型和语言模型,所述声学模型基于所述第一语种音素集训练获得,所述语言模型基于所述第一语种音素集构建,由此,可以根据第一语种音素集对第二语种词语进行注音,提高了语音识别的准确率。
-
公开(公告)号:CN110674261A
公开(公告)日:2020-01-10
申请号:CN201910972176.6
申请日:2019-10-14
Applicant: 出门问问信息科技有限公司
IPC: G06F16/33 , G06F16/31 , G06F40/274
Abstract: 本发明公开了一种信息处理方法、装置以及计算机可读存储介质,所述方法包括:接收用户或者用户终端的请求信息;将所接收到的请求信息转换为文本信息;对所述文本信息进行语义分析来判断所述请求信息的请求类型;利用问答库执行与所判定得到的请求类型相对应的信息交互操作。使用时,用户发出请求信息,在接收到用户的请求信息后,自动分析出用户所需要的请求类型,然后根据请求类型自动执行相对应的操作,此过程大大节省了时间,提高了效率,同时也提升了用户的体验。
-
公开(公告)号:CN110619047A
公开(公告)日:2019-12-27
申请号:CN201910870885.3
申请日:2019-09-16
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种自然语言模型的构建方法、装置以及可读存储介质,包括:获取训练数据,训练数据包括测试集和多个对应于测试集的结果集;将所获取的测试集作为联合模型的输入,得到多个对应测试集的识别结果;根据所得到多个对应测试集的识别结果和所获取的结果集,得到多个对应识别结果的识别损失;根据所得到多个对应识别结果的识别损失,更新联合模型中的参数信息。由此,将训练集作为联合模型的输入,同时训练领域识别模型、意图识别模型和语义槽识别模型,当更新参数时,联合模型中的三种模型中的参数信息能互相被参与并配合着进行更新,本方案构建的模型能减少前后模块之间的误差传播,提高了模型的准确度。
-
公开(公告)号:CN110619041A
公开(公告)日:2019-12-27
申请号:CN201910870886.8
申请日:2019-09-16
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本发明公开了一种智能对话方法、装置以及计算机可读存储介质,应用于设置有问答知识库的服务端,所述方法包括:接收来自客户端发送的请求信息;响应于所述请求信息,基于所述问答知识库选取与所述请求信息对应的回复信息;向客户端反馈所述回复信息。使用时,用户(更具体的说是儿童)在客户端上手写输入或者语音输入儿童问题,客户端将该儿童问题进行整理,生成请求信息,并将生成的请求信息发送到服务端。由此,儿童自身有一些心理问题或者其他问题,都可以通过本方案得到相应的回复信息,以帮助儿童解决儿童心理健康问题。
-
公开(公告)号:CN110580908A
公开(公告)日:2019-12-17
申请号:CN201910932340.0
申请日:2019-09-29
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种支持不同语种的命令词检测方法及设备,首先采集至少包括两种不同语种的语音信号;接着提取所述语音信号的音频特征;进一步地通过深度学习网络对所提取的音频特征进行分类预测,得到分类预测结果;若所述分类预测结果为命令词的概率最大,则将所述概率最大的命令词作为输出结果。
-
公开(公告)号:CN108960407B
公开(公告)日:2019-07-23
申请号:CN201810570507.9
申请日:2018-06-05
Applicant: 出门问问信息科技有限公司
IPC: G06N3/04
Abstract: 本发明实施例公开了一种递归神经网路语言模型训练方法、装置、设备及介质。其中,方法包括:将语料库中的语言文本分别输入至训练完成的高秩递归神经网路语言模型RNNLM和待训练的轻量级RNNLM中;迭代轻量级RNNLM中的参数,最小化交叉熵损失和Kullback‑Leibler散度的加权和,以完成对轻量级RNNLM的训练;其中,交叉熵损失是轻量级RNNLM的输出向量相对于训练数据标签向量的交叉熵损失,Kullback‑Leibler散度是轻量级RNNLM的输出向量相对于高秩RNNLM的输出向量的Kullback‑Leibler散度。本实施例提供的方法可以有效的降低RNNLM规模。
-
公开(公告)号:CN112037769B
公开(公告)日:2024-07-30
申请号:CN202010738406.5
申请日:2020-07-28
Applicant: 出门问问信息科技有限公司
IPC: G10L15/06 , G10L15/10 , G10L15/26 , G06F40/284
Abstract: 本发明公开了一种训练数据生成方法、装置以及计算机可读存储介质,包括:接收音频信息和对应的标注文本信息;生成对应于所述音频信息的语音识别文本信息和第一时间戳信息;内容匹配所述标注文本信息和语音识别文本信息,根据所述第一时间戳信息生成对应于所述标注文本信息的第二时间戳信息;根据所述第二时间戳信息,获取所述标注文本信息中的子文本训练信息和所述音频信息中的子音频训练信息。通过获取原始的音频信息以及标注文本信息,利用音频信息的时间戳信息从原始的音频信息以及标注文本信息中获取多个子音频训练信息和对应的子文本训练信息,从而得到大量并且高质量的语音训练数据,此过程效率高并且降低了耗费成本。
-
-
-
-
-
-
-
-
-