-
公开(公告)号:CN112053686B
公开(公告)日:2024-01-02
申请号:CN202010739039.0
申请日:2020-07-28
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种音频中断方法、装置以及计算机可读存储介质,包括:获取音频数据的多个特征向量数据;针对多个所述特征向量数据,生成用于表征所述音频数据为特定音频的置信度;根据所生成的置信度,停止当前音频信息的输出。由此,通过利用特征向量数据所生成的置信度来决定停止当前音频信息的输出,不需要通过现有技术中语音识别解码器得到识别结果,大大减少了计算量,进而降低了打断的延迟,提升了用户体验。
-
公开(公告)号:CN113553861B
公开(公告)日:2023-11-14
申请号:CN202110872713.7
申请日:2021-07-30
Applicant: 出门问问信息科技有限公司
IPC: G06F40/35 , G06F40/205
Abstract: 本申请公开了一种基于对话系统的信息处理方法、装置及计算机可读存储介质。该方法包括:首先,将对话系统的对话记录作为系统输入,并从中提取每一语句的说话人、说话时间和说话内容等质检对象;之后,根据业务需求制定的质检项命中规则,对上述质检对象进行检测,如果命中,则说明质检对象存在服务质量问题,有待进一步评估;之后,则根据质检项评分规则对存在服务质量问题的质检对象进行质检评分,计算得到该对话记录的质检评分。由于本申请实施例提供的基于对话系统的信息处理方法、装置及存储介质是基于规则的,而这些规则可以根据不同业务需求的特点灵活制定,所需计算资源更少,更利于实际应用和推广。
-
公开(公告)号:CN113630613B
公开(公告)日:2023-11-10
申请号:CN202110872708.6
申请日:2021-07-30
Applicant: 出门问问信息科技有限公司
IPC: H04N21/2187 , H04N21/4415 , H04N21/4788 , G10L13/02 , G10L15/26 , G06F16/35
Abstract: 本申请提供了一种信息处理方法,包括:获取针对第一用户的第一语音信息;基于所述第一语音信息的类型,将所述第一语音信息中包括的所述第一用户的昵称,替换为所述第二用户的昵称,生成第二语音信息;向所述第一用户传输所述第一语音信息,以及向所述第二用户传输所述第二语音信息;本申请还提供一种信息处理装置和存储介质,通过本申请提供的信息处理方法、装置及存储介质,可以提升用户观看直播的体验。
-
公开(公告)号:CN116052655A
公开(公告)日:2023-05-02
申请号:CN202211710465.7
申请日:2022-12-29
Applicant: 出门问问信息科技有限公司
IPC: G10L15/197 , G10L15/26 , G10L15/06 , G10L19/16
Abstract: 本申请实施例提供了一种音频处理方法、装置、电子设备和可读存储介质,涉及计算机技术领域。在本申请实施例中,本申请实施例可以获取目标音频,根据目标语音识别模型中的声学识别模块确定目标音频对应的发音概率矩阵,并根据目标语音识别模型中的语言识别模块和发音概率矩阵,确定目标音频对应的文字信息。进一步的,本申请实施例可以对文字信息进行融合解码处理,以确定目标音频对应的音频识别结果。其中,本申请实施例可以在发音概率矩阵对应的概率空间中搜索概率较大的文字信息,降低了音频和文本之间的数据依赖,在面对新出现的词汇或者生僻词汇时,本申请实施例可以增加模型输出的可能性,提高语音识别的准确率。
-
公开(公告)号:CN113159280A
公开(公告)日:2021-07-23
申请号:CN202110309184.X
申请日:2021-03-23
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开一种六轴传感信号的转换方法及装置,包括:采集第一原始信号,第一原始信号为六轴传感信号;将第一原始信号按照预设长度拆分成N段子信号,N段子信号组成第一原始信号序列;对第一原始信号序列进行标准化处理,得到第一标准信号序列;根据第一标准信号序列,计算第一相关矩阵;对第一相关矩阵进行拉普拉斯归一化,得到邻接矩阵。
-
公开(公告)号:CN111339859A
公开(公告)日:2020-06-26
申请号:CN202010096198.3
申请日:2020-02-17
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种多模态风险控制方法、装置以及计算机可读存储介质,包括:获取目标对象在答题时的生物特征;根据所获取的生物特征,确定对应于所述生物特征的第一风险评分;至少根据所确定的第一风险评分,确定对应于所述目标对象的风险标签。由此,通过在目标对象答题时获取其多个生物特征,以多模态的生物特征来确定该目标对象的风险标签,从而使得一些欺诈者不易蒙混过关,提高了金融交易的安全性。
-
公开(公告)号:CN110619047A
公开(公告)日:2019-12-27
申请号:CN201910870885.3
申请日:2019-09-16
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种自然语言模型的构建方法、装置以及可读存储介质,包括:获取训练数据,训练数据包括测试集和多个对应于测试集的结果集;将所获取的测试集作为联合模型的输入,得到多个对应测试集的识别结果;根据所得到多个对应测试集的识别结果和所获取的结果集,得到多个对应识别结果的识别损失;根据所得到多个对应识别结果的识别损失,更新联合模型中的参数信息。由此,将训练集作为联合模型的输入,同时训练领域识别模型、意图识别模型和语义槽识别模型,当更新参数时,联合模型中的三种模型中的参数信息能互相被参与并配合着进行更新,本方案构建的模型能减少前后模块之间的误差传播,提高了模型的准确度。
-
公开(公告)号:CN110619041A
公开(公告)日:2019-12-27
申请号:CN201910870886.8
申请日:2019-09-16
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本发明公开了一种智能对话方法、装置以及计算机可读存储介质,应用于设置有问答知识库的服务端,所述方法包括:接收来自客户端发送的请求信息;响应于所述请求信息,基于所述问答知识库选取与所述请求信息对应的回复信息;向客户端反馈所述回复信息。使用时,用户(更具体的说是儿童)在客户端上手写输入或者语音输入儿童问题,客户端将该儿童问题进行整理,生成请求信息,并将生成的请求信息发送到服务端。由此,儿童自身有一些心理问题或者其他问题,都可以通过本方案得到相应的回复信息,以帮助儿童解决儿童心理健康问题。
-
公开(公告)号:CN110580908A
公开(公告)日:2019-12-17
申请号:CN201910932340.0
申请日:2019-09-29
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种支持不同语种的命令词检测方法及设备,首先采集至少包括两种不同语种的语音信号;接着提取所述语音信号的音频特征;进一步地通过深度学习网络对所提取的音频特征进行分类预测,得到分类预测结果;若所述分类预测结果为命令词的概率最大,则将所述概率最大的命令词作为输出结果。
-
公开(公告)号:CN109783704A
公开(公告)日:2019-05-21
申请号:CN201910005704.0
申请日:2019-01-03
Applicant: 中国科学院自动化研究所 , 出门问问信息科技有限公司
IPC: G06F16/9032
Abstract: 本发明属于人机对话技术领域,具体涉及一种人机混合的应答方法、系统、装置,旨在为了解决现有人机应答方法无法实现在线学习的问题。本发明方法包括:对当前对话上下文Ct进行编码,得到第一表征向量E(Ct);基于对话任务下的候选回复语句,并进行编码后得到第二表征向量 基于第一表征向量E(Ct)、第二表征向量通过不确定性估计方法获取候选回复语句能够正确回复用户提问的置信度,置信度大于设定阈值则选择置信度对应的候选回复语句进行应答输出,否则获取通过人机交互设备录入的回复语句或选定的候选回复语句进行应答输出,并基于应答输出后得到的全部对话语句进行上述步骤中的参数优化。本发明保证了输出的应答语句具有足够的置信度,实现了对话模型的在线学习更新。
-
-
-
-
-
-
-
-
-