-
公开(公告)号:CN111026856A
公开(公告)日:2020-04-17
申请号:CN201911249451.8
申请日:2019-12-09
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06F16/36 , G06F16/68
Abstract: 本发明公开了一种智能交互方法、装置以及计算机可读储存介质,包括:接收用户或者用户终端的请求信息;利用特定实体识别模型对所接收的请求信息进行特定实体识别,提取特定实体;根据所提取的特定实体确定实体类型;根据所确定的实体类型生成问题模板;根据所述特定实体和问题模板,获取对应所述请求信息的反馈信息。通过人工智能技术提取请求信息中的特定实体,并根据特定实体最终生成对应的问题模板,最后根据特定实体和问题模板来获取对应请求信息的反馈信息,相对于现有方案,特定实体和问题模板的设置可以覆盖大量的同类型问题,不需要再通过人工编写大量的问题答案对,大大降低了构建成本。
-
公开(公告)号:CN110970013A
公开(公告)日:2020-04-07
申请号:CN201911335928.4
申请日:2019-12-23
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种语音合成方法、装置以及计算机可读存储介质,包括:获得文本信息;在所获得的文本信息的文本区域内设置停顿标识符;将含有停顿标识符的文本信息作为语音合成系统的输入,并指示所述语音合成系统根据所述停顿标识符在所述停顿标识符处设置静音区间,生成对应于所述文本信息的语音信息。由此,通过在文本中设置停顿标识符,语音合成系统在将文本转换成语音的过程中在设有停顿标识符处相应设置静音区间,使得得到的语音消息更加自然,提升用户体验。
-
公开(公告)号:CN110718212A
公开(公告)日:2020-01-21
申请号:CN201910966762.X
申请日:2019-10-12
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种语音唤醒方法、装置及系统、终端和计算机可读存储介质,该方法包括:实时采集声音信号;提取所述声音信号的音频特征;将所述音频特征输入第一唤醒词验证模型;通过所述第一唤醒词验证模型输出第一置信度;基于所述第一置信度处于第一指定阈值范围内的情况,将包括所述声音信号在内的已缓存信号集合发送至所述第二终端;接收所述第二终端对所述已缓存信号集合的验证结果;在所述验证结果为所述已缓存信号集合对应的第二置信度处于第二指定阈值范围内时,生成对应的功能唤醒指令。通过本发明的技术方案,既节省了第一终端的能耗,同时也通过二次检验保证了对语音验证的准确性,加快了语音唤醒的速度,提升了用户体验。
-
公开(公告)号:CN110659302A
公开(公告)日:2020-01-07
申请号:CN201910940693.5
申请日:2019-09-30
Applicant: 出门问问信息科技有限公司
IPC: G06F16/23 , G06F16/332
Abstract: 本发明公开了一种问答对热更新的方法、设备、系统及存储介质。问答对热更新的方法,该方法由中间服务实现,首先,接收问答对热更新触发指令;然后,获取拟更新的第一格式问答对数据;接着,对第一格式问答对数据进行格式整理,得到符合线上格式要求的第二格式问答对数据;之后,向线上服务发送更新问答对的指令和第二格式问答对数据,第二格式问答对数据用于完成相应问答对在线上服务的热更新。通过这一方法,线上服务能够随时获知问答对系统的更新事件,并直接得到符合线上格式要求的第二格式问答对数据,进而无需重启就能完成线上服务问答对的更新。
-
公开(公告)号:CN110646763A
公开(公告)日:2020-01-03
申请号:CN201910957856.0
申请日:2019-10-10
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种基于语义的声源定位方法、装置及存储介质。基于语义的声源定位方法包括:首先,利用波束成形技术对N个方向的音频信号进行增强,分别得到相应的N个增强音频结果,其中,N的取值为大于1的正整数;接下来,对N个增强音频结果分别与目标语义进行对比,得到相应的N个匹配度数值;然后,从N个匹配度数值中选取匹配度数值最高的音频信号为目标音频信号;之后,将目标音频信号所在方向确定为定位方向。可以看出,本发明实施例在波达方向估计(DOA)基础上,利用波束成形技术获得定向的增强音频信号,并加入了语义相关性的考虑,可以从声频特征类似的多个声源中定位目标声源,去除噪音影响,大大提高了抗干扰能力。
-
公开(公告)号:CN110569331A
公开(公告)日:2019-12-13
申请号:CN201910830999.5
申请日:2019-09-04
Applicant: 出门问问信息科技有限公司
IPC: G06F16/33 , G06F16/332 , G06F17/27 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于上下文的关联性预测方法、装置及计算机存储设备。基于上下文的关联性预测方法包括:首先,获取当前轮查询语和上一轮查询语;然后,对当前轮查询语和上一轮查询语进行词向量转化,分别得到当前轮查询语词向量和上一轮查询语词向量;接下来,再分别确定对应当前轮查询语词向量和上一轮查询语词向量的句子表征,得到当前轮查询语句子表征向量和上一轮查询语句子表征向量;最后,根据当前轮查询语句子表征向量和上一轮查询语句子表征向量进行关联性预测,得到当前轮查询语与上一轮查询语是否相关联的预测结果。
-
公开(公告)号:CN108922547A
公开(公告)日:2018-11-30
申请号:CN201810502697.0
申请日:2018-05-23
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例公开一种身份的识别方法、装置及电子设备,涉及终端应用技术领域,主要目的在于有效利用收集到的用户音频信息,提高用户身份识别的准确率。本发明实施例公开的实施例的技术方案包括:在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息;在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息;对比所述第一用户身份信息及所述第二用户身份信息分别对应的加权结果,根据比对结果确定最终用户身份信息。
-
公开(公告)号:CN108829739A
公开(公告)日:2018-11-16
申请号:CN201810501760.9
申请日:2018-05-23
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例公开了一种信息推送方法及装置,涉及数据处理技术领域,能够个性化定制向说话人推送的数据信息,以提升说话人的搜索体验,本发明实施例主要技术方案为:接收说话人发起的语音搜索请求,所述语音搜索请求携带有所述说话人的语音信息;在所述语音信息中提取所述说话人的声纹特征信息;利用预置模型处理所述声纹特征信息,得到与所述说话人匹配的身份特征信息;在所述语音搜索请求对应的搜索结果信息中,提取与所述身份特征信息匹配的数据信息,并推送至所述说话人。本发明实施例主要用于根据语音搜索请求个性化定制向说话人推送的数据信息。
-
公开(公告)号:CN108806713A
公开(公告)日:2018-11-13
申请号:CN201810497070.0
申请日:2018-05-22
Applicant: 出门问问信息科技有限公司
IPC: G10L21/0308 , G10L21/0208
Abstract: 本发明提供了一种双讲状态检测方法及装置,该双讲状态检测方法包括:获取参考信号、近端信号以及残余回声信号;其中,所述参考信号、所述近端信号以及所述残余回声信号的频率均在预设的第一频率范围内;确定所述近端信号与所述参考信号之间的第一相关系数;确定所述近端信号与所述残余回声信号之间的第二相关系数;根据所述第一相关系数以及所述第二相关系数判断是否处于双讲状态。因此,本发明提供的方案可以快速的检测出是否处于双讲状态。
-
公开(公告)号:CN108717495A
公开(公告)日:2018-10-30
申请号:CN201810497069.8
申请日:2018-05-22
Applicant: 出门问问信息科技有限公司
IPC: G06F17/50
Abstract: 本发明实施例公开了一种多波束波束成形的方法、装置及电子设备,涉及声音处理技术领域,主要目的在于实现多波束波束成形时,确保目标空间指向的声音不失真,并对其他空间指向的声音进行有效抑制。本发明实施例的主要技术方案包括:计算目标声音源指向对应的波束成形输出;通过阻塞矩阵计算噪音参数;根据所述噪音参数对所述目标声音源指向对应的波束成形输出之外的其他声音源指向的信号进行降噪。
-
-
-
-
-
-
-
-
-