-
公开(公告)号:CN110378486A
公开(公告)日:2019-10-25
申请号:CN201910637719.9
申请日:2019-07-15
Applicant: 出门问问信息科技有限公司
Abstract: 公开了一种网络嵌入方法、装置、电子设备和存储介质。通过将词序列的节点设置为目标节点的子节点、目标节点、目标节点的父节点和目标节点到根节点路径上的节点,进而获取所述目标节点的词向量。可以使得目标节点的词向量能够比较全面的保留树状结构的信息,嵌入后的词向量能够包含更多原有的语义信息,提高后续应用的准确率。
-
公开(公告)号:CN110188207A
公开(公告)日:2019-08-30
申请号:CN201910408077.5
申请日:2019-05-15
Applicant: 出门问问信息科技有限公司
IPC: G06F16/36
Abstract: 公开了一种知识图谱构建方法及装置、可读存储介质、电子设备,本申请实施例使用部分已标注好的数据集,即百科的结构化和半结构化数据,利用其本身的特性进行链接,提高了链接过程的准确率和效率。
-
公开(公告)号:CN108899036A
公开(公告)日:2018-11-27
申请号:CN201810549538.6
申请日:2018-05-31
Applicant: 出门问问信息科技有限公司
IPC: G10L17/22 , G10L17/00 , G11B20/10 , G11C7/20 , G06F3/0488
Abstract: 本发明实施例提供一种语音数据的处理方法及装置,所述方法包括:获得来自第一用户的操作信息;基于所述操作信息,确定第一用户对应的用户意图信息;如果所述用户意图信息用于指示播放来自第二用户的语音留言,基于所述用户意图信息,获取与所述用户意图信息对应的待播放的第一语音留言数据,其中,所述第一语音留言数据由第二用户录制;播放所述第一语音留言数据。如此,通过识别用户意图信息来获取待播放的语音留言数据并进行播放,能够丰富智能音频设备的功能和提高智能音频设备的智能程度。
-
公开(公告)号:CN111259134B
公开(公告)日:2023-08-08
申请号:CN202010057489.1
申请日:2020-01-19
Applicant: 出门问问信息科技有限公司
IPC: G06F16/335 , G06F16/38 , G06F40/279
Abstract: 本发明公开了一种实体识别方法、设备及计算机可读存储介质,所述方法包括:第一操作,通过实体库对指定文本进行标注,确定对应所述指定文本的训练集和测试集;所述训练集包括标注文本集和半标注文本集;第二操作,通过所述训练集对模型进行训练,基于训练获得的实体识别模型对所述测试集进行预测,筛选获得有效实体;第三操作,将所述有效实体加入所述实体库,基于所述实体库重新确定半标注文本集;重复循环第二操作和第三操作,获得目标实体库。应用本发明实施例提供的方法能够实现自动扩充目标实体库中的实体数量的目的,并且能够自动标注大量未标注的文本。
-
公开(公告)号:CN111274374B
公开(公告)日:2023-05-23
申请号:CN202010060935.4
申请日:2020-01-19
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06F18/24 , G06N3/044 , G06N3/09 , G06N3/0442 , G06N3/084
Abstract: 本发明公开了一种数据处理方法、装置及计算机存储介质和电子设备,方法包括:获取初始语料,所述初始语料至少包括对话目标和历史语料;对所述初始语料进行词向量转换,得到语料词向量;根据所述语料词向量进行分类训练,得到分类结果;根据所述分类结果判断所述对话目标是否完成。本发明提供的数据处理方法、装置及计算机存储介质和电子设备,通过引入对话目标来约束对话,并把对话目标的完成与否当作分类任务来进行分类训练判断对话目标是否完成,若完成则不再对同一对话目标进行无意义的回复;若对话目标未完成,则据此生成更为符合对话目标的回复文本来约束对话,以产生更有价值的对话,最终有助于提高对话机器人的用户满意度,提高商业价值。
-
公开(公告)号:CN111259128A
公开(公告)日:2020-06-09
申请号:CN202010057755.0
申请日:2020-01-19
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06F16/33 , G06N3/04
Abstract: 本发明公开了一种对话目标序列的生成方法、装置以及可读存储介质,包括:获取当前时刻的输入信息和前一时刻的对话目标;根据所获取输入信息和对话目标,判断所述输入信息所对应的对话目标是否发生转移;根据判断结果,确定对话目标序列。由此,通过引入包含多个对话目标的对话目标序列,对话系统能同时执行对话目标序列中的多个对话目标,以此来解决单目标开放域对话的局限性,进而提高了用户的体验感。
-
公开(公告)号:CN111179904A
公开(公告)日:2020-05-19
申请号:CN201911421451.1
申请日:2019-12-31
Applicant: 出门问问信息科技有限公司
IPC: G10L13/08 , G10L13/10 , G06F40/289
Abstract: 本发明公开了一种混合文语转换方法及装置、终端和计算机可读存储介质,该方法包括:获取混合语言文本信息;对所述混合语言文本信息进行分词,得到多种语言类型的语言分词;对于每种语言类型的所述语言分词,通过所述语言分词所属的所述语言类型对应的音标映射方式将所述语言分词转换为语音信息。通过本发明的技术方案,实现了对混合语言文本信息的快捷文语转换,提升了对混合语言文本信息进行文语转换的准确性和效率。
-
公开(公告)号:CN110276074A
公开(公告)日:2019-09-24
申请号:CN201910539080.0
申请日:2019-06-20
Applicant: 出门问问信息科技有限公司
Abstract: 本公开提供了一种自然语言处理的分布式训练方法,包括:接收训练请求并且对训练请求进行处理;将包括训练数据及相应参数的处理后训练请求发送至消息队列中;从消息队列中获取训练请求,并且根据训练请求来选择不同的训练模型进行训练;将训练完成后的训练结果发送至预测流程树构建队列;以及从预测流程树构建队列中获取请求,进行流程树的生成或更新,并且上传生成的流程树或更新的流程树。本公开还提供了一种自然语言处理的分布式训练装置、电子设备及可读存储介质。
-
公开(公告)号:CN110162612A
公开(公告)日:2019-08-23
申请号:CN201910430538.9
申请日:2019-05-22
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种信息处理方法、装置、可读存储介质和电子设备,所述方法基于神经网络,本发明实施例通过在现有的神经网络中加入门控机制和跨层连接,延长了神经网络对输入信息的记忆时间,同时提高了回复信息的效率和准确率。
-
-
-
-
-
-
-
-