-
公开(公告)号:CN110276074B
公开(公告)日:2023-04-18
申请号:CN201910539080.0
申请日:2019-06-20
Applicant: 出门问问信息科技有限公司
IPC: G06F40/30 , G06F16/35 , G06F16/33 , G06F18/214 , G06F18/241 , G06N20/00
Abstract: 本公开提供了一种自然语言处理的分布式训练方法,包括:接收训练请求并且对训练请求进行处理;将包括训练数据及相应参数的处理后训练请求发送至消息队列中;从消息队列中获取训练请求,并且根据训练请求来选择不同的训练模型进行训练;将训练完成后的训练结果发送至预测流程树构建队列;以及从预测流程树构建队列中获取请求,进行流程树的生成或更新,并且上传生成的流程树或更新的流程树。本公开还提供了一种自然语言处理的分布式训练装置、电子设备及可读存储介质。
-
公开(公告)号:CN108846054A
公开(公告)日:2018-11-20
申请号:CN201810550778.8
申请日:2018-05-31
Applicant: 出门问问信息科技有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供一种音频数据续播方法及装置,所述方法包括:在接收到用于指示续播目标音频数据的续播指示信息时,基于所述续播指示信息,获取所述目标音频数据的音频标识信息,其中,所述音频标识信息为音频数据的类别信息、名称信息、时间信息或者设备信息中的一种或多种组合;获取与所述音频标识信息相匹配的目标音频数据和历史播放进度信息;从所述历史播放进度信息所指示的历史停止位置,续播所述目标音频数据。通过根据历史播放进度信息,来续播目标音频数据,能够丰富智能音频设备的续播功能,并提高智能音频设备的智能程度。
-
公开(公告)号:CN110378486B
公开(公告)日:2021-12-03
申请号:CN201910637719.9
申请日:2019-07-15
Applicant: 出门问问信息科技有限公司
IPC: G06N20/00 , G06F40/216 , G06F40/284
Abstract: 公开了一种网络嵌入方法、装置、电子设备和存储介质。通过将词序列的节点设置为目标节点的子节点、目标节点、目标节点的父节点和目标节点到根节点路径上的节点,进而获取所述目标节点的词向量。可以使得目标节点的词向量能够比较全面的保留树状结构的信息,嵌入后的词向量能够包含更多原有的语义信息,提高后续应用的准确率。
-
公开(公告)号:CN110377906A
公开(公告)日:2019-10-25
申请号:CN201910637761.0
申请日:2019-07-15
Applicant: 出门问问信息科技有限公司
Abstract: 本发明实施例公开了一种实体对齐方法、存储介质和电子设备。本发明实施例分别获取多个实体在不同视图下的特征,并对各实体的特征进行筛选,确定各实体对应的特征向量,从而根据各实体的特征向量获取任意两个实体间的误差参数,从而基于误差参数实现实体对齐。本实施例的方法能够根据来自不同知识图谱、且具有异构和多态性的实体特征进行相似度判定,从而根据相似度进行实体对齐,提升了实体对齐方法的准确性。
-
公开(公告)号:CN110162612B
公开(公告)日:2021-07-09
申请号:CN201910430538.9
申请日:2019-05-22
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种信息处理方法、装置、可读存储介质和电子设备,所述方法基于神经网络,本发明实施例通过在现有的神经网络中加入门控机制和跨层连接,延长了神经网络对输入信息的记忆时间,同时提高了回复信息的效率和准确率。
-
公开(公告)号:CN110704637A
公开(公告)日:2020-01-17
申请号:CN201910931395.X
申请日:2019-09-29
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种多模态知识库的构建方法、装置及计算机可读介质,包括:接收训练数据;提取所接收的训练数据中所有的实体,得到实体集;针对所得到的实体集中的每一个实体,获取对应于每一个实体的图片;将实体集中的每一个实体和对应于实体的图片作为联合模型的输入进行训练,得到对应于实体且相互映射的词向量和图片向量;根据所得到的图片向量,生成用于将图片向量映射于图片的图片索引。查询时,知识库根据查询信息反馈文本信息,从文本信息中提取实体,根据实体得到词向量,词向量通过映射关系查询图片向量,图片向量通过图片索引找到对应的图片,反馈该图片。本知识库在查询时既能反馈文本信息,还能反馈图片信息,使得查询结果全面。
-
公开(公告)号:CN110704637B
公开(公告)日:2023-05-12
申请号:CN201910931395.X
申请日:2019-09-29
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种多模态知识库的构建方法、装置及计算机可读介质,包括:接收训练数据;提取所接收的训练数据中所有的实体,得到实体集;针对所得到的实体集中的每一个实体,获取对应于每一个实体的图片;将实体集中的每一个实体和对应于实体的图片作为联合模型的输入进行训练,得到对应于实体且相互映射的词向量和图片向量;根据所得到的图片向量,生成用于将图片向量映射于图片的图片索引。查询时,知识库根据查询信息反馈文本信息,从文本信息中提取实体,根据实体得到词向量,词向量通过映射关系查询图片向量,图片向量通过图片索引找到对应的图片,反馈该图片。本知识库在查询时既能反馈文本信息,还能反馈图片信息,使得查询结果全面。
-
公开(公告)号:CN111274374A
公开(公告)日:2020-06-12
申请号:CN202010060935.4
申请日:2020-01-19
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种数据处理方法、装置及计算机存储介质和电子设备,方法包括:获取初始语料,所述初始语料至少包括对话目标和历史语料;对所述初始语料进行词向量转换,得到语料词向量;根据所述语料词向量进行分类训练,得到分类结果;根据所述分类结果判断所述对话目标是否完成。本发明提供的数据处理方法、装置及计算机存储介质和电子设备,通过引入对话目标来约束对话,并把对话目标的完成与否当作分类任务来进行分类训练判断对话目标是否完成,若完成则不再对同一对话目标进行无意义的回复;若对话目标未完成,则据此生成更为符合对话目标的回复文本来约束对话,以产生更有价值的对话,最终有助于提高对话机器人的用户满意度,提高商业价值。
-
公开(公告)号:CN111259134A
公开(公告)日:2020-06-09
申请号:CN202010057489.1
申请日:2020-01-19
Applicant: 出门问问信息科技有限公司
IPC: G06F16/335 , G06F16/38 , G06F40/279
Abstract: 本发明公开了一种实体识别方法、设备及计算机可读存储介质,所述方法包括:第一操作,通过实体库对指定文本进行标注,确定对应所述指定文本的训练集和测试集;所述训练集包括标注文本集和半标注文本集;第二操作,通过所述训练集对模型进行训练,基于训练获得的实体识别模型对所述测试集进行预测,筛选获得有效实体;第三操作,将所述有效实体加入所述实体库,基于所述实体库重新确定半标注文本集;重复循环第二操作和第三操作,获得目标实体库。应用本发明实施例提供的方法能够实现自动扩充目标实体库中的实体数量的目的,并且能够自动标注大量未标注的文本。
-
公开(公告)号:CN111160044A
公开(公告)日:2020-05-15
申请号:CN201911420560.1
申请日:2019-12-31
Applicant: 出门问问信息科技有限公司
Abstract: 本发明公开了一种文语转换方法及装置、终端和计算机可读存储介质,该方法包括:获取针对文字信息的音标映射方式选择信息;在多种预设音标映射方式中,选择所述音标映射方式选择信息对应的目标音标映射方式;以所述目标音标映射方式将所述文字信息转换为语音信息。通过本发明的技术方案,可在同一文语转换系统中实现对多种口语的转换,提升了文语转换系统的兼容性,为多地域用户提供了文语转换便利,从而提升了用户体验。
-
-
-
-
-
-
-
-
-