-
公开(公告)号:CN108829777A
公开(公告)日:2018-11-16
申请号:CN201810540655.6
申请日:2018-05-30
Applicant: 出门问问信息科技有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种聊天机器人的问题答复方法及装置,涉及机器人领域,能够解决现有技术中由于聊天机器人回答人设问题时答复的不可控导致人机交互的体验较差的问题。本发明的方法主要包括:利用使用神经网络训练过的问题分类器判断用户输入的问题语句是否为人设问题,其中,所述人设问题为针对所述聊天机器人人物设定的问题语句;当确定所述问题语句为人设问题时,利用第一答复模型为所述问题语句匹配对应的答复语句。发明主要适用于设置聊天机器人对人设问题的答复的场景中。
-
公开(公告)号:CN111259134B
公开(公告)日:2023-08-08
申请号:CN202010057489.1
申请日:2020-01-19
Applicant: 出门问问信息科技有限公司
IPC: G06F16/335 , G06F16/38 , G06F40/279
Abstract: 本发明公开了一种实体识别方法、设备及计算机可读存储介质,所述方法包括:第一操作,通过实体库对指定文本进行标注,确定对应所述指定文本的训练集和测试集;所述训练集包括标注文本集和半标注文本集;第二操作,通过所述训练集对模型进行训练,基于训练获得的实体识别模型对所述测试集进行预测,筛选获得有效实体;第三操作,将所述有效实体加入所述实体库,基于所述实体库重新确定半标注文本集;重复循环第二操作和第三操作,获得目标实体库。应用本发明实施例提供的方法能够实现自动扩充目标实体库中的实体数量的目的,并且能够自动标注大量未标注的文本。
-
公开(公告)号:CN111274374B
公开(公告)日:2023-05-23
申请号:CN202010060935.4
申请日:2020-01-19
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06F18/24 , G06N3/044 , G06N3/09 , G06N3/0442 , G06N3/084
Abstract: 本发明公开了一种数据处理方法、装置及计算机存储介质和电子设备,方法包括:获取初始语料,所述初始语料至少包括对话目标和历史语料;对所述初始语料进行词向量转换,得到语料词向量;根据所述语料词向量进行分类训练,得到分类结果;根据所述分类结果判断所述对话目标是否完成。本发明提供的数据处理方法、装置及计算机存储介质和电子设备,通过引入对话目标来约束对话,并把对话目标的完成与否当作分类任务来进行分类训练判断对话目标是否完成,若完成则不再对同一对话目标进行无意义的回复;若对话目标未完成,则据此生成更为符合对话目标的回复文本来约束对话,以产生更有价值的对话,最终有助于提高对话机器人的用户满意度,提高商业价值。
-
公开(公告)号:CN111145724B
公开(公告)日:2022-08-19
申请号:CN201911421542.5
申请日:2019-12-31
Applicant: 出门问问信息科技有限公司
IPC: G10L13/08 , G10L13/02 , G06F40/117 , G06F40/247 , G06F40/284
Abstract: 本发明公开了一种多音字标注方法、装置以及计算机可读存储介质,包括:获取多音字;对所获取的多音字进行读音预判,得到对应于所述多音字的读音和置信度;根据所得到的置信度,展示所述多音字和对应的读音,并指示用户确定对应所述多音字的读音;根据所确定的读音,确定是否将所述多音字标注为用户所确定的读音。由此,通过将经读音预判所得到的读音展示于用户,然后根据用户的指示进一步来设定多音字的读音,从而提高了读音标注的准确度。
-
公开(公告)号:CN112584266A
公开(公告)日:2021-03-30
申请号:CN202011319444.3
申请日:2020-11-23
Applicant: 出门问问信息科技有限公司
IPC: H04R1/10
Abstract: 本发明公开了一种信号处理的方法、装置及耳机,利用位于耳道外的第一信号采集设备和第二信号采集设备对信号采集设备当前所处的环境进行检测,判断当前的噪声环境是否属于风噪声环境,若是,则根据包括第三音频信号的音频信号,进行音频输入信号降噪处理;否则,根据第一音频信号和第二音频信号,进行音频输入信号降噪处理。克服了波束成形算法对白噪声增益的局限性问题,避免利用波束成形算法无法对空间白噪声进行有效抑制的问题,从而对于较强风噪声环境下的音频信号进行有效降噪。
-
公开(公告)号:CN111259128A
公开(公告)日:2020-06-09
申请号:CN202010057755.0
申请日:2020-01-19
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06F16/33 , G06N3/04
Abstract: 本发明公开了一种对话目标序列的生成方法、装置以及可读存储介质,包括:获取当前时刻的输入信息和前一时刻的对话目标;根据所获取输入信息和对话目标,判断所述输入信息所对应的对话目标是否发生转移;根据判断结果,确定对话目标序列。由此,通过引入包含多个对话目标的对话目标序列,对话系统能同时执行对话目标序列中的多个对话目标,以此来解决单目标开放域对话的局限性,进而提高了用户的体验感。
-
公开(公告)号:CN111179904A
公开(公告)日:2020-05-19
申请号:CN201911421451.1
申请日:2019-12-31
Applicant: 出门问问信息科技有限公司
IPC: G10L13/08 , G10L13/10 , G06F40/289
Abstract: 本发明公开了一种混合文语转换方法及装置、终端和计算机可读存储介质,该方法包括:获取混合语言文本信息;对所述混合语言文本信息进行分词,得到多种语言类型的语言分词;对于每种语言类型的所述语言分词,通过所述语言分词所属的所述语言类型对应的音标映射方式将所述语言分词转换为语音信息。通过本发明的技术方案,实现了对混合语言文本信息的快捷文语转换,提升了对混合语言文本信息进行文语转换的准确性和效率。
-
公开(公告)号:CN111145724A
公开(公告)日:2020-05-12
申请号:CN201911421542.5
申请日:2019-12-31
Applicant: 出门问问信息科技有限公司
IPC: G10L13/08 , G10L13/02 , G06F40/117 , G06F40/247 , G06F40/284
Abstract: 本发明公开了一种多音字标注方法、装置以及计算机可读存储介质,包括:获取多音字;对所获取的多音字进行读音预判,得到对应于所述多音字的读音和置信度;根据所得到的置信度,展示所述多音字和对应的读音,并指示用户确定对应所述多音字的读音;根据所确定的读音,确定是否将所述多音字标注为用户所确定的读音。由此,通过将经读音预判所得到的读音展示于用户,然后根据用户的指示进一步来设定多音字的读音,从而提高了读音标注的准确度。
-
公开(公告)号:CN111145722A
公开(公告)日:2020-05-12
申请号:CN201911394467.8
申请日:2019-12-30
Applicant: 出门问问信息科技有限公司
IPC: G10L13/08 , G06F40/253
Abstract: 本发明公开了一种文本处理方法,包括:获得待处理的原始文本;对原始文本基于预设的TN规则进行文本正则化处理,获得经TN处理后的第一输出文本和原始转写列表;其中,原始转写列表中包括至少一项原始转写记录,每一项原始转写记录对应第一输出文本中的一处转写文本,且第一输出文本中对各转写文本进行标记。本发明还公开了一种文本处理装置、计算机可读存储介质和电子设备。
-
公开(公告)号:CN111026856A
公开(公告)日:2020-04-17
申请号:CN201911249451.8
申请日:2019-12-09
Applicant: 出门问问信息科技有限公司
IPC: G06F16/332 , G06F16/36 , G06F16/68
Abstract: 本发明公开了一种智能交互方法、装置以及计算机可读储存介质,包括:接收用户或者用户终端的请求信息;利用特定实体识别模型对所接收的请求信息进行特定实体识别,提取特定实体;根据所提取的特定实体确定实体类型;根据所确定的实体类型生成问题模板;根据所述特定实体和问题模板,获取对应所述请求信息的反馈信息。通过人工智能技术提取请求信息中的特定实体,并根据特定实体最终生成对应的问题模板,最后根据特定实体和问题模板来获取对应请求信息的反馈信息,相对于现有方案,特定实体和问题模板的设置可以覆盖大量的同类型问题,不需要再通过人工编写大量的问题答案对,大大降低了构建成本。
-
-
-
-
-
-
-
-
-