一种语音数据的处理方法及装置

    公开(公告)号:CN108899036A

    公开(公告)日:2018-11-27

    申请号:CN201810549538.6

    申请日:2018-05-31

    Abstract: 本发明实施例提供一种语音数据的处理方法及装置,所述方法包括:获得来自第一用户的操作信息;基于所述操作信息,确定第一用户对应的用户意图信息;如果所述用户意图信息用于指示播放来自第二用户的语音留言,基于所述用户意图信息,获取与所述用户意图信息对应的待播放的第一语音留言数据,其中,所述第一语音留言数据由第二用户录制;播放所述第一语音留言数据。如此,通过识别用户意图信息来获取待播放的语音留言数据并进行播放,能够丰富智能音频设备的功能和提高智能音频设备的智能程度。

    一种实体识别方法、设备及计算机可读存储介质

    公开(公告)号:CN111259134B

    公开(公告)日:2023-08-08

    申请号:CN202010057489.1

    申请日:2020-01-19

    Abstract: 本发明公开了一种实体识别方法、设备及计算机可读存储介质,所述方法包括:第一操作,通过实体库对指定文本进行标注,确定对应所述指定文本的训练集和测试集;所述训练集包括标注文本集和半标注文本集;第二操作,通过所述训练集对模型进行训练,基于训练获得的实体识别模型对所述测试集进行预测,筛选获得有效实体;第三操作,将所述有效实体加入所述实体库,基于所述实体库重新确定半标注文本集;重复循环第二操作和第三操作,获得目标实体库。应用本发明实施例提供的方法能够实现自动扩充目标实体库中的实体数量的目的,并且能够自动标注大量未标注的文本。

    一种数据处理方法、装置及计算机存储介质和电子设备

    公开(公告)号:CN111274374B

    公开(公告)日:2023-05-23

    申请号:CN202010060935.4

    申请日:2020-01-19

    Abstract: 本发明公开了一种数据处理方法、装置及计算机存储介质和电子设备,方法包括:获取初始语料,所述初始语料至少包括对话目标和历史语料;对所述初始语料进行词向量转换,得到语料词向量;根据所述语料词向量进行分类训练,得到分类结果;根据所述分类结果判断所述对话目标是否完成。本发明提供的数据处理方法、装置及计算机存储介质和电子设备,通过引入对话目标来约束对话,并把对话目标的完成与否当作分类任务来进行分类训练判断对话目标是否完成,若完成则不再对同一对话目标进行无意义的回复;若对话目标未完成,则据此生成更为符合对话目标的回复文本来约束对话,以产生更有价值的对话,最终有助于提高对话机器人的用户满意度,提高商业价值。

    一种对话目标序列的生成方法、装置以及可读存储介质

    公开(公告)号:CN111259128A

    公开(公告)日:2020-06-09

    申请号:CN202010057755.0

    申请日:2020-01-19

    Abstract: 本发明公开了一种对话目标序列的生成方法、装置以及可读存储介质,包括:获取当前时刻的输入信息和前一时刻的对话目标;根据所获取输入信息和对话目标,判断所述输入信息所对应的对话目标是否发生转移;根据判断结果,确定对话目标序列。由此,通过引入包含多个对话目标的对话目标序列,对话系统能同时执行对话目标序列中的多个对话目标,以此来解决单目标开放域对话的局限性,进而提高了用户的体验感。

    混合文语转换方法及装置、终端和计算机可读存储介质

    公开(公告)号:CN111179904A

    公开(公告)日:2020-05-19

    申请号:CN201911421451.1

    申请日:2019-12-31

    Abstract: 本发明公开了一种混合文语转换方法及装置、终端和计算机可读存储介质,该方法包括:获取混合语言文本信息;对所述混合语言文本信息进行分词,得到多种语言类型的语言分词;对于每种语言类型的所述语言分词,通过所述语言分词所属的所述语言类型对应的音标映射方式将所述语言分词转换为语音信息。通过本发明的技术方案,实现了对混合语言文本信息的快捷文语转换,提升了对混合语言文本信息进行文语转换的准确性和效率。

Patent Agency Ranking