一种对话辅助方法、系统及装置

    公开(公告)号:CN112084318B

    公开(公告)日:2024-02-20

    申请号:CN202011024999.5

    申请日:2020-09-25

    Abstract: 本申请实施例公开了一种对话辅助方法、系统和装置,其中,所述方法包括:显示对话界面;获取所述对话的当前话语信息,以及所述对话中当前话语的上文信息;基于所述当前话语信息,确定一个或多个适配的预设话术推荐算法;利用所述预设话术推荐算法处理所述当前话语对应的文本数据以及所述上文信息,确定至少一个推荐话术;所述预设话术推荐算法至少包括基于机器学习的推荐算法,或基于规则的推荐算法;在对话界面显示至少一个推荐话术。由此,可以向进行对话的人员提供话术推荐,提高对话的效率。

    用于文本分类的神经网络系统的训练方法及装置

    公开(公告)号:CN112100387B

    公开(公告)日:2021-02-19

    申请号:CN202011269071.3

    申请日:2020-11-13

    Abstract: 本说明书实施例提供一种用于文本分类的神经网络系统的训练方法,该神经网络系统包括文本表征网络、特征提取层和分类网络。该训练方法包括:首先,获取训练文本集,该训练文本集对应K个类别;接着,针对该训练文本集中任一的第一训练文本,利用上述文本表征网络对其进行处理,得到第一文本向量;然后,利用上述特征提取层,将该第一文本向量分别与对应所述K个类别的K个类别特征向量进行组合操作,得到K个特征提取向量;再接着,基于该K个特征提取向量和上述分类网络,确定分类预测结果;再然后,基于该分类预测结果和上述第一训练文本的类别标签,训练上述神经网络系统。

    一种从对话语料中抽取对话策略结构的方法及系统

    公开(公告)号:CN112115248A

    公开(公告)日:2020-12-22

    申请号:CN202011034369.6

    申请日:2020-09-27

    Abstract: 本说明书一个或多个实施例涉及一种从对话语料中抽取对话策略结构的方法及系统,所述方法包括:获取所述对话语料的多个客服语料;其中,所述客服语料中包括多个按序排列的问题信息;基于特征提取算法对所述客服语料中的问题信息进行特征化处理,得到问题信息对应的特征向量;基于聚类算法将所述问题信息对应的特征向量聚类为多个问题聚类簇;基于所述多个按序排列的问题信息获取各问题聚类簇在所述多个客服语料中的顺序标识;基于关联规则算法对各问题聚类簇及其顺序标识进行处理,获取目标问题序列;基于所述目标问题序列确定所述对话策略结构。

    多任务模型的训练方法及装置

    公开(公告)号:CN111310848A

    公开(公告)日:2020-06-19

    申请号:CN202010131419.6

    申请日:2020-02-28

    Abstract: 本说明书实施例提供一种多任务模型的训练方法及装置,在训练方法中,获取训练样本集,该训练样本集中的每个样本包括由一个问题和多个历史会话对组成的输入文本、第一标签和第二标签。对于任意的第一训练样本,将其中的输入文本输入文本编码层,得到输入文本的文本向量。从文本向量中确定出多个答案中各答案的语义向量。将各答案的语义向量输入问答相关性分类层,通过输出得到第一预测结果。基于第一预测结果和第一标签,确定第一预测损失。将文本向量输入答案选择层,通过输出得到第二预测结果。基于第二预测结果和第二标签,确定第二预测损失。基于训练样本集中各样本的第一预测损失与第二预测损失的融合结果,调整多任务模型的参数。

    基于源问题生成相似问题的方法和装置

    公开(公告)号:CN111309893A

    公开(公告)日:2020-06-19

    申请号:CN202010410003.8

    申请日:2020-05-15

    Inventor: 彭爽 崔恒斌

    Abstract: 本说明书实施例提供一种基于源问题生成相似问题的方法和装置,方法包括:获取源问题;对所述源问题进行分词处理,得到多个分词;从所述多个分词中提取至少一个关键词,并获取所述至少一个关键词的同义词和/或近义词,作为辅助信息;将所述辅助信息和所述源问题输入文本生成模型,通过所述文本生成模型输出所述源问题的相似问题。能够提升知识库中的标准问题对用户问题的覆盖率。

    一种文本分类的方法和系统

    公开(公告)号:CN112948580B

    公开(公告)日:2023-05-12

    申请号:CN202110154293.9

    申请日:2021-02-04

    Inventor: 彭爽 杨明晖

    Abstract: 本说明书实施例提供了一种文本分类的方法和系统。所述方法包括:获取待分类文本;确定所述待分类文本中的至少一个关键词;通过文本分类模型处理所述至少一个关键词及所述待分类文本,确定所述待分类文本的类别。可以通过文本分类模型,基于待分类文本及待分类文本对应的至少一个关键词的特征信息确定待分类文本的类别,可以实现在待分类文本中融合上关键词嵌入信息,从而更准确地完成文本分类。

    一种训练文本关键内容提取模型的方法和系统

    公开(公告)号:CN111401042B

    公开(公告)日:2023-04-14

    申请号:CN202010223432.4

    申请日:2020-03-26

    Abstract: 本说明书实施例公开了一种训练文本关键内容提取模型的方法和系统。所述方法包括:获取若干个训练样本,所述训练样本包括问题和拼接文档,所述拼接文档包括对应于所述问题的关键内容、干扰内容以及与所述关键内容和干扰内容对应的分隔符;基于所述问题和所述拼接文档,利用机器阅读模型处理得到对应的表示向量;利用所述表示向量训练初始模型得到文本关键内容提取模型,其中,所述文本关键内容提取模型的输出为所述拼接文档中与每一内容对应的分隔符的预测值;基于所述预测值,构建损失函数,迭代优化所述文本关键内容提取模型。本说明书采用用户的反馈数据构造训练样本,可以有效提升机器阅读模型的质量和难度。

    知识库管理方法、装置及处理设备

    公开(公告)号:CN111459917B

    公开(公告)日:2023-02-28

    申请号:CN202010302438.0

    申请日:2020-04-17

    Abstract: 本说明书提供一种知识库管理方法、装置及处理设备,可以针对群聊服务场景,对于群聊用户多,角色不清晰的聊天内容进行对话响应关系的确定,再基于对话响应关系进行问答信息的挖掘,确定出候选问答信息。利用人工客服对候选问答信息的点击采纳实现对候选问答信息进行反馈验证,将采纳率大于预设阈值的候选问答信息添加知识库中,可以不需要运营人员参与,实现了知识库的自动更新以及零运营管理。

Patent Agency Ranking