客服场景下用户问句的回复方法、装置及设备

    公开(公告)号:CN110765253B

    公开(公告)日:2023-03-31

    申请号:CN201911008117.3

    申请日:2019-10-22

    Abstract: 本说明书实施例提供一种客服场景下用户问句的回复方法、装置及设备,在回复方法中,接收第一租户下的当前用户问句。针对当前用户问句,获取当前用户问句的上下文信息。基于第一租户的租户标识、当前用户问句和上下文信息,生成新用户问句。基于新用户问句,从与第一租户对应的知识库中召回预定数目个答案。将预定数目个答案中的各答案以及新用户问句输入预测模型,以预测各答案与新用户问句的匹配分数。该预测模型包括多个租户共享的底层网络部分和多个租户分别对应的多个上层网络部分,多个上层网络部分具有相同的网络结构,以及针对不同租户训练得到的不同网络参数。基于匹配分数,从各答案中确定出目标答案并返回。

    一种扩展文本样本的方法及系统

    公开(公告)号:CN110727767B

    公开(公告)日:2022-05-31

    申请号:CN201911000025.0

    申请日:2019-10-21

    Inventor: 陈晓军 崔恒斌

    Abstract: 本说明书实施例公开了一种扩展文本样本的方法及系统。所述方法包括:将第一文本在文本库中检索,获取与所述第一文本的相似度在设定区间的多个第二文本;基于所述第一文本和所述多个第二文本中的每一个在知识库中检索,确定所述第一文本的第一检索结果和所述第二文本的第二检索结果;所述知识库至少包含与所述第一文本关联的多个文本;判断所述第一检索结果和所述第二检索结果之间的关系是否满足预设条件;将满足所述预设条件的所述第二文本确定为所述第一文本的扩展文本。

    一种问题生成方法及装置
    53.
    发明授权

    公开(公告)号:CN111737440B

    公开(公告)日:2021-03-05

    申请号:CN202010759189.8

    申请日:2020-07-31

    Inventor: 彭爽 崔恒斌

    Abstract: 一种问题生成方法及装置,所述方法包括:基于预设的原始问题库与参考问题库中的问题样本,对问题生成模型进行模仿学习训练;其中,所述问题生成模型用于根据输入的原始问题,生成语义相似的目标问题;所述参考问题库用于在所述模仿学习训练过程中,提供与原始问题语义相似的问题样本作为模仿对象;获取原始问题;将所述原始问题输入模仿学习训练完成的所述问题生成模型,生成与所述原始问题语义相似的目标问题。

    答案文本的处理方法和装置、关键文本的确定方法

    公开(公告)号:CN111737443B

    公开(公告)日:2020-11-20

    申请号:CN202010818292.5

    申请日:2020-08-14

    Abstract: 本说明书提供了答案文本的处理方法和装置、关键文本的确定方法。在一个实施例中,基于上述答案文本的数据处理方法,通过先从预设的知识库中确定出与目标问题匹配的答案文本作为目标答案文本;再通过从目标答案文本中识别确定出与目标问题关联性较强且用户关注度较高的关键文本,并在目标答案文本中标注出上述关键文本;进而可以在向用户所展示的目标答案文本中标识出上述关键文本,使得用户可以方便、高效地读取到目标答案文本中用户所需要的、价值较高的关键信息。

    一种机器阅读标注数据的生成方法和装置

    公开(公告)号:CN111488448A

    公开(公告)日:2020-08-04

    申请号:CN202010459357.1

    申请日:2020-05-27

    Inventor: 彭爽 崔恒斌

    Abstract: 本发明实施例提供了一种机器阅读标注数据的生成方法,该方法包括:获取第一人工对话日志,其中包含多轮问答对话语句;根据预先统计得到的高频答案语句集合,从多轮问答对话语句中确定出第一高频答案语句;对于多轮问答对话语句中位于第一高频答案语句之前的若干问题语句中的任意问题语句,根据第一高频答案语句与该任意问题语句之间的语义相似度,以及根据该两者之间的文本间隔距离,确定对应的总相关度;从若干问题语句中提取与第一高频答案的总相关度最高的问题语句,作为第一问题语句;根据第一人工对话日志、第一高频答案语句和第一问题语句,生成带有标注的机器阅读数据。

    数据挖掘的方法和系统
    56.
    发明公开

    公开(公告)号:CN111475652A

    公开(公告)日:2020-07-31

    申请号:CN202010441154.X

    申请日:2020-05-22

    Abstract: 本说明书提供的数据挖掘的方法和系统,通过聚类算法对海量的样本数据进行聚类,生成多个样本簇,每个样本簇中的多个样本数据对应相似的话题;从所述样本簇中选取样本数据数量最多的至少一个样本簇作为热门话题;并通过意图识别模型对热门话题中的样本数据进行分类,从中识别出有价值的样本数据。所述方法和系统可以对海量数据进行聚类,从而挖掘出共性的问题,以进行批量解决,大大提高了工作效率;同时,所述方法和系统可以从海量数据中挖掘出对产品经理有价值的信息,以帮助产品经理从用户的角度解决用户的诉求,大大提升了产品的体验感,提高用户满意度。

    用于推送知识点的数据处理、训练方法及装置

    公开(公告)号:CN111475637A

    公开(公告)日:2020-07-31

    申请号:CN202010588724.8

    申请日:2020-06-24

    Abstract: 本说明书实施例提供一种用于推送知识点的数据处理、训练方法及装置,基于异构图提取符合预设格式的多组元路径,获取异构图中各个节点的对应的第一特征,然后将多组元路径输入预先训练得到的图神经网络模型,通过图神经网络模型对元路径上节点的第一特征进行聚合,至少输出作为路径端点的用户节点和/或知识点节点对应的第二特征,第二特征用于对用户节点和知识点节点进行匹配,以向用户推送相应知识点。该方案能够更精确地匹配用户需求。

    基于图结构的知识点推荐方法及装置

    公开(公告)号:CN111460085A

    公开(公告)日:2020-07-28

    申请号:CN202010307133.9

    申请日:2020-04-17

    Abstract: 本说明书的实施例提供基于图结构的知识点推荐方法及装置。在该知识点推荐方法中,基于历史连续问答会话数据构建知识图谱,知识图谱是有向图结构,节点表示知识点,有向边的方向表示所连接的知识点对的出现顺序,以及有向边的边权重用于反映对应的知识点对的出现次数。在接收用户的问题语句后,在知识库中获取与问题语句对应的第一知识点;在知识图谱中确定与第一知识点关联的第二知识点,并将所确定的第二知识点中的问题推荐给用户。

    一种训练文本关键内容提取模型的方法和系统

    公开(公告)号:CN111401042A

    公开(公告)日:2020-07-10

    申请号:CN202010223432.4

    申请日:2020-03-26

    Abstract: 本说明书实施例公开了一种训练文本关键内容提取模型的方法和系统。所述方法包括:获取若干个训练样本,所述训练样本包括问题和拼接文档,所述拼接文档包括对应于所述问题的关键内容、干扰内容以及与所述关键内容和干扰内容对应的分隔符;基于所述问题和所述拼接文档,利用机器阅读模型处理得到对应的表示向量;利用所述表示向量训练初始模型得到文本关键内容提取模型,其中,所述文本关键内容提取模型的输出为所述拼接文档中与每一内容对应的分隔符的预测值;基于所述预测值,构建损失函数,迭代优化所述文本关键内容提取模型。本说明书采用用户的反馈数据构造训练样本,可以有效提升机器阅读模型的质量和难度。

    一种训练文本相似度模型的方法和系统

    公开(公告)号:CN111353033A

    公开(公告)日:2020-06-30

    申请号:CN202010126357.X

    申请日:2020-02-27

    Abstract: 本说明书实施例公开了一种训练文本相似度模型的方法及系统,该方法包括:获取多组训练数据,多组训练数据中的一组包括:第一文本、第二文本和第三文本,第二文本和第三文本为用户输入的询问内容,第一文本为知识库中对应于第二文本和第三文本的问题;其中,第二文本为与第一文本匹配的用户反馈好评的文本,第三文本为与第一文本不匹配的用户反馈差评的文本;基于多组训练数据调整文本相似度模型的参数进而优化损失函数,得到训练后的文本相似度模型;其中,损失函数基于第一相似度和第二相似度的相对关系确定;第一相似度为文本相似度模型基于第一文本和第二文本计算的相似度,第二相似度为文本相似度模型基于第一文本与第三文本计算的相似度。

Patent Agency Ranking