用于推送知识点的数据处理、训练方法及装置

    公开(公告)号:CN111475637B

    公开(公告)日:2020-10-09

    申请号:CN202010588724.8

    申请日:2020-06-24

    Abstract: 本说明书实施例提供一种用于推送知识点的数据处理、训练方法及装置,基于异构图提取符合预设格式的多组元路径,获取异构图中各个节点的对应的第一特征,然后将多组元路径输入预先训练得到的图神经网络模型,通过图神经网络模型对元路径上节点的第一特征进行聚合,至少输出作为路径端点的用户节点和/或知识点节点对应的第二特征,第二特征用于对用户节点和知识点节点进行匹配,以向用户推送相应知识点。该方案能够更精确地匹配用户需求。

    群聊机器人自主应答的方法和系统

    公开(公告)号:CN111368059B

    公开(公告)日:2020-09-15

    申请号:CN202010461146.1

    申请日:2020-05-27

    Abstract: 本说明书提供的群聊机器人自主应答的方法和系统,在接收到所述目标通讯群中的目标用户发送的输入语句后,基于输入语句和预设的知识库生成一个与输入语句相关的候选列表,并将所述候选列表发送给目标客户端或包括目标客户端在内的第一组客户端,以降低对其他用户的影响;在第一组客户端的管理客户端对候选列表做出选择后,再将与选择匹配的目标答案发送给第二组客户端。所述方法不仅可以主动对用户提出的问题进行回答,同时又不会对群聊中的其他用户造成干扰,在提升工作效率的同时,又可以提升用户体验。

    一种用户意图的语料扩展方法和系统

    公开(公告)号:CN111339309B

    公开(公告)日:2020-09-04

    申请号:CN202010440488.5

    申请日:2020-05-22

    Abstract: 本说明书的实施例公开了一种用户意图的语料扩展方法,该方法包括:获取第一服务话术和用户意图,所述用户意图为回答所述第一服务话术的话语所代表的意图;从至少一条第二服务话术中,确定与所述第一服务话术的相似度满足第一预设条件的至少一条第三服务话术,所述第二服务话术为对话记录中的服务话术;确定至少一条候选扩展语料,所述候选扩展语料为所述对话记录中回答所述至少一条第三服务话术的话语;从所述至少一条候选扩展语料中,确定至少一条目标扩展语料,所述目标扩展语料的意图与所述用户意图相同或者相近;将所述至少一条目标扩展语料作为所述用户意图的扩展语料。

    一种训练词语权重模型的方法和系统

    公开(公告)号:CN111324722B

    公开(公告)日:2020-08-14

    申请号:CN202010409812.7

    申请日:2020-05-15

    Abstract: 本说明书实施例提供一种训练词语权重模型的方法和系统。所述方法包括:获取多个文本对;判断所述文本对中两个文本之间是否匹配,得到匹配结果;基于所述匹配结果确定所述文本对中文本的词语的重要性标识,得到含有所述重要性标识的多个文本对;基于多个训练数据训练词语权重模型,所述训练数据来源于含有所述重要性标识的多个文本对中的文本。

    话术推荐方法、装置和电子设备

    公开(公告)号:CN111522937A

    公开(公告)日:2020-08-11

    申请号:CN202010409704.X

    申请日:2020-05-15

    Abstract: 本说明书实施例提出了一种话术推荐方法、装置和电子设备,其中,上述话术推荐方法中,获取当前对话中用户输入的对话上文之后,可以对上述对话上文进行词编码,获得上述对话上文对应的词向量;然后通过神经网络对上述词向量进行特征表示,获得上述词向量对应的特征向量,通过预先训练的话术推荐模型对上述特征向量进行分类,获得上述特征向量分类到每个种子话术的置信度;最后,根据上述置信度选择种子话术,并在当前对话中推荐所选择的种子话术。

    智能客服场景中的知识点召回方法及装置

    公开(公告)号:CN111461753A

    公开(公告)日:2020-07-28

    申请号:CN202010302538.3

    申请日:2020-04-17

    Abstract: 本说明书实施例提供一种智能客服场景中的知识点召回方法及装置,在召回方法中,获取分层可导航小世界图HNSW,该HNSW包括上下排列的多层NSW。获取待召回知识点的用户问句,并确定用户问句的句子向量。从最上层NSW开始,按照从上到下的顺序对各层NSW进行层搜索。该层搜索包括:根据当前层NSW所包含的节点的连接关系,从其所包含的节点中,搜索距离句子向量最近的第一节点,经由该第一节点进入下一层NSW,直至到达最下层NSW。在最下层NSW中,根据N个节点的连接关系,从中搜索距离句子向量最近的目标节点。将目标节点所代表的类簇中心对应的知识点类簇作为目标类簇,并从归属于目标类簇的各知识点标题对应的知识点中,召回与用户问句相匹配的知识点。

    多任务模型的训练方法及装置

    公开(公告)号:CN111310848A

    公开(公告)日:2020-06-19

    申请号:CN202010131419.6

    申请日:2020-02-28

    Abstract: 本说明书实施例提供一种多任务模型的训练方法及装置,在训练方法中,获取训练样本集,该训练样本集中的每个样本包括由一个问题和多个历史会话对组成的输入文本、第一标签和第二标签。对于任意的第一训练样本,将其中的输入文本输入文本编码层,得到输入文本的文本向量。从文本向量中确定出多个答案中各答案的语义向量。将各答案的语义向量输入问答相关性分类层,通过输出得到第一预测结果。基于第一预测结果和第一标签,确定第一预测损失。将文本向量输入答案选择层,通过输出得到第二预测结果。基于第二预测结果和第二标签,确定第二预测损失。基于训练样本集中各样本的第一预测损失与第二预测损失的融合结果,调整多任务模型的参数。

    基于源问题生成相似问题的方法和装置

    公开(公告)号:CN111309893A

    公开(公告)日:2020-06-19

    申请号:CN202010410003.8

    申请日:2020-05-15

    Inventor: 彭爽 崔恒斌

    Abstract: 本说明书实施例提供一种基于源问题生成相似问题的方法和装置,方法包括:获取源问题;对所述源问题进行分词处理,得到多个分词;从所述多个分词中提取至少一个关键词,并获取所述至少一个关键词的同义词和/或近义词,作为辅助信息;将所述辅助信息和所述源问题输入文本生成模型,通过所述文本生成模型输出所述源问题的相似问题。能够提升知识库中的标准问题对用户问题的覆盖率。

    一种用户意图预测方法和系统

    公开(公告)号:CN111274787A

    公开(公告)日:2020-06-12

    申请号:CN202010108943.1

    申请日:2020-02-21

    Abstract: 本说明书的实施例公开了一种用户意图预测方法和系统。该方法包括:获取与用户相关的一个或多个因子信息;所述因子信息至少反映用户在某服务平台内的操作行为;基于所述因子信息确定多个候选意图文本;基于语言模型处理所述多个候选意图文本以及所述因子信息,得到多个相关度;多个相关度分别反映所述多个候选意图文本与所述因子信息的相关性;以及,至少基于所述多个相关度从所述多个候选意图文本中确定目标意图文本。

Patent Agency Ranking