一种训练问题识别模型的方法和系统

    公开(公告)号:CN111340218B

    公开(公告)日:2022-04-15

    申请号:CN202010113810.3

    申请日:2020-02-24

    Abstract: 本说明书实施例公开了一种训练问题识别模型的方法和系统,所述方法包括:获取多个第一文本和多个第二文本,所述第一文本和所述第二文本分别为问题类文本和非问题类文本;生成模型基于所述第一文本与所述第二文本之间的相似度,为所述第一文本选择满足第一预设条件的至少一个所述第二文本,生成至少一个文本对;将所述文本对输入初始问题识别模型进行训练,训练得到目标问题识别模型。

    用于推送知识点的数据处理、训练方法及装置

    公开(公告)号:CN111475637B

    公开(公告)日:2020-10-09

    申请号:CN202010588724.8

    申请日:2020-06-24

    Abstract: 本说明书实施例提供一种用于推送知识点的数据处理、训练方法及装置,基于异构图提取符合预设格式的多组元路径,获取异构图中各个节点的对应的第一特征,然后将多组元路径输入预先训练得到的图神经网络模型,通过图神经网络模型对元路径上节点的第一特征进行聚合,至少输出作为路径端点的用户节点和/或知识点节点对应的第二特征,第二特征用于对用户节点和知识点节点进行匹配,以向用户推送相应知识点。该方案能够更精确地匹配用户需求。

    一种训练词语权重模型的方法和系统

    公开(公告)号:CN111324722B

    公开(公告)日:2020-08-14

    申请号:CN202010409812.7

    申请日:2020-05-15

    Abstract: 本说明书实施例提供一种训练词语权重模型的方法和系统。所述方法包括:获取多个文本对;判断所述文本对中两个文本之间是否匹配,得到匹配结果;基于所述匹配结果确定所述文本对中文本的词语的重要性标识,得到含有所述重要性标识的多个文本对;基于多个训练数据训练词语权重模型,所述训练数据来源于含有所述重要性标识的多个文本对中的文本。

    多任务模型的训练方法及装置

    公开(公告)号:CN111310848A

    公开(公告)日:2020-06-19

    申请号:CN202010131419.6

    申请日:2020-02-28

    Abstract: 本说明书实施例提供一种多任务模型的训练方法及装置,在训练方法中,获取训练样本集,该训练样本集中的每个样本包括由一个问题和多个历史会话对组成的输入文本、第一标签和第二标签。对于任意的第一训练样本,将其中的输入文本输入文本编码层,得到输入文本的文本向量。从文本向量中确定出多个答案中各答案的语义向量。将各答案的语义向量输入问答相关性分类层,通过输出得到第一预测结果。基于第一预测结果和第一标签,确定第一预测损失。将文本向量输入答案选择层,通过输出得到第二预测结果。基于第二预测结果和第二标签,确定第二预测损失。基于训练样本集中各样本的第一预测损失与第二预测损失的融合结果,调整多任务模型的参数。

    一种用户意图预测方法和系统

    公开(公告)号:CN111274787A

    公开(公告)日:2020-06-12

    申请号:CN202010108943.1

    申请日:2020-02-21

    Abstract: 本说明书的实施例公开了一种用户意图预测方法和系统。该方法包括:获取与用户相关的一个或多个因子信息;所述因子信息至少反映用户在某服务平台内的操作行为;基于所述因子信息确定多个候选意图文本;基于语言模型处理所述多个候选意图文本以及所述因子信息,得到多个相关度;多个相关度分别反映所述多个候选意图文本与所述因子信息的相关性;以及,至少基于所述多个相关度从所述多个候选意图文本中确定目标意图文本。

    一种平衡多个任务的方法及系统

    公开(公告)号:CN110909885A

    公开(公告)日:2020-03-24

    申请号:CN201911139061.5

    申请日:2019-11-19

    Inventor: 陈晓军 崔恒斌

    Abstract: 本说明书一个或多个实施例公开了一种平衡多个任务的方法。所述方法包括:获取第一任务的第一损失函数和至少一个第二任务的第二损失函数,所述第一损失函数对应主任务,所述至少一个第二损失函数对应至少一个辅任务;根据所述第一损失函数得到第一损失函数对应的第一损失函数值;根据所述第二损失函数得到第二损失函数对应的第二损失函数值;根据所述第一损失函数值和所述至少一个第二损失函数值之间的大小关系,确定至少一个平衡参数;所述至少一个平衡参数用于将所述至少一个第二损失函数和所述第一损失函数调整至同一量级;使用所述至少一个平衡参数,确定第一损失函数和至少一个第二损失函数对应的联合损失函数。

    一种文本相似度计算方法及系统

    公开(公告)号:CN110750977A

    公开(公告)日:2020-02-04

    申请号:CN201911009970.7

    申请日:2019-10-23

    Abstract: 本说明书实施例公开了一种文本相似度计算方法及系统。所述方法包括:获取第一文本和第二文本;所述第一文本和所述第二文本存在第一编辑距离,所述第一编辑距离小于预设第一编辑距离阈值;根据所述第一文本和所述第二文本之间的差异,提取第一差异文本和第二差异文本;至少根据所述第一文本和所述第二文本提取对应的第一特征向量;至少根据所述第一差异文本和所述第二差异文本提取对应的第二特征向量;基于所述第一特征向量和所述第二特征向量,获得第三特征向量;并基于所述第三特征向量,确定所述第一文本和所述第二文本之间的相似度。

Patent Agency Ranking