一种文本排序模型的训练方法和系统

    公开(公告)号:CN110969006A

    公开(公告)日:2020-04-07

    申请号:CN201911217044.9

    申请日:2019-12-02

    Inventor: 孔心宇 张晓彤

    Abstract: 本说明书一个或多个实施例公开了一种文本排序模型的训练方法。所述方法包括:获取查询文本和与所述查询文本相关的正例文本、相似负例文本和随机负例文本;将所述查询文本和与所述查询文本相关的正例文本、相似负例文本和随机负例文本分别组成文本对,采用初始排序模型得到每一个文本对的相似度值,计算所述相似度值中的最大值与其他两个相似度值之间的差值,得到第一差值和第二差值;调整所述初始排序模型的参数,使得所述第一差值和第二差值分别逼近第一阈值和第二阈值,得到目标排序模型。

    针对多轮对话的问题识别方法和装置

    公开(公告)号:CN111400479B

    公开(公告)日:2023-05-23

    申请号:CN202010288411.0

    申请日:2020-04-14

    Abstract: 本说明书实施例提供一种针对多轮对话的问题识别方法和装置,方法基于预先建立的知识图谱进行问题识别,知识图谱包括多个类型的节点,节点之间通过对应类型的连接边进行连接,方法包括:获取当前多轮对话的当前用户文本;通过要素预测模型输出当前用户文本中包括的第一业务要素和/或第一诉求要素;确定知识图谱中对应于当前用户文本的第一文本节点,对应于第一业务要素的第一业务节点和/或对应于第一诉求要素的第一诉求节点;在知识图谱中,以第一文本节点作为初始的当前节点,搜索下一跳节点,直到搜索到标准问句节点,返回对应的标准问句,作为当前用户文本的问题识别结果。能够使得针对多轮对话的问题识别结果具有可解释性。

    一种文本排序模型的训练方法和系统

    公开(公告)号:CN110969006B

    公开(公告)日:2023-03-21

    申请号:CN201911217044.9

    申请日:2019-12-02

    Inventor: 孔心宇 张晓彤

    Abstract: 本说明书一个或多个实施例公开了一种文本排序模型的训练方法。所述方法包括:获取查询文本和与所述查询文本相关的正例文本、相似负例文本和随机负例文本;将所述查询文本和与所述查询文本相关的正例文本、相似负例文本和随机负例文本分别组成文本对,采用初始排序模型得到每一个文本对的相似度值,计算所述相似度值中的最大值与其他两个相似度值之间的差值,得到第一差值和第二差值;调整所述初始排序模型的参数,使得所述第一差值和第二差值分别逼近第一阈值和第二阈值,得到目标排序模型。

    一种训练排序结果选择模型输出标准问法的方法和系统

    公开(公告)号:CN110909147B

    公开(公告)日:2022-06-21

    申请号:CN201911217885.X

    申请日:2019-12-02

    Inventor: 孔心宇 张晓彤

    Abstract: 本说明书一个或多个实施例公开了一种训练排序结果选择模型输出标准问法的方法。所述方法包括:获取排序模型输出的排序序列,使用排序结果选择模型从所述排序序列中确定第一结果,所述第一结果对应预测的标准问法A;判断所述排序序列对应的准确的标准问法B;比较所述预测的标准问法A和所述准确的标准问法B是否一致,是则奖励所述排序结果选择模型,否则惩罚所述排序结果选择模型。

    针对多轮对话的问题识别方法和装置

    公开(公告)号:CN111400479A

    公开(公告)日:2020-07-10

    申请号:CN202010288411.0

    申请日:2020-04-14

    Abstract: 本说明书实施例提供一种针对多轮对话的问题识别方法和装置,方法基于预先建立的知识图谱进行问题识别,知识图谱包括多个类型的节点,节点之间通过对应类型的连接边进行连接,方法包括:获取当前多轮对话的当前用户文本;通过要素预测模型输出当前用户文本中包括的第一业务要素和/或第一诉求要素;确定知识图谱中对应于当前用户文本的第一文本节点,对应于第一业务要素的第一业务节点和/或对应于第一诉求要素的第一诉求节点;在知识图谱中,以第一文本节点作为初始的当前节点,搜索下一跳节点,直到搜索到标准问句节点,返回对应的标准问句,作为当前用户文本的问题识别结果。能够使得针对多轮对话的问题识别结果具有可解释性。

    基于多个模型结果对多轮对话的分类方法和装置

    公开(公告)号:CN111309914A

    公开(公告)日:2020-06-19

    申请号:CN202010138218.9

    申请日:2020-03-03

    Inventor: 王雅芳 孔心宇

    Abstract: 本说明书实施例提供一种基于多个模型结果对多轮对话的分类方法和装置,方法包括:针对目标用户与机器人客服的多轮对话,提取各单轮用户文本;将各单轮用户文本和对应的第一组预测结果输入第一融合模型,得到多轮对话对应的第一融合结果,第一组预测结果通过若干分类模型和若干匹配模型得到,第一组预测结果和第一融合结果属于第一候选标签集合;获取对第二组预测结果进行融合处理得到的第二融合结果,第二组预测结果通过若干匹配模型得到;第二组预测结果和第二融合结果属于第二候选标签集合;根据第一融合结果和第二融合结果,综合确定多轮对话对应的目标分类。能够保证基于多个模型结果对多轮对话的分类效果。

    用于对话推荐物品的交互方法、模型训练方法和装置

    公开(公告)号:CN116932899A

    公开(公告)日:2023-10-24

    申请号:CN202310873184.1

    申请日:2023-07-14

    Inventor: 孔心宇 温祖杰

    Abstract: 本说明书的实施例提供了一种用于对话推荐物品的交互方法和装置。在该用于对话推荐物品的交互方法中,获取目标用户的对话交互历史和当前候选信息集,其中,对话交互历史包括最近一轮对话中的历史行为和目标用户针对历史行为的反馈;根据对话交互历史和当前候选信息集确定目标用户的当前状态特征表征;将当前状态特征表征和最近对话交互特征表征提供给策略网络,得到与目标用户对应的策略表征;将策略表征提供给物品推荐行为预测模型,得到从当前候选信息集中确定的当前预测行为信息,其中,当前预测行为信息包括从当前候选属性信息集中确定的与目标用户的当前状态匹配的候选属性信息或从当前候选物品信息集中确定的候选物品信息。

    用于训练及应用机器学习模型的方法、系统、装置和介质

    公开(公告)号:CN115496225A

    公开(公告)日:2022-12-20

    申请号:CN202211192577.8

    申请日:2022-09-28

    Inventor: 胡翔 孔心宇

    Abstract: 公开了一种用于训练机器学习模型的方法,包括获取包括多个句子及其经标注标签集的训练集,生成句子的解析树并生成句子的标签树,确定该句子的总损失,该总损失等于解析树生成损失和标签树生成损失的加权和;以及使用该训练集训练该机器学习模型以最小化该总损失。本申请还涉及用于训练机器学习模型以及使用该机器学习模型处理句子的系统、装置和介质。

    基于多个模型结果对多轮对话的分类方法和装置

    公开(公告)号:CN111309914B

    公开(公告)日:2023-05-09

    申请号:CN202010138218.9

    申请日:2020-03-03

    Inventor: 王雅芳 孔心宇

    Abstract: 本说明书实施例提供一种基于多个模型结果对多轮对话的分类方法和装置,方法包括:针对目标用户与机器人客服的多轮对话,提取各单轮用户文本;将各单轮用户文本和对应的第一组预测结果输入第一融合模型,得到多轮对话对应的第一融合结果,第一组预测结果通过若干分类模型和若干匹配模型得到,第一组预测结果和第一融合结果属于第一候选标签集合;获取对第二组预测结果进行融合处理得到的第二融合结果,第二组预测结果通过若干匹配模型得到;第二组预测结果和第二融合结果属于第二候选标签集合;根据第一融合结果和第二融合结果,综合确定多轮对话对应的目标分类。能够保证基于多个模型结果对多轮对话的分类效果。

    一种训练排序结果选择模型输出标准问法的方法和系统

    公开(公告)号:CN110909147A

    公开(公告)日:2020-03-24

    申请号:CN201911217885.X

    申请日:2019-12-02

    Inventor: 孔心宇 张晓彤

    Abstract: 本说明书一个或多个实施例公开了一种训练排序结果选择模型输出标准问法的方法。所述方法包括:获取排序模型输出的排序序列,使用排序结果选择模型从所述排序序列中确定第一结果,所述第一结果对应预测的标准问法A;判断所述排序序列对应的准确的标准问法B;比较所述预测的标准问法A和所述准确的标准问法B是否一致,是则奖励所述排序结果选择模型,否则惩罚所述排序结果选择模型。

Patent Agency Ranking