基于深度学习的文本机器人训练方法、系统、设备及介质

    公开(公告)号:CN116468050A

    公开(公告)日:2023-07-21

    申请号:CN202310538987.1

    申请日:2023-05-12

    Abstract: 本发明公开了一种基于深度学习的文本机器人训练方法、系统、设备及介质,所述方法包括:基于原始意图整理预设数量的种子语料,将种子语料导入到文本机器人知识库中;识别所有意图中的问题数据,并对问题数据进行修正;所有意图包括原始意图和种子语料;对所有意图进行批量扩写;识别扩写后的意图中是否包含混淆语料;当包含时,对混淆语料进行修正;通过原始意图、种子语料和扩写后的修正意图训练文本机器人模型;验证文本机器人模型是否符合预期;当不符合预期时,通过对单个意图进行扩写或对单个语料做调整或扩写,再次训练文本机器人模型,直至文本机器人模型符合预期。通过本公开的处理方案,可以高效、准确的对文本机器人进行训练。

    多轮对话机器人意图命中优化方法及装置

    公开(公告)号:CN112487144B

    公开(公告)日:2024-08-23

    申请号:CN202011377801.1

    申请日:2020-11-30

    Abstract: 本发明提供了一种多轮对话机器人意图命中优化方法及装置。该方法包括:获取多轮对话机器人的对话日志和机器人流程配置数据;通过数据预处理,形成对话流程树数据结构,构建文本意图命中列表;依据上下文关系构建未识别意图文本与上一对话流程节点映射关系;在需要优化的流程节点,使用文本聚类算法对未识别意图文本按当前节点后继意图类别进行聚类;对聚类结果进行审核;根据审核结果,优化机器人流程配置数据。本发明提供的多轮对话机器人意图命中优化方法及装置能够实现机器人意图识别能力高效、有针对性的优化。

    文本相似度最佳阈值自动寻找及优化方法及装置

    公开(公告)号:CN112329428A

    公开(公告)日:2021-02-05

    申请号:CN202011374448.1

    申请日:2020-11-30

    Abstract: 本发明提供了一种文本相似度最佳阈值自动寻找及优化方法及装置。该方法包括:根据问题列表中每个问题的向量表示,计算问题相似度矩阵;遍历问题类别及问题相似度矩阵,得到问题类别平均相似度矩阵;判断是否有类间问题相似度大于类别平均相似度;如果有,则发现存在的配置问题,并重复上述操作,直至不再存在类间问题相似度大于类别平均相似度的情况;当不再存在类间问题相似度大于类别平均相似度的情况时,遍历问题类别平均相似度矩阵,得到最优相似度阈值。本发明提供的文本相似度最佳阈值自动寻找及优化方法及装置能够自动寻找适合该机器人已配置数据集的相似度阈值。

    文本相似度最佳阈值自动寻找及优化方法及装置

    公开(公告)号:CN112329428B

    公开(公告)日:2024-08-27

    申请号:CN202011374448.1

    申请日:2020-11-30

    Abstract: 本发明提供了一种文本相似度最佳阈值自动寻找及优化方法及装置。该方法包括:根据问题列表中每个问题的向量表示,计算问题相似度矩阵;遍历问题类别及问题相似度矩阵,得到问题类别平均相似度矩阵;判断是否有类间问题相似度大于类别平均相似度;如果有,则发现存在的配置问题,并重复上述操作,直至不再存在类间问题相似度大于类别平均相似度的情况;当不再存在类间问题相似度大于类别平均相似度的情况时,遍历问题类别平均相似度矩阵,得到最优相似度阈值。本发明提供的文本相似度最佳阈值自动寻找及优化方法及装置能够自动寻找适合该机器人已配置数据集的相似度阈值。

    多轮对话机器人意图命中优化方法及装置

    公开(公告)号:CN112487144A

    公开(公告)日:2021-03-12

    申请号:CN202011377801.1

    申请日:2020-11-30

    Abstract: 本发明提供了一种多轮对话机器人意图命中优化方法及装置。该方法包括:获取多轮对话机器人的对话日志和机器人流程配置数据;通过数据预处理,形成对话流程树数据结构,构建文本意图命中列表;依据上下文关系构建未识别意图文本与上一对话流程节点映射关系;在需要优化的流程节点,使用文本聚类算法对未识别意图文本按当前节点后继意图类别进行聚类;对聚类结果进行审核;根据审核结果,优化机器人流程配置数据。本发明提供的多轮对话机器人意图命中优化方法及装置能够实现机器人意图识别能力高效、有针对性的优化。

Patent Agency Ranking