对话状态识别模型训练及对话状态识别方法以及装置

    公开(公告)号:CN116822605A

    公开(公告)日:2023-09-29

    申请号:CN202310598854.3

    申请日:2023-05-22

    Abstract: 本说明书实施例公开了一种对话状态识别模型训练及对话状态识别方法以及装置。将样本对话数据输入对话状态识别模型,基于编码层对样本对话数据进行编码,生成样本对话数据的样本隐状态;基于解码层对样本隐状态进行解码,生成至少一种预设类型的对话状态槽位对应的样本槽值;根据样本对话数据对应的标准槽值和样本槽值,训练对话状态识别模型。通常对话内容隐状态能够体现对话内容中包含的特征含义,因此对话状态识别模型就能够从中解析到对话内容中包含的对话状态,基于对话内容的准确分析就可以使得对话状态识别模型生成隐含的抽象对话状态。

    数据处理方法、装置、电子设备及计算机存储介质

    公开(公告)号:CN114443824A

    公开(公告)日:2022-05-06

    申请号:CN202210078998.1

    申请日:2022-01-24

    Abstract: 本说明书实施例公开了一种数据处理方法、装置、电子设备及计算机存储介质。其中,该方法包括:通过将接收到的用户问题以及从预设问答数据集中查询得到与上述用户问题相关的N种信息源输入问答模型中,从而得到该用户问题的目标答案。上述N为大于或等于2的正整数;上述N种信息源中存在至少两种信息源相关联;上述问答模型基于多个用户问题、上述多个用户问题对应的N种信息源以及上述多个用户问题对应的多个标准答案训练得到。

    数据处理方法、装置、电子设备及计算机存储介质

    公开(公告)号:CN114443824B

    公开(公告)日:2024-08-02

    申请号:CN202210078998.1

    申请日:2022-01-24

    Abstract: 本说明书实施例公开了一种数据处理方法、装置、电子设备及计算机存储介质。其中,该方法包括:通过将接收到的用户问题以及从预设问答数据集中查询得到与上述用户问题相关的N种信息源输入问答模型中,从而得到该用户问题的目标答案。上述N为大于或等于2的正整数;上述N种信息源中存在至少两种信息源相关联;上述问答模型基于多个用户问题、上述多个用户问题对应的N种信息源以及上述多个用户问题对应的多个标准答案训练得到。

    对话意图识别方法、装置、存储介质及电子设备

    公开(公告)号:CN116861917A

    公开(公告)日:2023-10-10

    申请号:CN202310760483.4

    申请日:2023-06-26

    Inventor: 杜冰竹 王永亮

    Abstract: 本说明书公开了一种对话意图识别方法、装置、存储介质及电子设备,其中方法包括:实时采集用户输入的对话数据,基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果,然后基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。

    高效地训练可理解模型的系统和方法

    公开(公告)号:CN113424207B

    公开(公告)日:2022-05-17

    申请号:CN202080012634.2

    申请日:2020-10-13

    Abstract: 描述了用于训练可解释机器学习模型的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。一种示例性方法包括:通过多次无替换采样来从多个历史数据记录获得多个训练数据集,所述多个训练数据集包括具有一个或多个重叠的历史数据记录的第一训练数据集和第二训练数据集;生成分别与所述多个训练数据集相对应的多个直方图,其中,所述第二训练数据集的直方图重用所述第一训练数据集的直方图中与所述一个或多个重叠的历史数据记录相对应的一个或多个数据点;基于所述多个直方图,来训练与所述一个或多个用户特征相对应的一个或多个机器学习模型;以及基于所述一个或多个机器学习模型来提供个性化。

    高效地训练可理解模型的系统和方法

    公开(公告)号:CN113424207A

    公开(公告)日:2021-09-21

    申请号:CN202080012634.2

    申请日:2020-10-13

    Abstract: 描述了用于训练可解释机器学习模型的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。一种示例性方法包括:通过多次无替换采样来从多个历史数据记录获得多个训练数据集,所述多个训练数据集包括具有一个或多个重叠的历史数据记录的第一训练数据集和第二训练数据集;生成分别与所述多个训练数据集相对应的多个直方图,其中,所述第二训练数据集的直方图重用所述第一训练数据集的直方图中与所述一个或多个重叠的历史数据记录相对应的一个或多个数据点;基于所述多个直方图,来训练与所述一个或多个用户特征相对应的一个或多个机器学习模型;以及基于所述一个或多个机器学习模型来提供个性化。

Patent Agency Ranking