人机对话方法以及对话系统

    公开(公告)号:CN110232108B

    公开(公告)日:2023-02-03

    申请号:CN201910395865.5

    申请日:2019-05-13

    Abstract: 本申请涉及人工智能技术,提供了一种人机对话方法,包括:对话系统获取用户输入的第一用户语句,其中,第一用户语句指示了第一用户行为;根据第一用户语句确定存在所述第一用户行为为异常行为;在异常行为是对话系统能够识别,但是无法执行的行为的情况下,识别异常行为无法被执行的原因,并生成对异常行为进行回复的第一回复语句,其中,第一回复语句用于提示第一用户行为不能被执行的原因;或者,在异常行为是对话系统无法识别的行为的情况下,根据第一用户语句识别用户意图,并生成对异常行为进行回复的第二回复语句,其中,第二回复语句用于提示所述对话系统不支持用户意图。

    一种模型压缩方法及装置

    公开(公告)号:CN112257858A

    公开(公告)日:2021-01-22

    申请号:CN202010997722.4

    申请日:2020-09-21

    Abstract: 本申请公开了一种模型压缩方法,可以应用于人工智能领域,所述方法包括:获取第一神经网络模型、第二神经网络模型以及第三神经网络模型;通过所述第一神经网络模型对第一待处理数据进行处理,以得到第一输出;通过所述第三神经网络模型对所述第一待处理数据进行处理,以得到第二输出;根据所述第一输出和所述第二输出,确定第一目标损失,并基于所述第一目标损失更新所述第二神经网络模型,得到更新后的第二神经网络模型;对所述更新后的第二神经网络模型进行压缩,得到目标神经网络模型。本实施例中生成的模型处理精度更高。

    一种量化方法、推荐方法以及装置

    公开(公告)号:CN115983362A

    公开(公告)日:2023-04-18

    申请号:CN202211490535.2

    申请日:2022-11-25

    Abstract: 本申请提供一种量化方法、推荐方法以及装置,用于基于自适应步长对全精度嵌入表征中每种特征进行量化,从而提高量化精度。该方法包括:首先,获取全精度嵌入表征,嵌入表征包括多种特征;确定多种特征中每种特征分别对应的自适应步长,该多种特征对应的步长可能相同也可能不相同;随后根据每种特征对应的自适应步长分别对多种特征进行量化,得到低精度嵌入表征,该低精度嵌入表征中的特征的精度低于全精度嵌入表征中特征的精度,从而降低保存或者传输该嵌入表征所需的存储空间。

    执行命令的方法、装置及设备

    公开(公告)号:CN110798506A

    公开(公告)日:2020-02-14

    申请号:CN201910937857.9

    申请日:2019-09-27

    Abstract: 本发明实施例公开了一种执行命令的方法、装置、终端及服务器,涉及人工智能领域,具体涉及语音识别、自然语言处理等领域,该方法包括在终端与用户交互过程中,终端或用于执行用户命令的服务器可以存储槽位与其对应的GUI信息,用于执行用户命令的服务器在该用户命令被配置的槽位的填充信息缺失时,可以从存储的GUI信息中获取缺失的槽位的填充信息,避免了用户与终端的多次交互,更加智能,提高命令的执行效率。

    人机对话方法以及对话系统

    公开(公告)号:CN110232108A

    公开(公告)日:2019-09-13

    申请号:CN201910395865.5

    申请日:2019-05-13

    Abstract: 本申请涉及人工智能技术,提供了一种人机对话方法,包括:对话系统获取用户输入的第一用户语句,其中,第一用户语句指示了第一用户行为;根据第一用户语句确定存在所述第一用户行为为异常行为;在异常行为是对话系统能够识别,但是无法执行的行为的情况下,识别异常行为无法被执行的原因,并生成对异常行为进行回复的第一回复语句,其中,第一回复语句用于提示第一用户行为不能被执行的原因;或者,在异常行为是对话系统无法识别的行为的情况下,根据第一用户语句识别用户意图,并生成对异常行为进行回复的第二回复语句,其中,第二回复语句用于提示所述对话系统不支持用户意图。

    一种模型压缩方法及装置

    公开(公告)号:CN112257858B

    公开(公告)日:2024-06-14

    申请号:CN202010997722.4

    申请日:2020-09-21

    Abstract: 本申请公开了一种模型压缩方法,可以应用于人工智能领域,所述方法包括:获取第一神经网络模型、第二神经网络模型以及第三神经网络模型;通过所述第一神经网络模型对第一待处理数据进行处理,以得到第一输出;通过所述第三神经网络模型对所述第一待处理数据进行处理,以得到第二输出;根据所述第一输出和所述第二输出,确定第一目标损失,并基于所述第一目标损失更新所述第二神经网络模型,得到更新后的第二神经网络模型;对所述更新后的第二神经网络模型进行压缩,得到目标神经网络模型。本实施例中生成的模型处理精度更高。

    一种数据处理方法及相关设备
    8.
    发明公开

    公开(公告)号:CN116432019A

    公开(公告)日:2023-07-14

    申请号:CN202211586646.3

    申请日:2022-12-09

    Abstract: 一种数据处理方法,应用于预训练模型,方法包括:通过第一预训练语言模型PLM,处理文本数据,得到目标特征表示;其中,第一PLM包括一个或多个第一网络层,目标特征表示为根据一个或多个第一网络层输出的第一特征表示得到;通过第二PLM,处理文本数据;第二PLM包括第一注意力层以及与第一注意力层连接的第二网络层;第一注意力层的输入包括目标特征表示以及第二网络层输出的第二特征表示。本申请从通用预训练语言模型中构建通用记忆知识表征,然后通过记忆增强层(第一注意力层)将其融合到特定领域的预训练语言模型(第二PLM)中,使得特定领域的预训练语言模型能够获取遗忘的通用领域知识,减少了预训练过程中出现的灾难性遗忘问题。

    用于通过量化压缩生成式预训练语言模型的方法和设备

    公开(公告)号:CN119895437A

    公开(公告)日:2025-04-25

    申请号:CN202380065100.X

    申请日:2023-06-29

    Abstract: 提供了一种由处理系统执行的用于量化神经网络模型的方法。所述方法包括:基于与所述神经网络模型相关联的权重的分布来确定缩放因子;基于所述缩放因子和与所述分布相关联的所述权重来确定量化后的权重;基于在所述神经网络模型的训练期间的所述量化后的权重,确定所述神经网络模型的训练损失;基于所述训练损失的梯度,确定所述神经网络模型的更新后的缩放因子。

Patent Agency Ranking