-
公开(公告)号:CN118626839A
公开(公告)日:2024-09-10
申请号:CN202310248134.4
申请日:2023-03-08
Applicant: 华为技术有限公司
IPC: G06F18/214 , G06F18/22 , G06F18/25
Abstract: 本申请公开了一种模型训练方法、装置、存储介质及计算机程序产品,属于深度学习技术领域。在该方法中,通过划分子序列,从而实现多尺度多粒度地获取多个相关序列,相关序列更加丰富,基于丰富的相关序列来训练模型,不易使模型局限在特定的序列分布上,有利于模型学习到更好的通用序列表示,提升了模型的训练精度和性能。
-
公开(公告)号:CN110232108B
公开(公告)日:2023-02-03
申请号:CN201910395865.5
申请日:2019-05-13
Applicant: 华为技术有限公司
IPC: G06F16/33 , G06F16/332
Abstract: 本申请涉及人工智能技术,提供了一种人机对话方法,包括:对话系统获取用户输入的第一用户语句,其中,第一用户语句指示了第一用户行为;根据第一用户语句确定存在所述第一用户行为为异常行为;在异常行为是对话系统能够识别,但是无法执行的行为的情况下,识别异常行为无法被执行的原因,并生成对异常行为进行回复的第一回复语句,其中,第一回复语句用于提示第一用户行为不能被执行的原因;或者,在异常行为是对话系统无法识别的行为的情况下,根据第一用户语句识别用户意图,并生成对异常行为进行回复的第二回复语句,其中,第二回复语句用于提示所述对话系统不支持用户意图。
-
公开(公告)号:CN112257858A
公开(公告)日:2021-01-22
申请号:CN202010997722.4
申请日:2020-09-21
Applicant: 华为技术有限公司
Abstract: 本申请公开了一种模型压缩方法,可以应用于人工智能领域,所述方法包括:获取第一神经网络模型、第二神经网络模型以及第三神经网络模型;通过所述第一神经网络模型对第一待处理数据进行处理,以得到第一输出;通过所述第三神经网络模型对所述第一待处理数据进行处理,以得到第二输出;根据所述第一输出和所述第二输出,确定第一目标损失,并基于所述第一目标损失更新所述第二神经网络模型,得到更新后的第二神经网络模型;对所述更新后的第二神经网络模型进行压缩,得到目标神经网络模型。本实施例中生成的模型处理精度更高。
-
公开(公告)号:CN115983362A
公开(公告)日:2023-04-18
申请号:CN202211490535.2
申请日:2022-11-25
Applicant: 华为技术有限公司
IPC: G06N3/08 , G06N3/0464 , G06N3/042 , G06N3/084
Abstract: 本申请提供一种量化方法、推荐方法以及装置,用于基于自适应步长对全精度嵌入表征中每种特征进行量化,从而提高量化精度。该方法包括:首先,获取全精度嵌入表征,嵌入表征包括多种特征;确定多种特征中每种特征分别对应的自适应步长,该多种特征对应的步长可能相同也可能不相同;随后根据每种特征对应的自适应步长分别对多种特征进行量化,得到低精度嵌入表征,该低精度嵌入表征中的特征的精度低于全精度嵌入表征中特征的精度,从而降低保存或者传输该嵌入表征所需的存储空间。
-
公开(公告)号:CN110798506A
公开(公告)日:2020-02-14
申请号:CN201910937857.9
申请日:2019-09-27
Applicant: 华为技术有限公司
Abstract: 本发明实施例公开了一种执行命令的方法、装置、终端及服务器,涉及人工智能领域,具体涉及语音识别、自然语言处理等领域,该方法包括在终端与用户交互过程中,终端或用于执行用户命令的服务器可以存储槽位与其对应的GUI信息,用于执行用户命令的服务器在该用户命令被配置的槽位的填充信息缺失时,可以从存储的GUI信息中获取缺失的槽位的填充信息,避免了用户与终端的多次交互,更加智能,提高命令的执行效率。
-
公开(公告)号:CN110232108A
公开(公告)日:2019-09-13
申请号:CN201910395865.5
申请日:2019-05-13
Applicant: 华为技术有限公司
IPC: G06F16/33 , G06F16/332
Abstract: 本申请涉及人工智能技术,提供了一种人机对话方法,包括:对话系统获取用户输入的第一用户语句,其中,第一用户语句指示了第一用户行为;根据第一用户语句确定存在所述第一用户行为为异常行为;在异常行为是对话系统能够识别,但是无法执行的行为的情况下,识别异常行为无法被执行的原因,并生成对异常行为进行回复的第一回复语句,其中,第一回复语句用于提示第一用户行为不能被执行的原因;或者,在异常行为是对话系统无法识别的行为的情况下,根据第一用户语句识别用户意图,并生成对异常行为进行回复的第二回复语句,其中,第二回复语句用于提示所述对话系统不支持用户意图。
-
公开(公告)号:CN112257858B
公开(公告)日:2024-06-14
申请号:CN202010997722.4
申请日:2020-09-21
Applicant: 华为技术有限公司
IPC: G06N3/082 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F18/214
Abstract: 本申请公开了一种模型压缩方法,可以应用于人工智能领域,所述方法包括:获取第一神经网络模型、第二神经网络模型以及第三神经网络模型;通过所述第一神经网络模型对第一待处理数据进行处理,以得到第一输出;通过所述第三神经网络模型对所述第一待处理数据进行处理,以得到第二输出;根据所述第一输出和所述第二输出,确定第一目标损失,并基于所述第一目标损失更新所述第二神经网络模型,得到更新后的第二神经网络模型;对所述更新后的第二神经网络模型进行压缩,得到目标神经网络模型。本实施例中生成的模型处理精度更高。
-
公开(公告)号:CN116432019A
公开(公告)日:2023-07-14
申请号:CN202211586646.3
申请日:2022-12-09
Applicant: 华为技术有限公司
Abstract: 一种数据处理方法,应用于预训练模型,方法包括:通过第一预训练语言模型PLM,处理文本数据,得到目标特征表示;其中,第一PLM包括一个或多个第一网络层,目标特征表示为根据一个或多个第一网络层输出的第一特征表示得到;通过第二PLM,处理文本数据;第二PLM包括第一注意力层以及与第一注意力层连接的第二网络层;第一注意力层的输入包括目标特征表示以及第二网络层输出的第二特征表示。本申请从通用预训练语言模型中构建通用记忆知识表征,然后通过记忆增强层(第一注意力层)将其融合到特定领域的预训练语言模型(第二PLM)中,使得特定领域的预训练语言模型能够获取遗忘的通用领域知识,减少了预训练过程中出现的灾难性遗忘问题。
-
公开(公告)号:CN110798506B
公开(公告)日:2023-03-10
申请号:CN201910937857.9
申请日:2019-09-27
Applicant: 华为技术有限公司
Abstract: 本发明实施例公开了一种执行命令的方法、装置、终端及服务器,涉及人工智能领域,具体涉及语音识别、自然语言处理等领域,该方法包括在终端与用户交互过程中,终端或用于执行用户命令的服务器可以存储槽位与其对应的GUI信息,用于执行用户命令的服务器在该用户命令被配置的槽位的填充信息缺失时,可以从存储的GUI信息中获取缺失的槽位的填充信息,避免了用户与终端的多次交互,更加智能,提高命令的执行效率。
-
-
-
-
-
-
-
-