训练用户相关的分类模型、进行用户分类的方法及装置

    公开(公告)号:CN114282684B

    公开(公告)日:2024-08-27

    申请号:CN202111603926.6

    申请日:2021-12-24

    Inventor: 李辉 王维强

    Abstract: 本说明书实施例提供一种训练用户相关的分类模型的方法和装置,其中方法包括,获取一批标注样本,各标注样本具有预先标注的、选自预定的K个类别的类别标签。此外还利用生成器,生成多个生成样本。将各标注样本输入用于进行K+1个类别分类的分类器,得到第一预测结果,其正相关于各标注样本属于其对应类别标签的概率;其中,该K+1个类别包括前述K个类别和附加类别。还将生成样本输入分类器,得到第二预测结果,其正相关于生成样本属于附加类别的概率。以第二预测结果最小化为目标,对生成器进行第一更新;并以预设函数的函数值最大化为目标,对分类器进行第二更新,其中预设函数与第一预测结果和第二预测结果均正相关。

    一种语音数据处理方法、装置及设备

    公开(公告)号:CN118379990A

    公开(公告)日:2024-07-23

    申请号:CN202410526122.8

    申请日:2021-03-25

    Inventor: 刘杰 王维强

    Abstract: 本公开实施例提供了一种语音数据处理方法、装置及设备,包括:获取待处理的原始语音数据;将原始语音数据输入至预设语音编码模型中,以对原始语音数据进行语音编码处理,得到目标语音数据,其中,预设语音编码模型是基于预先获取的样本语音数据,以及预先训练的语音识别模型进行训练而得到;输出目标语音数据,其中,目标语音数据与原始语音数据的相似度大于第一预设阈值,将原始语音数据和目标语音数据分别输入至语音识别模型后输出的第一识别结果与第二识别结果的相似度小于第二预设阈值。

    一种任务执行方法、装置、电子设备及存储介质

    公开(公告)号:CN118278421A

    公开(公告)日:2024-07-02

    申请号:CN202410471724.8

    申请日:2024-04-18

    Abstract: 本说明书公开了一种任务执行方法、装置、电子设备及存储介质,可以通过大语言模型基于用户输入的问题文本数据中包含的一部分文本的语义,预测用户输入的问题文本中的另一部分文本的内容,即,预测文本数据,进而可以根据大语言模型预测的预测文本数据所表达的文本内容和用户实际输入的另一部分文本内容进行匹配,若大语言模型预测的预测文本数据所表达的文本内容和用户实际输入的另一部分文本内容不一致,则可以确定用户输入的问题文本数据可能存在风险,此时,大语言模型可以按照预设的风险答复策略生成回复文本数据,进而可以提升大语言模型生成的回复文本数据的安全性。

    一种基于隐私推理的神经网络模型确定方法和装置

    公开(公告)号:CN118194928A

    公开(公告)日:2024-06-14

    申请号:CN202410384543.1

    申请日:2024-03-29

    Abstract: 本说明书实施例公开了一种基于隐私推理的神经网络模型确定方法和装置,确定隐私推理模型所需进行的隐私推理任务类型,根据隐私推理任务类型,确定密态数据集和明文态数据集,以及包含各候选子结构的搜索空间,通过神经网络架构搜索,在搜索空间中搜索用于构成隐私推理模型的各候选子结构,并确定由搜索到的各候选子结构构成的初始神经网络模型。根据明文态数据集,确定初始神经网络模型的准确度损失,并,根据密态数据集,确定初始神经网络模型进行隐私推理任务类型对应的任务时对应的运算开销损失,根据准确度损失和运算开销损失,对初始神经网络模型进行优化,直至初始神经网络模型满足预设条件时,将初始神经网络确定为隐私推理模型。

    一种安全检测的方法及装置
    295.
    发明公开

    公开(公告)号:CN118093988A

    公开(公告)日:2024-05-28

    申请号:CN202311211874.7

    申请日:2023-09-19

    Abstract: 本说明书公开了一种安全检测的方法及装置,涉及人工智能领域,可用于隐私保护,可以从预设的诱导信息库中获取诱导信息,所述诱导信息用于诱导生成模型生成存在风险的内容,而后,将诱导信息输入到预先训练的诱导信息补充模型中,得到用于获取诱导信息的相关内容的询问语句,将询问语句输入到待检测的生成模型中,得到生成内容,通过预先训练的风险识别模型,对生成内容进行风险识别,得到识别结果,以通过识别结果,对待检测的生成模型进行安全检测,可以看出,本方法可以自动化地对生成模型进行安全检测,从而相比于现有技术,能够提高对生成模型安全检测的效率。

    一种意图识别模型训练及用户意图识别方法及装置

    公开(公告)号:CN115033676B

    公开(公告)日:2024-04-26

    申请号:CN202210713723.0

    申请日:2022-06-22

    Abstract: 本说明书公开了一种意图识别模型训练及用户意图识别方法及装置,先确定包含多轮对话的历史对话数据作为训练样本,通过第一意图识别模型确定每个训练样本各轮对话的用户意图,并基于用户执行的与该训练样本对应的业务确定反馈意图,然后根据该训练样本的用户意图以及反馈意图确定第一风险识别结果,并通过第二意图识别模型确定该训练样本的各预测意图以及第二风险识别结果,最后以各训练样本第一风险识别结果与第二风险识别结果之间的差异最小为优化目标对第二意图识别模型进行训练。通过结合反馈意图以及由第一意图识别模型确定的用户意图,得到准确的风险识别结果,以对第二意图识别模型进行训练,提高了第二意图识别模型的风险识别能力。

    话术确定方法、装置及设备

    公开(公告)号:CN113837638B

    公开(公告)日:2024-04-26

    申请号:CN202111153611.6

    申请日:2021-09-29

    Abstract: 本说明书实施例提供了一种话术确定方法、装置及设备,所述方法包括:获取目标用户针对触发执行的目标业务而输入的信息,并基于所述输入的信息对触发执行所述目标业务的意图进行识别,得到所述目标用户触发执行所述目标业务的用户意图;获取风险聚合中与所述用户意图匹配的用户行为所对应的目标风险聚合,所述风险聚合为对执行所述目标业务对应的目标风险数据进行风险聚合处理得到的包含一个或多个风险的聚合;将所述目标风险聚合输入预先训练的预设话术推荐模型,得到与所述目标风险聚合匹配的目标话术;基于所述目标话术,与所述目标用户进行交互,并基于交互结果,确定是否执行所述目标业务。

    一种模型训练、任务执行方法、装置、存储介质及设备

    公开(公告)号:CN117194992B

    公开(公告)日:2024-04-19

    申请号:CN202311454844.9

    申请日:2023-11-01

    Abstract: 本说明书公开一种模型训练、任务执行方法、装置、存储介质及设备,中心服务器可以基于各下游任务的共性样本对初始模型进行预训练,得到具有执行各下游任务的基础能力的预训练模型,进而可以通过将预训练模型的模型参数发送给每个下游服务器,以使得每个下游服务器基于本地样本对预训练模型中的调整层进行训练,得到训练后模型,并将训练后模型的调整层的网络参数返回,中心服务器可以根据各下游服务器返回的调整层网络参数,对预训练模型的调整层进行更新,得到目标模型,从而使得可以通过预训练模型的调整层学习到不同下游服务器所私有的本地样本和预训练过程中使用的共性样本之间的潜在联系,进而使得目标模型在下游任务中的性能得到提升。

    一种对抗训练的方法及装置

    公开(公告)号:CN117540791B

    公开(公告)日:2024-04-05

    申请号:CN202410013557.2

    申请日:2024-01-03

    Abstract: 本说明书实施例涉及一种对抗训练的方法及装置,方法包括:首先,获取基于训练集训练的第一模型,训练集中各训练样本包含结构化的特征数据及标签。然后,基于第一模型针对各个训练样本的总预测损失对特征数据的梯度值,确定目标权重向量。接下来,将目标权重向量施加于各训练样本的特征数据,得到各第一结果向量,并构建检索集。最后,基于训练集和检索集对第二模型进行多轮训练;任意一轮训练包括:使用训练集中部分训练样本训练第二模型;基于对抗训练算法与第二模型,确定部分训练样本对应的对抗样本特征;利用对抗样本特征在检索集中进行检索,从而确定各个对抗样本特征的标签,并构建对抗训练集;使用对抗训练集训练第二模型。

Patent Agency Ranking