-
公开(公告)号:CN111712874B
公开(公告)日:2023-07-14
申请号:CN201980011206.5
申请日:2019-10-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 提供了用于确定声音特性的方法、系统、装置和存储介质,包括编码在计算机存储介质上的计算机程序。方法之一包括:获得说话者的语音数据;将所述语音数据输入到至少通过联合地最小化第一损失函数和第二损失函数而训练的模型中,其中,所述第一损失函数包括基于非采样的损失函数,所述第二损失函数包括具有非单位多元协方差矩阵的高斯混合损失函数;以及从经训练模型中获得所述说话者的一个或多个声音特性。
-
公开(公告)号:CN111737417A
公开(公告)日:2020-10-02
申请号:CN202010631294.3
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332
Abstract: 本说明书实施例提供一种修正自然语言生成结果的方法和装置。方法包括:首先获取本轮迭代中待修正的第一模板句子,该句子是针对对话动作而生成,该对话动作包括若干词槽。将第一模板句子输入指针改写器,指针改写器依次逐个确定待输出句子中各个输出位置的字符,从而生成修正的第二模板句子。然后对第二模板句子进行词槽提取,并判断所提取的词槽与若干词槽是否一致。若不一致,将第二模板句子确定为下一轮迭代的输入,并基于对话动作和该第二模板句子生成一条训练样本,添加到样本缓存器中。样本缓存器用于收集训练样本,所收集的训练样本用以训练指针改写器。
-
公开(公告)号:CN111523314A
公开(公告)日:2020-08-11
申请号:CN202010632209.5
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供一种模型对抗训练、命名实体识别方法及装置。在模型训练中,将第一样本序列中的第一命名实体替换为其对应的原始标签字符,得到第二样本序列,并从第二样本序列中确定包含替换的原始标签字符的第一文本片段,确定第一文本片段的分类标签值为第一值,用于表示已替换命名实体;采用特征提取网络,确定第二样本序列中多个分词的特征隐向量;基于第二样本序列中多个分词的特征隐向量,确定第一文本片段的第一片段向量,将第一片段向量输入第一判别器,得到第一预测值;基于第一预测值与第一值的差异,确定第一损失值;以最小化第一损失值为目标,更新第一判别器;以最大化第一损失值为目标,更新特征提取网络。
-
公开(公告)号:CN111523313A
公开(公告)日:2020-08-11
申请号:CN202010631307.7
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供一种模型训练、命名实体识别方法及装置。在模型训练时,将第一样本序列中的第一命名实体替换为第一预设字符,得到第二样本序列,并从第二样本序列中确定包含第一预设字符的文本片段;采用第一递归神经网络,递归地确定第二样本序列中多个分词的隐向量,并确定文本片段的表征向量;通过变分自编码器,基于表征向量构建高斯分布并确定针对文本片段的全局隐向量;采用第一递归神经网络,以全局隐向量作为初始隐向量,递归地确定文本片段中分词的解码隐向量,并确定文本片段中分词的预测值;基于文本片段中分词与其预测值的差异以及分布差异,确定预测损失值,向减小预测损失值的方向,更新第一递归神经网络和变分自编码器。
-
公开(公告)号:CN112214652A
公开(公告)日:2021-01-12
申请号:CN202011119485.8
申请日:2020-10-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/903 , G06F16/901 , G06Q10/06 , G06Q40/04 , G06Q50/26 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种报文生成方法、装置及设备,该方法包括:获取用户特征信息,对用户特征信息进行编码,形成用户特征信息对应的第一特征向量;根据用户特征信息从检索库中进行匹配,得到用户特征信息对应的多个风险描述语句;对多个风险描述语句进行特征化处理,得到用户特征信息对应的第二特征向量;对第一特征向量以及第二特征向量进行融合,得到融合后的第三特征向量;将第三特征向量输入主题匹配模型中,得到第三特征向量对应的多个主题;基于多个主题与第三特征向量,生成包含主题以及所述风险描述语句的报文。
-
公开(公告)号:CN111737417B
公开(公告)日:2020-11-17
申请号:CN202010631294.3
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332
Abstract: 本说明书实施例提供一种修正自然语言生成结果的方法和装置。方法包括:首先获取本轮迭代中待修正的第一模板句子,该句子是针对对话动作而生成,该对话动作包括若干词槽。将第一模板句子输入指针改写器,指针改写器依次逐个确定待输出句子中各个输出位置的字符,从而生成修正的第二模板句子。然后对第二模板句子进行词槽提取,并判断所提取的词槽与若干词槽是否一致。若不一致,将第二模板句子确定为下一轮迭代的输入,并基于对话动作和该第二模板句子生成一条训练样本,添加到样本缓存器中。样本缓存器用于收集训练样本,所收集的训练样本用以训练指针改写器。
-
公开(公告)号:CN111523313B
公开(公告)日:2020-09-29
申请号:CN202010631307.7
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供一种模型训练、命名实体识别方法及装置。在模型训练时,将第一样本序列中的第一命名实体替换为第一预设字符,得到第二样本序列,并从第二样本序列中确定包含第一预设字符的文本片段;采用第一递归神经网络,递归地确定第二样本序列中多个分词的隐向量,并确定文本片段的表征向量;通过变分自编码器,基于表征向量构建高斯分布并确定针对文本片段的全局隐向量;采用第一递归神经网络,以全局隐向量作为初始隐向量,递归地确定文本片段中分词的解码隐向量,并确定文本片段中分词的预测值;基于文本片段中分词与其预测值的差异以及分布差异,确定预测损失值,向减小预测损失值的方向,更新第一递归神经网络和变分自编码器。
-
公开(公告)号:CN111274789A
公开(公告)日:2020-06-12
申请号:CN202010081187.8
申请日:2020-02-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/211 , G06F40/216 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供一种计算机执行的文本预测模型的训练方法和装置。其中文本预测模型包括基于时序的第一预测网络,和第二预测网络,训练方法包括,将训练文本中第t个词输入第一预测网络,使其根据时序处理得到的状态向量确定对于下一个词的第一预测概率。此外,从缓存器中读取基于在先文本形成的若干片段向量,第二预测网络根据这些片段向量,得到对下一个词的第二预测概率。然后,以内插权重系数λ作为第二预测概率的加权系数,以1减去λ作为第一预测概率的加权系数,对二者加权综合,得到综合预测概率。至少根据该综合预测概率和第t+1个词,确定针对第t个词的预测损失,由此训练文本预测模型。
-
公开(公告)号:CN112214652B
公开(公告)日:2023-09-29
申请号:CN202011119485.8
申请日:2020-10-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/903 , G06F16/901 , G06Q10/0635 , G06Q40/04 , G06Q50/26 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例公开了一种报文生成方法、装置及设备,该方法包括:获取用户特征信息,对用户特征信息进行编码,形成用户特征信息对应的第一特征向量;根据用户特征信息从检索库中进行匹配,得到用户特征信息对应的多个风险描述语句;对多个风险描述语句进行特征化处理,得到用户特征信息对应的第二特征向量;对第一特征向量以及第二特征向量进行融合,得到融合后的第三特征向量;将第三特征向量输入主题匹配模型中,得到第三特征向量对应的多个主题;基于多个主题与第三特征向量,生成包含主题以及所述风险描述语句的报文。
-
公开(公告)号:CN111418009B
公开(公告)日:2023-09-05
申请号:CN202080000759.3
申请日:2020-01-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 提供了用于个性化说话者验证的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。所述方法之一包括:获得说话者的第一语音数据作为正样本,以及与说话者不同的实体的第二语音数据作为负样本;将正样本和负样本馈送到第一模型以确定人声特性,从而相应地输出说话者的正人声特性和负人声特性;至少基于正人声特性和负人声特性获得梯度;将梯度馈送到第一模型,以更新第一模型的一个或多个参数,从而获得用于个性化说话者验证的第二模型。
-
-
-
-
-
-
-
-
-