-
公开(公告)号:CN111418009B
公开(公告)日:2023-09-05
申请号:CN202080000759.3
申请日:2020-01-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 提供了用于个性化说话者验证的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。所述方法之一包括:获得说话者的第一语音数据作为正样本,以及与说话者不同的实体的第二语音数据作为负样本;将正样本和负样本馈送到第一模型以确定人声特性,从而相应地输出说话者的正人声特性和负人声特性;至少基于正人声特性和负人声特性获得梯度;将梯度馈送到第一模型,以更新第一模型的一个或多个参数,从而获得用于个性化说话者验证的第二模型。
-
公开(公告)号:CN111145760B
公开(公告)日:2020-06-30
申请号:CN202010256078.5
申请日:2020-04-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用于说话人识别的方法和神经网络模型。根据该方法,首先获取说话人音频片段的频谱特征;然后对频谱特征进行编码,得到帧级别的N个编码向量构成的向量序列。接着,对该向量序列分别施加K种池化处理,得到对应的K个子嵌入向量;其中,任意的第i池化处理包括,对于N个编码向量中任意的第一编码向量,基于第i池化处理对应的第i注意力算法,确定该第一编码向量的注意力系数,并以各个编码向量各自的注意力系数为权重因子,对各个编码向量求和。然后,基于所述K个子嵌入向量,确定总嵌入向量;并基于所述总嵌入向量,进行说话人识别。
-
公开(公告)号:CN111145760A
公开(公告)日:2020-05-12
申请号:CN202010256078.5
申请日:2020-04-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用于说话人识别的方法和神经网络模型。根据该方法,首先获取说话人音频片段的频谱特征;然后对频谱特征进行编码,得到帧级别的N个编码向量构成的向量序列。接着,对该向量序列分别施加K种池化处理,得到对应的K个子嵌入向量;其中,任意的第i池化处理包括,对于N个编码向量中任意的第一编码向量,基于第i池化处理对应的第i注意力算法,确定该第一编码向量的注意力系数,并以各个编码向量各自的注意力系数为权重因子,对各个编码向量求和。然后,基于所述K个子嵌入向量,确定总嵌入向量;并基于所述总嵌入向量,进行说话人识别。
-
公开(公告)号:CN110727783A
公开(公告)日:2020-01-24
申请号:CN201911013294.0
申请日:2019-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332
Abstract: 本说明书实施例提供了一种基于对话系统对用户问句提出反问的方法和装置,所述对话系统中预设有与N个标准问题对应的M个反问模块,其中M≥N,每个反问模块中包括从相应的标准问题拆分的第一子句和第二子句,所述方法包括:获取第一用户的第一问句;对于所述M个反问模块中的每个反问模块,分别确定所述第一问句与其中的所述第一子句和第二子句是否匹配;在所述第一问句与该反问模块中的第一子句的匹配、且所述第一问句与该反问模块中的第二子句不匹配的情况中,基于该反问模块中的第二子句获取针对所述第一问句的反问句,以基于所述M个反问模块获取针对所述第一问句的多个反问句。
-
公开(公告)号:CN111712874B
公开(公告)日:2023-07-14
申请号:CN201980011206.5
申请日:2019-10-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 提供了用于确定声音特性的方法、系统、装置和存储介质,包括编码在计算机存储介质上的计算机程序。方法之一包括:获得说话者的语音数据;将所述语音数据输入到至少通过联合地最小化第一损失函数和第二损失函数而训练的模型中,其中,所述第一损失函数包括基于非采样的损失函数,所述第二损失函数包括具有非单位多元协方差矩阵的高斯混合损失函数;以及从经训练模型中获得所述说话者的一个或多个声音特性。
-
公开(公告)号:CN111737417A
公开(公告)日:2020-10-02
申请号:CN202010631294.3
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332
Abstract: 本说明书实施例提供一种修正自然语言生成结果的方法和装置。方法包括:首先获取本轮迭代中待修正的第一模板句子,该句子是针对对话动作而生成,该对话动作包括若干词槽。将第一模板句子输入指针改写器,指针改写器依次逐个确定待输出句子中各个输出位置的字符,从而生成修正的第二模板句子。然后对第二模板句子进行词槽提取,并判断所提取的词槽与若干词槽是否一致。若不一致,将第二模板句子确定为下一轮迭代的输入,并基于对话动作和该第二模板句子生成一条训练样本,添加到样本缓存器中。样本缓存器用于收集训练样本,所收集的训练样本用以训练指针改写器。
-
公开(公告)号:CN111523314A
公开(公告)日:2020-08-11
申请号:CN202010632209.5
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供一种模型对抗训练、命名实体识别方法及装置。在模型训练中,将第一样本序列中的第一命名实体替换为其对应的原始标签字符,得到第二样本序列,并从第二样本序列中确定包含替换的原始标签字符的第一文本片段,确定第一文本片段的分类标签值为第一值,用于表示已替换命名实体;采用特征提取网络,确定第二样本序列中多个分词的特征隐向量;基于第二样本序列中多个分词的特征隐向量,确定第一文本片段的第一片段向量,将第一片段向量输入第一判别器,得到第一预测值;基于第一预测值与第一值的差异,确定第一损失值;以最小化第一损失值为目标,更新第一判别器;以最大化第一损失值为目标,更新特征提取网络。
-
公开(公告)号:CN111523313A
公开(公告)日:2020-08-11
申请号:CN202010631307.7
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供一种模型训练、命名实体识别方法及装置。在模型训练时,将第一样本序列中的第一命名实体替换为第一预设字符,得到第二样本序列,并从第二样本序列中确定包含第一预设字符的文本片段;采用第一递归神经网络,递归地确定第二样本序列中多个分词的隐向量,并确定文本片段的表征向量;通过变分自编码器,基于表征向量构建高斯分布并确定针对文本片段的全局隐向量;采用第一递归神经网络,以全局隐向量作为初始隐向量,递归地确定文本片段中分词的解码隐向量,并确定文本片段中分词的预测值;基于文本片段中分词与其预测值的差异以及分布差异,确定预测损失值,向减小预测损失值的方向,更新第一递归神经网络和变分自编码器。
-
公开(公告)号:CN118092632A
公开(公告)日:2024-05-28
申请号:CN202211489297.3
申请日:2022-11-25
Applicant: 支付宝(杭州)信息技术有限公司 , 阿里巴巴(中国)有限公司
IPC: G06F3/01 , G06Q30/0601 , G06Q30/0207 , G06N20/00
Abstract: 本说明书实施例提供一种数字人推荐方法和推荐系统。数字人推荐系统包括计算机模拟的数字人,相应的推荐方法包括:获取当前的状态数据,所述状态数据融合有目标用户的用户信息、所在场景的场景信息,以及所述目标用户与所述数字人的交互历史信息;数字人中的智能体,根据强化学习得到的当前策略,将所述状态数据映射为备选动作集中的目标动作,其中所述备选动作集中的备选动作对应于待推荐的内容类别,所述目标动作对应于目标内容类别;所述数字人与所述目标用户进行目标交互,所述目标交互用于推荐所述目标内容类别。从而通过数字人为目标用户进行个性化推荐。
-
公开(公告)号:CN111737417B
公开(公告)日:2020-11-17
申请号:CN202010631294.3
申请日:2020-07-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332
Abstract: 本说明书实施例提供一种修正自然语言生成结果的方法和装置。方法包括:首先获取本轮迭代中待修正的第一模板句子,该句子是针对对话动作而生成,该对话动作包括若干词槽。将第一模板句子输入指针改写器,指针改写器依次逐个确定待输出句子中各个输出位置的字符,从而生成修正的第二模板句子。然后对第二模板句子进行词槽提取,并判断所提取的词槽与若干词槽是否一致。若不一致,将第二模板句子确定为下一轮迭代的输入,并基于对话动作和该第二模板句子生成一条训练样本,添加到样本缓存器中。样本缓存器用于收集训练样本,所收集的训练样本用以训练指针改写器。
-
-
-
-
-
-
-
-
-