模型训练、命名实体识别方法及装置

    公开(公告)号:CN111523313B

    公开(公告)日:2020-09-29

    申请号:CN202010631307.7

    申请日:2020-07-03

    Abstract: 本说明书实施例提供一种模型训练、命名实体识别方法及装置。在模型训练时,将第一样本序列中的第一命名实体替换为第一预设字符,得到第二样本序列,并从第二样本序列中确定包含第一预设字符的文本片段;采用第一递归神经网络,递归地确定第二样本序列中多个分词的隐向量,并确定文本片段的表征向量;通过变分自编码器,基于表征向量构建高斯分布并确定针对文本片段的全局隐向量;采用第一递归神经网络,以全局隐向量作为初始隐向量,递归地确定文本片段中分词的解码隐向量,并确定文本片段中分词的预测值;基于文本片段中分词与其预测值的差异以及分布差异,确定预测损失值,向减小预测损失值的方向,更新第一递归神经网络和变分自编码器。

    一种基于对话系统对用户问句提出反问的方法和装置

    公开(公告)号:CN110727783B

    公开(公告)日:2021-03-02

    申请号:CN201911013294.0

    申请日:2019-10-23

    Abstract: 本说明书实施例提供了一种基于对话系统对用户问句提出反问的方法和装置,所述对话系统中预设有与N个标准问题对应的M个反问模块,其中M≥N,每个反问模块中包括从相应的标准问题拆分的第一子句和第二子句,所述方法包括:获取第一用户的第一问句;对于所述M个反问模块中的每个反问模块,分别确定所述第一问句与其中的所述第一子句和第二子句是否匹配;在所述第一问句与该反问模块中的第一子句的匹配、且所述第一问句与该反问模块中的第二子句不匹配的情况中,基于该反问模块中的第二子句获取针对所述第一问句的反问句,以基于所述M个反问模块获取针对所述第一问句的多个反问句。

    用于确定声音特性的系统和方法

    公开(公告)号:CN111712874A

    公开(公告)日:2020-09-25

    申请号:CN201980011206.5

    申请日:2019-10-31

    Abstract: 提供了用于确定声音特性的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。方法之一包括:获得说话者的语音数据;将所述语音数据输入到至少通过联合地最小化第一损失函数和第二损失函数而训练的模型中,其中,所述第一损失函数包括基于非采样的损失函数,所述第二函数包括具有非单位多元协方差矩阵的高斯混合损失函数;以及从经训练模型中获得所述说话者的一个或多个声音特性。

    模型对抗训练、命名实体识别方法及装置

    公开(公告)号:CN111523314B

    公开(公告)日:2020-09-25

    申请号:CN202010632209.5

    申请日:2020-07-03

    Abstract: 本说明书实施例提供一种模型对抗训练、命名实体识别方法及装置。在模型训练中,将第一样本序列中的第一命名实体替换为其对应的原始标签字符,得到第二样本序列,并从第二样本序列中确定包含替换的原始标签字符的第一文本片段,确定第一文本片段的分类标签值为第一值,用于表示已替换命名实体;采用特征提取网络,确定第二样本序列中多个分词的特征隐向量;基于第二样本序列中多个分词的特征隐向量,确定第一文本片段的第一片段向量,将第一片段向量输入第一判别器,得到第一预测值;基于第一预测值与第一值的差异,确定第一损失值;以最小化第一损失值为目标,更新第一判别器;以最大化第一损失值为目标,更新特征提取网络。

    个性化说话者验证系统和方法

    公开(公告)号:CN111418009A

    公开(公告)日:2020-07-14

    申请号:CN202080000759.3

    申请日:2020-01-09

    Abstract: 提供了用于个性化说话者验证的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。所述方法之一包括:获得说话者的第一语音数据作为正样本,以及与说话者不同的实体的第二语音数据作为负样本;将正样本和负样本馈送到第一模型以确定人声特性,从而相应地输出说话者的正人声特性和负人声特性;至少基于正人声特性和负人声特性获得梯度;将梯度馈送到第一模型,以更新第一模型的一个或多个参数,从而获得用于个性化说话者验证的第二模型。

Patent Agency Ranking