文本预测模型的训练方法及装置

    公开(公告)号:CN111274789B

    公开(公告)日:2021-07-06

    申请号:CN202010081187.8

    申请日:2020-02-06

    Inventor: 李扬名 姚开盛

    Abstract: 本说明书实施例提供一种计算机执行的文本预测模型的训练方法和装置。其中文本预测模型包括基于时序的第一预测网络,和第二预测网络,训练方法包括,将训练文本中第t个词输入第一预测网络,使其根据时序处理得到的状态向量确定对于下一个词的第一预测概率。此外,从缓存器中读取基于在先文本形成的若干片段向量,第二预测网络根据这些片段向量,得到对下一个词的第二预测概率。然后,以内插权重系数λ作为第二预测概率的加权系数,以1减去λ作为第一预测概率的加权系数,对二者加权综合,得到综合预测概率。至少根据该综合预测概率和第t+1个词,确定针对第t个词的预测损失,由此训练文本预测模型。

    用于说话人识别的方法及神经网络模型

    公开(公告)号:CN111145760B

    公开(公告)日:2020-06-30

    申请号:CN202010256078.5

    申请日:2020-04-02

    Abstract: 本说明书实施例提供一种用于说话人识别的方法和神经网络模型。根据该方法,首先获取说话人音频片段的频谱特征;然后对频谱特征进行编码,得到帧级别的N个编码向量构成的向量序列。接着,对该向量序列分别施加K种池化处理,得到对应的K个子嵌入向量;其中,任意的第i池化处理包括,对于N个编码向量中任意的第一编码向量,基于第i池化处理对应的第i注意力算法,确定该第一编码向量的注意力系数,并以各个编码向量各自的注意力系数为权重因子,对各个编码向量求和。然后,基于所述K个子嵌入向量,确定总嵌入向量;并基于所述总嵌入向量,进行说话人识别。

    用于说话人识别的方法及神经网络模型

    公开(公告)号:CN111145760A

    公开(公告)日:2020-05-12

    申请号:CN202010256078.5

    申请日:2020-04-02

    Abstract: 本说明书实施例提供一种用于说话人识别的方法和神经网络模型。根据该方法,首先获取说话人音频片段的频谱特征;然后对频谱特征进行编码,得到帧级别的N个编码向量构成的向量序列。接着,对该向量序列分别施加K种池化处理,得到对应的K个子嵌入向量;其中,任意的第i池化处理包括,对于N个编码向量中任意的第一编码向量,基于第i池化处理对应的第i注意力算法,确定该第一编码向量的注意力系数,并以各个编码向量各自的注意力系数为权重因子,对各个编码向量求和。然后,基于所述K个子嵌入向量,确定总嵌入向量;并基于所述总嵌入向量,进行说话人识别。

    自然语言生成方法及装置
    14.
    发明授权

    公开(公告)号:CN112966520B

    公开(公告)日:2023-11-14

    申请号:CN202110150679.2

    申请日:2021-02-03

    Inventor: 李扬名 姚开盛

    Abstract: 本说明书实施例提供一种自然语言生成方法。该方法包括:首先,获取第一对话动作,其n个组成元素中包括动作类型,以及n‑1个词槽‑槽值对,并对该第一对话动作进行编码,得到对应n个组成元素的n个编码向量;然后,基于该n个编码向量进行解码,依次确定待输出的自然语言文本的各个位置的语义项,其中确定任意当前位置的语义项包括:先利用表达器集合中的各个表达器,各自对前一位置输出信息进行处理,得到对应输出,再利用模式切换器对各个表达器的输出进行加权融合,得到当前位置对应的当前状态向量和当前融合概率分布,进而根据该当前融合概率分布,确定当前语义项,其中当前状态向量和当前语义项作为当前位置输出信息。

    一种基于对话系统对用户问句提出反问的方法和装置

    公开(公告)号:CN110866587B

    公开(公告)日:2021-10-15

    申请号:CN201911080571.X

    申请日:2019-11-07

    Inventor: 姚开盛

    Abstract: 本说明书实施例提供了一种基于对话系统对用户问句提出反问的方法和装置,所述对话系统中包括强化学习模型,所述方法包括:获取基于对话系统的第一对话回合,所述第一对话回合中包括T轮对话;获取与所述第一对话回合对应的T个状态;获取与所述T轮对话中包括的多个反问句分别对应的多个反馈分数向量,所述反馈分数向量包括的多个维度与多个预定特征分别对应;基于所述T个状态、所述多个反问句以及所述多个反馈分数向量,训练所述强化学习模型,以用于基于所述强化学习模型对用户问句提出反问。

    基于对话系统获取与用户问句对应的反问句的方法和装置

    公开(公告)号:CN111008268B

    公开(公告)日:2021-05-18

    申请号:CN201911054861.7

    申请日:2019-10-31

    Inventor: 姚开盛 胡翔

    Abstract: 本说明书实施例提供了一种基于对话系统获取与用户问句对应的反问句的方法和装置,所述对话系统中预设有与第一标准问题对应的第一反问模块,所述第一反问模块中包括从所述第一标准问题拆分的第一子句和第二子句,所述方法包括:获取第一用户的第一问句;从所述第一问句拆分出第三子句和第四子句;确定所述第三子句与所述第一子句是否匹配;在确定所述第三子句与所述第一子句匹配的情况中,通过合并所述第四子句与所述第一子句获取第二问句;获取所述第二问句与所述第一标准问题的相似度;在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,基于所述第一子句获取与所述第一问句对应的反问句。

    基于对话系统获取与用户问句对应的反问句的方法和装置

    公开(公告)号:CN111008268A

    公开(公告)日:2020-04-14

    申请号:CN201911054861.7

    申请日:2019-10-31

    Inventor: 姚开盛 胡翔

    Abstract: 本说明书实施例提供了一种基于对话系统获取与用户问句对应的反问句的方法和装置,所述对话系统中预设有与第一标准问题对应的第一反问模块,所述第一反问模块中包括从所述第一标准问题拆分的第一子句和第二子句,所述方法包括:获取第一用户的第一问句;从所述第一问句拆分出第三子句和第四子句;确定所述第三子句与所述第一子句是否匹配;在确定所述第三子句与所述第一子句匹配的情况中,通过合并所述第四子句与所述第一子句获取第二问句;获取所述第二问句与所述第一标准问题的相似度;在所述第二问句与所述第一标准问题的相似度大于预定阈值的情况中,基于所述第一子句获取与所述第一问句对应的反问句。

    一种基于对话系统对用户问句提出反问的方法和装置

    公开(公告)号:CN110727783A

    公开(公告)日:2020-01-24

    申请号:CN201911013294.0

    申请日:2019-10-23

    Abstract: 本说明书实施例提供了一种基于对话系统对用户问句提出反问的方法和装置,所述对话系统中预设有与N个标准问题对应的M个反问模块,其中M≥N,每个反问模块中包括从相应的标准问题拆分的第一子句和第二子句,所述方法包括:获取第一用户的第一问句;对于所述M个反问模块中的每个反问模块,分别确定所述第一问句与其中的所述第一子句和第二子句是否匹配;在所述第一问句与该反问模块中的第一子句的匹配、且所述第一问句与该反问模块中的第二子句不匹配的情况中,基于该反问模块中的第二子句获取针对所述第一问句的反问句,以基于所述M个反问模块获取针对所述第一问句的多个反问句。

    一种序列标注方法和系统
    19.
    发明授权

    公开(公告)号:CN111368526B

    公开(公告)日:2023-04-25

    申请号:CN202010138420.1

    申请日:2020-03-03

    Inventor: 吴颖婷 姚开盛

    Abstract: 本说明书实施例公开了一种序列标注方法。包括:获取待标注序列的第一向量表示以及第二向量表示。第一向量表示可以反映待标注序列的文本信息,第二向量表示可以反映待标注序列的标注信息。可以基于第一向量表示与第二向量表示,获取对应于待标注序列的初始表示。可以将初始表示输入至标注模型,确定对应于待标注序列的目标标注结果;标注模型为机器学习模型。本说明书实施例公开的方法,可以提高模型的精确率和提高召回率,以及在进行序列标注时代入更多的语法和语义信息。

    自然语言生成方法及装置
    20.
    发明公开

    公开(公告)号:CN112966520A

    公开(公告)日:2021-06-15

    申请号:CN202110150679.2

    申请日:2021-02-03

    Inventor: 李扬名 姚开盛

    Abstract: 本说明书实施例提供一种自然语言生成方法。该方法包括:首先,获取第一对话动作,其n个组成元素中包括动作类型,以及n‑1个词槽‑槽值对,并对该第一对话动作进行编码,得到对应n个组成元素的n个编码向量;然后,基于该n个编码向量进行解码,依次确定待输出的自然语言文本的各个位置的语义项,其中确定任意当前位置的语义项包括:先利用表达器集合中的各个表达器,各自对前一位置输出信息进行处理,得到对应输出,再利用模式切换器对各个表达器的输出进行加权融合,得到当前位置对应的当前状态向量和当前融合概率分布,进而根据该当前融合概率分布,确定当前语义项,其中当前状态向量和当前语义项作为当前位置输出信息。

Patent Agency Ranking