-
公开(公告)号:CN111400481B
公开(公告)日:2023-04-28
申请号:CN202010410108.3
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332
Abstract: 本说明书实施例提供一种针对多轮对话生成回复语句的方法和装置,方法包括:获取历史上下文;对历史上下文基于注意力机制进行编码,得到历史上下文对应的上下文向量,以及历史上下文对应的第一分词序列的编码注意力分布;对候选知识集合中的各候选知识基于注意力机制进行编码,得到候选知识集合对应的知识融合向量,以及候选知识集合对应的第二分词序列的知识注意力分布;针对回复语句进行逐词预测,其中每次预测包括:对于扩充词表中每个候选词,得到将该候选词作为下一个词的预测概率;扩充词表包括,用于生成候选词的初始词表,第一分词序列中各分词,以及第二分词序列中各分词。在针对多轮对话生成回复语句时能够处理词汇不足单词。
-
公开(公告)号:CN111382257A
公开(公告)日:2020-07-07
申请号:CN202010470216.X
申请日:2020-05-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06N3/04
Abstract: 本说明书实施例公开了一种生成对话下文的方法及系统。所述方法包括:获取对话上文,根据所述对话上文获取与所述对话上文相关的至少一个知识文本,并生成所述至少一个知识文本对应的至少一个知识向量k1~km;所述知识文本存储在知识库中;根据至少一个所述知识向量k1~km和当前时刻的解码隐藏状态St,使用第一注意力模型生成当前时刻的知识融合向量 ;基于所述当前时刻的知识融合向量、当前时刻的上下文向量 以及所述当前时刻的解码隐藏状语组态S成t,所生述成对当话前下时文刻,所的述对y话1表下示文t词=1时语的yt;对y1话~y下t的文对词话语下。文词
-
公开(公告)号:CN113220553A
公开(公告)日:2021-08-06
申请号:CN202110521528.3
申请日:2021-05-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 说明书披露一种文本预测模型性能的评估方法和装置。一种文本预测模型性能的评估方法,包括:获取待评估的文本预测模型的若干原始测试文本;将所述原始测试文本输入已训练的生成对抗神经网络,得到所述原始测试文本对应的变种测试文本;其中,所述生成对抗神经网络包括生成子网络和分类子网络,所述生成子网络用于为所述原始测试文本生成对应的变种测试文本,所述变种测试文本的真实类别与所述原始测试文本的类别相同,所述分类子网络对所述原始测试文本和所述变种测试文本的分类结果不同;基于所述若干变种测试文本,对所述待评估的文本预测模型的性能进行评估。
-
公开(公告)号:CN112541350A
公开(公告)日:2021-03-23
申请号:CN202011402808.4
申请日:2020-12-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种变种文本还原方法、装置以及设备。方案包括:获取包含变种内容的源文本;通过基于注意力机制的机器学习模型,对源文本进行处理,得到源文本对应的上下文向量和注意力分布;对上下文向量进行解析,得到中间结果;确定针对注意力分布的指针生成网络的拷贝指针;通过拷贝指针,根据源文本中的至少部分内容或者注意力分布对中间结果进行调整,得到源文本对应的还原文本。
-
公开(公告)号:CN112541350B
公开(公告)日:2024-06-14
申请号:CN202011402808.4
申请日:2020-12-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/284 , G06N3/0442 , G06N3/0455 , G06N3/09 , G06N3/048
Abstract: 本说明书实施例公开了一种变种文本还原方法、装置以及设备。方案包括:获取包含变种内容的源文本;通过基于注意力机制的机器学习模型,对源文本进行处理,得到源文本对应的上下文向量和注意力分布;对上下文向量进行解析,得到中间结果;确定针对注意力分布的指针生成网络的拷贝指针;通过拷贝指针,根据源文本中的至少部分内容或者注意力分布对中间结果进行调整,得到源文本对应的还原文本。
-
公开(公告)号:CN113220553B
公开(公告)日:2022-06-17
申请号:CN202110521528.3
申请日:2021-05-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 说明书披露一种文本预测模型性能的评估方法和装置。一种文本预测模型性能的评估方法,包括:获取待评估的文本预测模型的若干原始测试文本;将所述原始测试文本输入已训练的生成对抗神经网络,得到所述原始测试文本对应的变种测试文本;其中,所述生成对抗神经网络包括生成子网络和分类子网络,所述生成子网络用于为所述原始测试文本生成对应的变种测试文本,所述变种测试文本的真实类别与所述原始测试文本的类别相同,所述分类子网络对所述原始测试文本和所述变种测试文本的分类结果不同;基于所述若干变种测试文本,对所述待评估的文本预测模型的性能进行评估。
-
公开(公告)号:CN111400481A
公开(公告)日:2020-07-10
申请号:CN202010410108.3
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332
Abstract: 本说明书实施例提供一种针对多轮对话生成回复语句的方法和装置,方法包括:获取历史上下文;对历史上下文基于注意力机制进行编码,得到历史上下文对应的上下文向量,以及历史上下文对应的第一分词序列的编码注意力分布;对候选知识集合中的各候选知识基于注意力机制进行编码,得到候选知识集合对应的知识融合向量,以及候选知识集合对应的第二分词序列的知识注意力分布;针对回复语句进行逐词预测,其中每次预测包括:对于扩充词表中每个候选词,得到将该候选词作为下一个词的预测概率;扩充词表包括,用于生成候选词的初始词表,第一分词序列中各分词,以及第二分词序列中各分词。在针对多轮对话生成回复语句时能够处理词汇不足单词。
-
-
-
-
-
-