-
公开(公告)号:CN111104516B
公开(公告)日:2023-07-04
申请号:CN202010084986.0
申请日:2020-02-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35
Abstract: 本说明书一个或多个实施例提供一种文本分类方法、装置及电子设备,基于BERT模型,所述BERT模型包括:至少两个依次连接的编码器层;所述方法,包括:将待分类文本输入所述BERT模型;采集每个所述编码器层的输出,得到对应于所述待分类文本的至少两个特征表示信息;融合至少两个所述特征表示信息,得到融合后的特征表示信息;融合后的特征表示信息充分利用每一编码器层的输出,且准确反映了文本所蕴含的词法和语法信息;根据所述融合后的特征表示信息,确定所述待分类文本的类型。
-
公开(公告)号:CN110727783A
公开(公告)日:2020-01-24
申请号:CN201911013294.0
申请日:2019-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332
Abstract: 本说明书实施例提供了一种基于对话系统对用户问句提出反问的方法和装置,所述对话系统中预设有与N个标准问题对应的M个反问模块,其中M≥N,每个反问模块中包括从相应的标准问题拆分的第一子句和第二子句,所述方法包括:获取第一用户的第一问句;对于所述M个反问模块中的每个反问模块,分别确定所述第一问句与其中的所述第一子句和第二子句是否匹配;在所述第一问句与该反问模块中的第一子句的匹配、且所述第一问句与该反问模块中的第二子句不匹配的情况中,基于该反问模块中的第二子句获取针对所述第一问句的反问句,以基于所述M个反问模块获取针对所述第一问句的多个反问句。
-
公开(公告)号:CN111241280B
公开(公告)日:2023-09-05
申请号:CN202010015197.1
申请日:2020-01-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35
Abstract: 本说明书实施例提供一种文本分类模型的训练方法和文本分类方法。在一个实施例中,一种文本分类模型的训练方法,包括:获取训练样本集;将训练样本集中文本样本分别输入公有特征提取器和与文本样本关联的私有特征提取器,得到文本样本的第一特征和第二特征;将文本样本的第一特征和第二特征分别输入任务判别器,得到文本样本的第一任务判别结果和第二任务判别结果;基于文本样本的第一特征和第二特征,利用与文本样本关联的私有特征提取器对应的分类器,得到文本样本的分类结果;判断是否满足预设训练停止条件;若不满足,调整文本分类模型的参数,并继续训练调整后的文本分类模型,直至满足预设训练停止条件,得到训练后的文本分类模型。
-
公开(公告)号:CN111368997B
公开(公告)日:2022-09-06
申请号:CN202010143596.6
申请日:2020-03-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种神经网络模型的训练方法及装置,在训练方法中,基于在上一周期训练后的神经网络模型,分别确定在当前周期待训练的第一模型,以及用于辅助训练第一模型的第二模型。从样本集合中选取当前标定样本,并基于其执行以下步骤:将当前标定样本输入第一模型,得到第一概率分布。基于第一概率分布,确定当前标定样本的预测标签。将当前标定样本输入第二模型,得到第二概率分布。基于标定标签和预测标签,确定第一预测损失。基于第一概率分布和第二概率分布,确定第二预测损失。结合第一预测损失和第二预测损失,调整第一模型的参数。在全部样本选取完之后,将最后一次调整参数后的第一模型作为在当前周期训练后的神经网络模型。
-
公开(公告)号:CN110991613B
公开(公告)日:2022-08-02
申请号:CN201911202733.2
申请日:2019-11-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种训练神经网络的方法及系统。所述方法包括:将训练数据输入N+K层神经网络,第N层神经网络输出第一概率分布,第N+K层神经网络输出第二概率分布;其中,N和K为大于0的整数;根据所述第一概率分布与所述训练数据的标签,确定第一反馈信号;根据所述第二概率分布与所述训练数据的标签,确定第二反馈信号;根据所述第一反馈信号调节1~N层神经网络的参数,以及根据所述第二反馈信号调节1~N+K层神经网络的参数,得到训练好的N层神经网络。
-
公开(公告)号:CN110727783B
公开(公告)日:2021-03-02
申请号:CN201911013294.0
申请日:2019-10-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332
Abstract: 本说明书实施例提供了一种基于对话系统对用户问句提出反问的方法和装置,所述对话系统中预设有与N个标准问题对应的M个反问模块,其中M≥N,每个反问模块中包括从相应的标准问题拆分的第一子句和第二子句,所述方法包括:获取第一用户的第一问句;对于所述M个反问模块中的每个反问模块,分别确定所述第一问句与其中的所述第一子句和第二子句是否匹配;在所述第一问句与该反问模块中的第一子句的匹配、且所述第一问句与该反问模块中的第二子句不匹配的情况中,基于该反问模块中的第二子句获取针对所述第一问句的反问句,以基于所述M个反问模块获取针对所述第一问句的多个反问句。
-
公开(公告)号:CN112016299A
公开(公告)日:2020-12-01
申请号:CN202010898079.X
申请日:2020-08-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/211 , G06F40/289 , G06F40/284 , G06N3/04
Abstract: 本说明书实施例了提供一种生成依存句法树的方法及装置。该方法包括:在嵌入层,对待分析句子中各个位置对应的各个字分别进行嵌入处理,得到所述各个字各自的特征向量;在字关系生成层,利用自注意力机制,基于第一字的特征向量和第二字的特征向量,确定第一字到第二字的字间依存度;第一字和第二字为所述待分析句子中两个不同位置的字;在词关系生成层,基于第一词中的字到第二词中的字的字间依存度,确定第一词到第二词的词间依存度,第一词和第二词为所述待分析句子所包含的多个词中的两个不同词;在输出层,基于所述多个词中各词相互的词间依存度,确定依存句法树。该方法可以减少集外词情况的发生,具有较高的新词容错能力。
-
公开(公告)号:CN111324738A
公开(公告)日:2020-06-23
申请号:CN202010409780.0
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例公开了一种确定文本标签的方法和系统,所述方法包括:获取文本,所述文本对应至少一个候选标签;基于文本和至少一个候选标签中的一个组成文本标签对;将文本标签对输入判断模型,所述判断模型包含至少一个交互模型,判断模型基于交互模型输出的文本标签对中候选标签的交互编码,确定候选标签是否为文本的真实标签;其中,所述交互模型包含第一编码模型,所述第一编码模型基于第一多头注意力机制,得到候选标签的交互编码;其中:文本的编码作为第一多头注意力机制中计算K和V的输入,候选标签的编码作为第一多头注意力机制中计算Q的输入。
-
公开(公告)号:CN111221945A
公开(公告)日:2020-06-02
申请号:CN202010329631.3
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33
Abstract: 本说明书实施例提供一种基于用户问句生成标准问题的方法和装置,方法包括:获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;提取所述第一多轮对话中第一数目轮的用户问句;对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。能够提高标准问题的生产效率,相应提升标准问题的覆盖率。
-
公开(公告)号:CN111198949A
公开(公告)日:2020-05-26
申请号:CN202010276658.0
申请日:2020-04-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供一种文本标签确定方法和系统。该方法包括:获取待分析文本;将所述待分析文本向量化后得到文本向量,并存入记忆组件;将候选标签向量化以确定查询向量;基于所述查询向量和所述记忆组件中的文本向量确定关系向量;基于所述关系向量通过分类模型判断所述候选标签是否为所述待分析文本的标签。
-
-
-
-
-
-
-
-
-