-
公开(公告)号:CN111340245B
公开(公告)日:2022-07-12
申请号:CN202010118876.1
申请日:2020-02-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/10
Abstract: 本说明书实施例公开了一种模型训练方法及系统,所述方法包括,获取经过训练数据训练的k个同类型的子模型,所述k为大于或等于2的整数,所述训练数据包括图像数据、文本数据或音频数据;获取所述k个子模型中每个子模型的与模型性能相关的评价参数;基于所述k个子模型及其评价参数,确定最终模型,所述最终模型的模型参数为:所述k个子模型的模型参数以其评价参数为权重的加权运算结果。
-
公开(公告)号:CN113221555A
公开(公告)日:2021-08-06
申请号:CN202110493880.0
申请日:2021-05-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种基于多任务模型的关键词识别方法、装置以及设备。方案包括:获取训练文本,为训练文本中的各字符分别标注第一标签,以表示对应的字符是否位于其所在词的起始位置或者终止位置;为训练文本中的各字符分别标注第二标签,以表示对应的字符所在词是否为关键词;根据第一标签确定第一训练任务,以及根据第二标签确定第二训练任务;将第一训练任务和第二训练任务进行联合训练,得到关键词识别模型;利用关键词识别模型,识别输入文本中的关键词。
-
公开(公告)号:CN112100387A
公开(公告)日:2020-12-18
申请号:CN202011269071.3
申请日:2020-11-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用于文本分类的神经网络系统的训练方法,该神经网络系统包括文本表征网络、特征提取层和分类网络。该训练方法包括:首先,获取训练文本集,该训练文本集对应K个类别;接着,针对该训练文本集中任一的第一训练文本,利用上述文本表征网络对其进行处理,得到第一文本向量;然后,利用上述特征提取层,将该第一文本向量分别与对应所述K个类别的K个类别特征向量进行组合操作,得到K个特征提取向量;再接着,基于该K个特征提取向量和上述分类网络,确定分类预测结果;再然后,基于该分类预测结果和上述第一训练文本的类别标签,训练上述神经网络系统。
-
公开(公告)号:CN111444329B
公开(公告)日:2020-10-09
申请号:CN202010533383.4
申请日:2020-06-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书提出了一种智能对话方法、装置和电子设备,其中,上述方法包括:获取当前用户的提问语句,将所述提问语句输入至多个预置问答模型,得到对应的多条回答语句,其中,所述预置问答模型用于根据所述提问语句生成对应的回答语句;分别将每条所述回答语句和与所述当前用户对应的历史对话语句进行组合,得到对应的多个对话语句序列;将所述对话语句序列输入至预置输出模型进行计算,得到每个所述对话语句序列对应的置信度,根据所述置信度获得最终的回答语句。通过上述方法可以实现智能的对话,由此可以减少对人工标注数据的依赖,提高对话的效率,提升用户体验。
-
公开(公告)号:CN111538906A
公开(公告)日:2020-08-14
申请号:CN202010477510.3
申请日:2020-05-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F21/62 , G06F40/30 , G06N3/04
Abstract: 本说明书实施例提供一种基于隐私保护的信息推送方法和装置,可以用于在保护用户隐私数据的前提下,基于历史会话中的对象选择序列建立异构图,并根据异构图体现出的推送对象之间的深层关联关系,从多个候选推送对象中确定若干个目标对象进行信息推送。根据一个实施方式,可以获取当前会话中的对象选择序列,并添加目标项构成预测序列,接着,将预测序列中的各项基于异构图确定描述向量,再根据各个描述向量推测目标项的预测向量,之后根据预测向量和各个候选推送对象的描述向量的对比,为目标项确定多个目标对象。该实施方式可以提高信息推送的准确度。
-
公开(公告)号:CN111444308A
公开(公告)日:2020-07-24
申请号:CN202010535282.0
申请日:2020-06-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/31 , G06F16/332 , G06F40/216 , G06F40/30 , G06N20/00
Abstract: 本说明书的实施例公开了一种模拟用户发言的方法和系统,所述方法包括:获取待模拟对话,基于待模拟对话确定检索项,检索项至少包括:待模拟对话任意一轮的用户意图、待模拟对话任意一轮的客服响应策略和待模拟对话的最新客服发言;将检索项和索引库中对应的索引内容分别进行匹配,获取匹配结果;索引库中包含多组索引,多组索引基于多个历史对话上文生成,多组索引中任意一组的索引内容至少包括:历史最新客服发言、历史最新用户发言、历史客服响应策略链路和历史用户意图链路;基于匹配结果,确定多组索引中所述历史最新用户发言的分数;将分数满足预设条件的历史最新用户发言,作为待模拟对话的用户的后续发言。
-
公开(公告)号:CN111428023A
公开(公告)日:2020-07-17
申请号:CN202010224908.6
申请日:2020-03-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/335 , G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提出了一种话术推荐方法、装置和电子设备,其中,上述话术推荐方法中,获取当前对话中用户输入的对话内容之后,根据上述用户输入的对话内容,通过预先训练的话术推荐模型,生成上述对话内容对应的回答话术,然后在上述当前对话中输出上述回答话术。由于上述话术推荐模型是利用用户模拟内容和上述用户模拟内容对应的回答话术组成的对话语料训练获得的,上述用户模拟内容是模拟用户说的内容,对应的回答话术是机器人针对上述用户模拟内容给出的答复。
-
公开(公告)号:CN111414468A
公开(公告)日:2020-07-14
申请号:CN202010221610.X
申请日:2020-03-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/335 , G06F16/35 , G06N3/04
Abstract: 本说明书提出了一种话术选择方法、装置和电子设备,其中,上述话术选择方法中,获取当前对话中机器人和用户已输出的对话内容之后,根据上述对话内容,获得句子整体特征,然后对上述句子整体特征进行分类,获得上述句子整体特征对应的策略,并获得上述策略中包括的话术,根据上述对话内容,对上述话术进行评分,最后选择评分高于预定的第一阈值的话术进行输出。
-
公开(公告)号:CN111401928A
公开(公告)日:2020-07-10
申请号:CN202010252268.X
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/00 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供了利用图数据确定文本的语义相似度的构思,在该技术构思下,图数据中的节点对应语料库中的句子和词,相关联的句子和词、词和词之间通过连接边连接,各个节点对应有能够表达相应词或句子的语义信息的节点表达向量。在对图数据的数据预处理过程中,能够利用大量无监督数据构建图数据,来描述词和句子、词和词之间的关系,并通过少量有监督数据优化处理模型的模型参数,使得相似文本的向量表示可以相互影响,从而通过图数据对文本和词汇进行有效的向量表达。在确定文本的语义相似度时,通过图数据获取待确定语义相似度文本的向量,利用向量相似度确定文本语义相似度。如此,可以提高文本语义相似度的通用性、准确度、有效性。
-
公开(公告)号:CN111353028A
公开(公告)日:2020-06-30
申请号:CN202010103625.6
申请日:2020-02-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06Q30/00
Abstract: 本说明书的实施例提供了一种用于确定客服话术簇的方法及装置。在该方法中,从人工客服数据集中来确定候选客服话术集,使用业务话术筛选模型来从候选客服话术集中筛选分别针对不同业务类型的多个业务话术集,进而通过语义模型来从业务话术集中确定至少一个客服话术簇,可以为客服进行业务服务过程中遇到的相同或相似的用户问题提供参考。
-
-
-
-
-
-
-
-
-