-
公开(公告)号:CN113221555B
公开(公告)日:2023-11-14
申请号:CN202110493880.0
申请日:2021-05-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种基于多任务模型的关键词识别方法、装置以及设备。方案包括:获取训练文本,为训练文本中的各字符分别标注第一标签,以表示对应的字符是否位于其所在词的起始位置或者终止位置;为训练文本中的各字符分别标注第二标签,以表示对应的字符所在词是否为关键词;根据第一标签确定第一训练任务,以及根据第二标签确定第二训练任务;将第一训练任务和第二训练任务进行联合训练,得到关键词识别模型;利用关键词识别模型,识别输入文本中的关键词。
-
公开(公告)号:CN111401076B
公开(公告)日:2023-04-25
申请号:CN202010272706.9
申请日:2020-04-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/289 , G06N3/044
Abstract: 本说明书一个或多个实施例提供一种文本的相似度确定方法、装置和电子设备;所述方法包括:获取第一文本和第二文本;根据所述第一文本和第二文本,得到对应于所述第一文本和所述第二文本的文本表示向量;根据所述第一文本和第二文本,确定共有单字表示向量和差异单字表示向量;其中,所述共有单字表示向量对应于在所述第一文本和所述第二文本中均存在的单字,所述差异单字表示向量对应于仅在所述第一文本和所述第二文本之一中存在的单字;根据所述文本表示向量、所述共有单字表示向量和所述差异单字表示向量,得到对应于所述第一文本和所述第二文本的文本特征向量;根据所述文本特征向量,确定所述第一文本和所述第二文本的相似度。
-
公开(公告)号:CN111340245B
公开(公告)日:2022-07-12
申请号:CN202010118876.1
申请日:2020-02-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/10
Abstract: 本说明书实施例公开了一种模型训练方法及系统,所述方法包括,获取经过训练数据训练的k个同类型的子模型,所述k为大于或等于2的整数,所述训练数据包括图像数据、文本数据或音频数据;获取所述k个子模型中每个子模型的与模型性能相关的评价参数;基于所述k个子模型及其评价参数,确定最终模型,所述最终模型的模型参数为:所述k个子模型的模型参数以其评价参数为权重的加权运算结果。
-
公开(公告)号:CN113221555A
公开(公告)日:2021-08-06
申请号:CN202110493880.0
申请日:2021-05-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种基于多任务模型的关键词识别方法、装置以及设备。方案包括:获取训练文本,为训练文本中的各字符分别标注第一标签,以表示对应的字符是否位于其所在词的起始位置或者终止位置;为训练文本中的各字符分别标注第二标签,以表示对应的字符所在词是否为关键词;根据第一标签确定第一训练任务,以及根据第二标签确定第二训练任务;将第一训练任务和第二训练任务进行联合训练,得到关键词识别模型;利用关键词识别模型,识别输入文本中的关键词。
-
公开(公告)号:CN111538906A
公开(公告)日:2020-08-14
申请号:CN202010477510.3
申请日:2020-05-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F21/62 , G06F40/30 , G06N3/04
Abstract: 本说明书实施例提供一种基于隐私保护的信息推送方法和装置,可以用于在保护用户隐私数据的前提下,基于历史会话中的对象选择序列建立异构图,并根据异构图体现出的推送对象之间的深层关联关系,从多个候选推送对象中确定若干个目标对象进行信息推送。根据一个实施方式,可以获取当前会话中的对象选择序列,并添加目标项构成预测序列,接着,将预测序列中的各项基于异构图确定描述向量,再根据各个描述向量推测目标项的预测向量,之后根据预测向量和各个候选推送对象的描述向量的对比,为目标项确定多个目标对象。该实施方式可以提高信息推送的准确度。
-
公开(公告)号:CN111401928A
公开(公告)日:2020-07-10
申请号:CN202010252268.X
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/00 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供了利用图数据确定文本的语义相似度的构思,在该技术构思下,图数据中的节点对应语料库中的句子和词,相关联的句子和词、词和词之间通过连接边连接,各个节点对应有能够表达相应词或句子的语义信息的节点表达向量。在对图数据的数据预处理过程中,能够利用大量无监督数据构建图数据,来描述词和句子、词和词之间的关系,并通过少量有监督数据优化处理模型的模型参数,使得相似文本的向量表示可以相互影响,从而通过图数据对文本和词汇进行有效的向量表达。在确定文本的语义相似度时,通过图数据获取待确定语义相似度文本的向量,利用向量相似度确定文本语义相似度。如此,可以提高文本语义相似度的通用性、准确度、有效性。
-
公开(公告)号:CN111324722A
公开(公告)日:2020-06-23
申请号:CN202010409812.7
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书实施例提供一种训练词语权重模型的方法和系统。所述方法包括:获取多个文本对;判断所述文本对中两个文本之间是否匹配,得到匹配结果;基于所述匹配结果确定所述文本对中文本的词语的重要性标识,得到含有所述重要性标识的多个文本对;基于多个训练数据训练词语权重模型,所述训练数据来源于含有所述重要性标识的多个文本对中的文本。
-
公开(公告)号:CN110704586A
公开(公告)日:2020-01-17
申请号:CN201910940746.3
申请日:2019-09-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/9535 , G06N20/00
Abstract: 本说明书实施例公开了一种信息处理方法及系统。所述方法包括:获取对话信息,所述对话信息包括角色信息及其对应的内容信息;确定对话信息对应的对话文本;至少基于机器学习模型和所述对话文本确定对话文本的向量表示;基于对话文本的向量表示确定所述对话信息的属性或分类。
-
公开(公告)号:CN112115268B
公开(公告)日:2024-04-09
申请号:CN202011039098.3
申请日:2020-09-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于特征编码器的训练方法及装置、分类方法及装置。在该方法中,获取当前训练样本,将当前训练样本以及用于分类的多个文本类别分别输入特征编码器,输出各个当前训练样本对应的样本特征向量以及多个文本类别对应的分类矩阵;基于输出的样本特征向量以及分类矩阵得到当前训练样本针对各个文本类别的预测值;以及在不满足循环结束条件时,根据所得到的预测值和当前训练样本的真实分类类别对特征编码器的编码器参数进行调整,调整后的特征编码器作为下一次循环的特征编码器。
-
公开(公告)号:CN111309878B
公开(公告)日:2023-08-22
申请号:CN202010059894.7
申请日:2020-01-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书提供一种检索式问答方法,包括:对接收的第一文本进行分词,得到至少一个第一词语;确定所述至少一个第一词语的词权重;根据所述至少一个第一词语从知识库召回至少一个候选问题‑答案对;针对每个候选问题‑答案对,分别将候选问题‑答案对中的问题作为第二文本,确定所述第二文本包含的至少一个第二词语及其词权重;根据所述至少一个第一词语、所述至少一个第二词语及其词权重确定第一文本和候选问题‑答案对中每个问题的匹配度;根据确定的匹配度返回至少一个候选问题‑答案对中的答案。本说明书还提供了实现了检索式问答的服务器、电子设备以及计算机可读存储介质。
-
-
-
-
-
-
-
-
-