-
公开(公告)号:CN115358335A
公开(公告)日:2022-11-18
申请号:CN202211035229.X
申请日:2022-08-26
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 马良庄
Abstract: 本说明书实施例提供目标对象评测方法及装置,该方法包括确定目标对象、评测数据集合、以及与所述目标对象对应的基准对象;根据所述评测数据集合,分别对所述目标对象以及所述基准对象进行训练和预测,获得所述目标对象的初始评测指标以及资源使用初始结果、所述基准对象的资源使用初始结果;根据所述目标对象的初始评测指标以及资源使用初始结果、所述基准对象的资源使用初始结果,获得所述目标对象的第一目标评测指标。该方法能够综合目标对象在评测数据集合的初始评测指标、结合目标对象相对于该评测数据集合的资源使用初始结果、基准对象相对于该评测数据集合的资源使用初始结果对其评测指标进行综合评测,提高目标对象的评测指标准确性。
-
公开(公告)号:CN111143552B
公开(公告)日:2023-06-27
申请号:CN201911236894.3
申请日:2019-12-05
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 马良庄
IPC: G06F16/35
Abstract: 本说明书实施例提供一种文本信息的类别预测方法和装置、服务器,通过采用多个第一文本分类模型对待处理文本信息进行预测,再融合各个第一文本分类模型输出的第一预测类别,以获取所述待处理文本信息的真实类别。由于各个第一文本分类模型中的至少一者为欠拟合模型,因此,通过包含欠拟合模型的多个第一文本分类模型来代替原有的单个文本分类模型,使得欠拟合模型能够对最终的预测结果进行约束,提高了模型的泛化能力,从而提高了分类结果的准确性。
-
公开(公告)号:CN111309882B
公开(公告)日:2023-06-09
申请号:CN202010089800.0
申请日:2020-02-13
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 马良庄
IPC: G06F16/332 , G06F16/35
Abstract: 本说明书的实施例提供了用于实现智能客服问答的方法、装置、计算设备和机器可读存储介质。该方法可以包括:获取用户的问句文本;对问句文本进行分类识别处理,以确定问句文本是否包括有效信息,其中,有效信息包括业务词和诉求信息中的至少一项,业务词表示问句文本涉及的业务,诉求信息表示用户的疑问点;基于问句文本是否包括有效信息,确定针对问句文本的答复。
-
公开(公告)号:CN111309908B
公开(公告)日:2023-08-25
申请号:CN202010088116.0
申请日:2020-02-12
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 马良庄
Abstract: 本说明书实施例提供了一种文本数据处理方法及装置,该方法包括:对第一文本数据进行遮蔽处理,并将经过遮蔽处理后的第一文本数据提供给文本预测模型,以根据文本数据中的各个遮蔽部分的上下文来得到各个遮蔽部分的至少一个预测文本,再使用所得到的至少一个预测文本来替换对应的遮蔽部分,以得到至少一个第二文本数据。
-
公开(公告)号:CN111382271B
公开(公告)日:2023-05-23
申请号:CN202010156375.2
申请日:2020-03-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供一种文本分类模型的训练方法,此方法包括:首先,获取N个原始文本和对应的N个文本类别标签,其中N为大于1的正整数;接着,对N个原始文本进行拼接,得到拼接文本;然后,分别对N个文本类别标签进行独热编码,得到N个类别标签向量;再接着,对N个类别标签向量进行平均处理,得到综合标签向量;再然后,将该拼接文本输入文本分类模型中,得到综合分类结果;再基于该综合分类结果和该综合标签向量,训练所述文本分类模型。此外,本说明书实施例还提供一种文本分类方法,此方法包括:获取待分类的目标文本,并对其复制得到N个目标文本,进行拼接后输入利用上述训练方法得到的文本分类模型中,得到目标文本的文本分类结果。
-
公开(公告)号:CN111159397B
公开(公告)日:2023-04-18
申请号:CN201911227485.7
申请日:2019-12-04
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 马良庄
IPC: G06F16/35
Abstract: 本说明书实施例提供一种文本分类方法和装置、服务器,通过特征提取能力相对低的第二文本分类模型输出第一训练文本的预测类别,再通过由第一训练文本以及第一训练文本的真实类别和预测类别训练出的第一文本分类模型对接收到的文本信息进行分类。由于第二文本分类模型的特征提取能力小于第一文本分类模型,因此,通过第二文本分类模型能够对第一文本分类模型进行约束,从而可以有效控制第一文本分类模型的过拟合,从而提高文本分类的准确性。
-
公开(公告)号:CN111159397A
公开(公告)日:2020-05-15
申请号:CN201911227485.7
申请日:2019-12-04
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 马良庄
IPC: G06F16/35
Abstract: 本说明书实施例提供一种文本分类方法和装置、服务器,通过特征提取能力相对低的第二文本分类模型输出第一训练文本的预测类别,再通过由第一训练文本以及第一训练文本的真实类别和预测类别训练出的第一文本分类模型对接收到的文本信息进行分类。由于第二文本分类模型的特征提取能力小于第一文本分类模型,因此,通过第二文本分类模型能够对第一文本分类模型进行约束,从而可以有效控制第一文本分类模型的过拟合,从而提高文本分类的准确性。
-
公开(公告)号:CN111340150B
公开(公告)日:2020-09-04
申请号:CN202010442269.0
申请日:2020-05-22
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 马良庄
Abstract: 本说明书实施例提供了一种用于对第一分类模型进行训练的方法及装置。在该方法的每次循环训练过程中,将来自于第一本地数据的当前训练样本数据提供给第一分类模型和各个第二分类模型,得到第一预测结果和第二预测结果,基于第一预测结果和各个第二预测结果确定当前损失函数,并在不满足循环结束条件时调整第一分类模型,在满足循环结束条件时输出第一分类模型。所述第一本地数据是隐私数据,所述各个第二分类模型是基于第二本地数据预先训练好的,该第二本地数据也是隐私数据。
-
公开(公告)号:CN111382271A
公开(公告)日:2020-07-07
申请号:CN202010156375.2
申请日:2020-03-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种文本分类模型的训练方法,此方法包括:首先,获取N个原始文本和对应的N个文本类别标签,其中N为大于1的正整数;接着,对N个原始文本进行拼接,得到拼接文本;然后,分别对N个文本类别标签进行独热编码,得到N个类别标签向量;再接着,对N个类别标签向量进行平均处理,得到综合标签向量;再然后,将该拼接文本输入文本分类模型中,得到综合分类结果;再基于该综合分类结果和该综合标签向量,训练所述文本分类模型。此外,本说明书实施例还提供一种文本分类方法,此方法包括:获取待分类的目标文本,并对其复制得到N个目标文本,进行拼接后输入利用上述训练方法得到的文本分类模型中,得到目标文本的文本分类结果。
-
公开(公告)号:CN111309882A
公开(公告)日:2020-06-19
申请号:CN202010089800.0
申请日:2020-02-13
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 马良庄
IPC: G06F16/332 , G06F16/35
Abstract: 本说明书的实施例提供了用于实现智能客服问答的方法、装置、计算设备和机器可读存储介质。该方法可以包括:获取用户的问句文本;对问句文本进行分类识别处理,以确定问句文本是否包括有效信息,其中,有效信息包括业务词和诉求信息中的至少一项,业务词表示问句文本涉及的业务,诉求信息表示用户的疑问点;基于问句文本是否包括有效信息,确定针对问句文本的答复。
-
-
-
-
-
-
-
-
-