-
公开(公告)号:CN118469010A
公开(公告)日:2024-08-09
申请号:CN202410139966.7
申请日:2024-01-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/04 , G06N3/0455 , G06N3/096 , G06F18/22
Abstract: 本说明书实施例公开了一种模型的安全防护方法、装置及设备,该方法包括:获取用户输入到目标语言模型中的问题数据,然后,可以将该问题数据输入到文本编码器中,得到该问题数据对应的问题表征,之后,可以获取针对目标语言模型的一个或多个不同的风险标签中每个风险标签对应的标签表征,该标签表征是在每个风险标签中添加辅助信息后,通过文本编码器生成的表征,最终,可以基于该问题表征与每个风险标签对应的标签表征之间的相似度,确定该问题数据对应的风险标签,并基于该问题数据对应的风险标签执行针对目标语言模型的风险防控处理。
-
公开(公告)号:CN118227806A
公开(公告)日:2024-06-21
申请号:CN202410384521.5
申请日:2024-03-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/38 , G06F40/284 , G06F18/25 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开了一种变种文本相似检索的风控方法、装置、介质及设备,获取已识别出的风险文本。将风险文本进行变种,得到风险文本的变种文本。将风险文本和变种文本输入待训练的提取模型,分别确定风险文本和变种文本的文本特征,并确定风险文本和变种文本的文本特征之间的相似度,以相似度大于预设的相似度阈值为目标,训练提取模型。通过训练完成的提取模型,确定数据库中的风险样本的文本特征,根据风险样本的文本特征进行风控,达到识别并防控变种的风险文本的效果。
-
公开(公告)号:CN113837118B
公开(公告)日:2024-04-26
申请号:CN202111141052.7
申请日:2021-09-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种文本变异关系的获取方法及装置以及真实文本的获取方法及装置。首先,得到变异文本字符;将该变异文本字符转换为第一图像;对转换出的第一图像进行图像变换处理,得到第二图像;对变换处理后得到的第二图像进行OCR识别,得到第二图像对应的OCR识别字符;将所述变异文本字符与所述第二图像对应的OCR识别字符的映射关系作为文本变异关系;根据文本变异关系得到待识别的第一文本字符串对应的第二文本字符串,根据第二文本字符串得到真实文本。本说明书实施例能够更为全面地得到文本变异关系并得到具有更加真实语义的真实文本。
-
公开(公告)号:CN113486656B
公开(公告)日:2023-11-10
申请号:CN202110808793.X
申请日:2021-07-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F16/36
Abstract: 本说明书实施例提供了一种语料生成方法及装置,该方法包括:获取原始文本;对原始文本进行关键词匹配,从而确定出原始文本中的违规关键词以及其对应的基本关键词,基本关键词对应于违规关键词的正确形态;确定基本关键词的违规要素,并确定出与基本关键词关于违规要素存在关联的关联关键词;对关联关键词进行文本变种,获取变种文本;以变种文本,替换原始文本中的违规关键词,生成语料文本。
-
公开(公告)号:CN116521864A
公开(公告)日:2023-08-01
申请号:CN202310327646.X
申请日:2023-03-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F18/40 , G06F18/214
Abstract: 本说明书实施例公开了一种用于文本类模型的精调阶段蒸馏方法,包括:获取训练集样本以及经过预训练的教师模型,所述教师模型包括多个隐藏层;在所述教师模型的多个隐藏层中选择至少两个指定层进行聚合,得到聚合后隐藏层;根据所述聚合后隐藏层和教师模型中的剩余非指定层生成学生模型;采用教师模型蒸馏学生模型;将蒸馏后的学生模型重新作为教师模型,直至无法从教师模型中选择出至少两个指定层时,将此时的教师模型作为目标模型。相应地,本说明实施例还公开了用于文本类模型的精调阶段蒸馏装置。
-
公开(公告)号:CN116306869A
公开(公告)日:2023-06-23
申请号:CN202310240367.X
申请日:2023-03-07
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种训练文本分类模型的方法、文本分类方法及对应装置。主要技术方案包括:将已经训练得到的第一文本分类模型作为教师模型;利用第一分类模型中的嵌入模块、解码模块以及减少层数后的编码模块得到学生模型,且在学生模型的编码模块和解码模块之间增加了映射模块;将训练样本中的文本样本作为教师模型和学生模型的输入用以训练学生模型,利用训练得到的学生模型得到第二文本分类模型;训练的目标为:最小化教师模型的编码模块输出的第一特征表示分布与学生模型的映射模块输出的第三特征表示分布之间的差异。本说明书实施例能够在保证模型鲁棒性的基础上降低超参数的数量,从而降低因确定最优超参所带来的整体耗时和对资源的消耗。
-
公开(公告)号:CN113486656A
公开(公告)日:2021-10-08
申请号:CN202110808793.X
申请日:2021-07-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F16/36
Abstract: 本说明书实施例提供了一种语料生成方法及装置,该方法包括:获取原始文本;对原始文本进行关键词匹配,从而确定出原始文本中的违规关键词以及其对应的基本关键词,基本关键词对应于违规关键词的正确形态;确定基本关键词的违规要素,并确定出与基本关键词关于违规要素存在关联的关联关键词;对关联关键词进行文本变种,获取变种文本;以变种文本,替换原始文本中的违规关键词,生成语料文本。
-
公开(公告)号:CN118428456A
公开(公告)日:2024-08-02
申请号:CN202410524677.9
申请日:2024-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/10 , G06N3/082 , G06N3/0495 , G06N3/045
Abstract: 本说明书公开了一种模型部署方法、装置、存储介质及电子设备。该模型部署的方法包括:获取训练各原始模型的各原始训练样本集,并将各原始训练样本集进行合并,得到合并训练样本集;针对合并训练样本集中包含的每个训练样本,将该训练样本输入到待训练的合并模型以及各原始模型中,以获得待训练的合并模型输出得针对该训练样本的待验证结果和各原始模型分别输出的针对该训练样本的原始输出结果,最后,以最小化该训练样本对应的标签结果与该训练样本对应的待验证结果之间的偏差,以及最小化该训练样本对应的各原始输出结果与该训练样本对应的待验证结果之间的偏差为优化目标,对合并模型进行训练,并将训练后的合并模型替换各原始模型进行部署。
-
公开(公告)号:CN117786107A
公开(公告)日:2024-03-29
申请号:CN202311754776.8
申请日:2023-12-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F18/214 , G06F18/241 , G06N3/045 , G06N3/096
Abstract: 本说明书公开了一种文本分类模型的训练方法、装置、介质及电子设备,所述方法包括:确定文本样本和以及确定预先训练的若干教师模型。再按照各教师模型的参数量从小到大的顺序,依次针对每个教师模型,将文本样本输入该教师模型,确定伪标结果,以及将文本样本输入待训练的学生模型,确定分类结果,至少根据基于该教师模型得到的伪标结果以及分类结果,对待训练的学生模型进行训练。之后,将训练完成的学生模型作为文本分类模型。通过各教师指导学生模型训练,提高文本分类模型的文本表征能力和分类准确率。
-
公开(公告)号:CN117392688A
公开(公告)日:2024-01-12
申请号:CN202311289458.9
申请日:2023-10-07
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种图像分类的方法、装置、存储介质及电子设备,用于隐私保护,可以获取待识别图像,对该待识别图像中包含的文本信息进行识别,得到识别结果,而后,根据该识别结果,确定待识别图像中包含的文本信息以及确定文本信息在待识别图像中的布局信息,待识别图像和文本信息输入到预先训练的分类模型中的第一特征提取层中,得到待识别图像的图像特征和文本信息的文本特征,以及将布局信息输入分类模型中的第二特征提取层中得到布局特征,通过分类模型中的特征融合层,将图像特征、文本特征以及布局特征进行融合,得到融合特征,并根据融合特征得到分类结果,根据分类结果,以对待识别图像进行图像分类,提高了图像分类的准确率。
-
-
-
-
-
-
-
-
-