-
公开(公告)号:CN117909504A
公开(公告)日:2024-04-19
申请号:CN202410171791.8
申请日:2024-02-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种文本质量评估、以及文本质量评估模型的训练方法及装置,应用于预先训练得到的文本质量评估模型,包括:响应于获取到的待评估文本,判断所述待评估文本是否存在文本错误;在所述待评估文本存在文本错误的情况下,从预先定义的多个错误类型中确定出匹配于所述待评估文本的目标类型,并从所述目标类型对应的多个具体错误问题中确定出匹配于所述待评估文本的目标错误问题;将所述目标错误问题标注于所述待评估文本,并输出标注得到的文本质量评估结果。
-
公开(公告)号:CN117216271A
公开(公告)日:2023-12-12
申请号:CN202311181820.0
申请日:2023-09-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/211 , G06F40/295 , G06N20/00
Abstract: 本说明书实施例公开了一种文章文本处理方法、装置以及设备。方案包括:获取自动生成的文章文本;将所述文章文本按句拆分,得到相应的多个句子文本;确定根据大语言模型获得的一个或多个第一检测模型,以及根据命名实体识别模型获得的第二检测模型;利用所述第一检测模型检测所述句子文本和所述文章文本,以确定是否存在质量问题,其中,针对所述句子文本检测的质量问题与针对所述句子文本检测的质量问题至少部分不同;若确定所述句子文本存在质量问题,则利用所述第二检测模型,对存在质量问题的所述句子文本继续检测,以确定所述质量问题出现的具体位置;输出所得到的检测结果。
-
公开(公告)号:CN117009622A
公开(公告)日:2023-11-07
申请号:CN202310893016.9
申请日:2023-07-19
Applicant: 支付宝(杭州)信息技术有限公司 , 浙江工业大学
IPC: G06F16/953 , G06F16/583 , G06F16/55 , G06F16/33 , G06F16/35
Abstract: 本说明书实施例公开了一种舆情根因分析模型的训练方法和根因分析方法,涉及自然语言处理领域。在本说明书中,通过提取多个训练数据的多模态混合特征对多个训练数据进行聚类处理,以及构建多个训练数据对应的与舆情根因相关的知识图谱,从而训练得到舆情根因分析模型。进一步的,对待分析数据进行舆情根因分析时,基于舆情根因分析模型提取待分析数据对应的多模态混合特征并构建知识图谱,通过对待分析数据的知识图谱进行图谱补全的方式,预测待分析数据的舆情根因。
-
公开(公告)号:CN116205656A
公开(公告)日:2023-06-02
申请号:CN202310094076.4
申请日:2023-01-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/01 , G06Q30/0645 , G06Q40/03 , G06F16/33 , G06F16/35 , G06V20/10 , G06V10/764
Abstract: 本说明书实施例公开了一种用户反馈信息处理方法、装置以及设备。方案包括:获取用户反馈信息,确定所述用户反馈信息除了包含文本,是否还包含图像;若是,则对所述用户反馈信息包含的图像进行场景识别,以确定属于无效场景还是有效场景;若属于无效场景,则针对所述用户反馈信息包含的图像进行噪音过滤,再根据所述噪音过滤后的所述用户反馈信息,识别所述用户反馈信息对应的业务类别;若属于有效场景,则根据所述用户反馈信息包含的文本和图像,识别所述用户反馈信息对应的业务类别。
-
公开(公告)号:CN114612104A
公开(公告)日:2022-06-10
申请号:CN202011448997.9
申请日:2020-12-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40 , G06F40/151 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提出了一种风险识别方法、装置和电子设备,其中,上述风险识别方法中,获取至少两个数据源的数据,以及获取上述数据所属数据源的渠道标识之后,对获取的数据进行文本转换,将上述数据中的文本转换为句向量,并对上述渠道标识进行嵌入处理,获得上述渠道标识对应的渠道向量,然后将转换获得的句向量与上述渠道向量进行交互合并,最后对合并获得的向量进行识别,获得上述数据反馈的风险所属的风险类别。从而可以实现对电子支付平台的用户反馈进行监控,确定从数据源获取的数据所反馈风险的风险类别,为后续进一步确定风险问题做好准备,进而可以帮助线上业务及时感知电子支付平台的问题。
-
公开(公告)号:CN111190996A
公开(公告)日:2020-05-22
申请号:CN202010280395.0
申请日:2020-04-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/31 , G06F40/289
Abstract: 本说明书一个或多个实施例公开了一种话题挖掘方法及装置,用以实现话题挖掘的高效性、准确性及通用性。所述方法包括:提取待处理文本中的热词集,所述待处理文本中包括多个单位文本,所述热词集包括多个热词。针对所述热词集中的第一热词,从所述待处理文本中聚合包括所述第一热词的第一单位文本,得到第一单位文本集。基于所述第一单位文本集,确定所述热词集中与所述第一热词之间符合预设相关条件的第二热词。从所述第一单位文本集中筛选出包括所述第二热词的第二单位文本。从所述第二单位文本中选择符合预设文本条件的单位文本,作为所述第一热词对应的话题。
-
公开(公告)号:CN118135253A
公开(公告)日:2024-06-04
申请号:CN202410248938.9
申请日:2024-03-05
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 黄修添
IPC: G06V10/74 , G06V10/764 , G06V10/56 , G06V30/19 , G06V30/26 , G06V30/18 , G06V30/244 , G06V10/46
Abstract: 本说明书实施例提供一种标识检测方法、装置、电子设备与存储介质,该方法包括:通过获取包含事务标识的检测图像,从检测图像中确认图像文字识别结果,将图像文字识别结果与错误文案集合进行匹配,以得到异常文案检测结果,将检测图像与错误图标集合进行匹配,以得到异常图标类型检测结果,将检测图像与标准图标集合进行匹配,以得到异常图标颜色检测结果和异常图标形状检测结果,基于异常文案检测结果、异常图标类型检测结果、异常图标颜色检测结果和异常图标形状检测结果,确认检测图像中的事务标识的检测结果。
-
公开(公告)号:CN117994530A
公开(公告)日:2024-05-07
申请号:CN202410238894.1
申请日:2024-03-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/40 , G06V10/80 , G06F9/451 , G06V30/18 , G06V30/19 , G06V10/82 , G06N20/00 , G06N3/0455 , G06N3/088
Abstract: 本说明书实施例公开了一种多模态模型预训练方法及装置、训练方法及装置。其中,多模态模型预训练方法包括:获取包括连续界面图像和不连续界面图像的界面集,获取各界面图像各自对应的预设特征,随后针对各界面子集的预设特征进行特征融合,基于各界面子集的融合特征对待训练多模态模型进行预训练,得到预训练后的多模态模型。训练方法包括:利用训练目标及训练目标对应的训练数据集对预训练后的多模态模型进行训练,以得到训练后的适应于下游任务的多模态模型。
-
公开(公告)号:CN116108151A
公开(公告)日:2023-05-12
申请号:CN202310041706.1
申请日:2023-01-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供一种应用定位方法、装置、电子设备与计算机存储介质,该方法包括:通过基于目标定位文本和第一候选应用的相关文本,得到第一候选应用与目标定位文本之间的语义关联度,基于语义关联度,在第一候选应用中确认第二候选应用,从第一候选应用中获取与第二候选应用关联的第三候选应用,基于第四候选应用的流量调用图及链路关系图,得到第四候选应用之间的事务关联度,其中,第四候选应用包括第二候选应用和第三候选应用,基于事务关联度从第四候选应用中得到目标定位文本的目标应用。
-
公开(公告)号:CN118747098A
公开(公告)日:2024-10-08
申请号:CN202410742810.8
申请日:2024-06-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F9/451 , G06F3/0481 , G06F3/0484 , G06N3/0455 , G06N3/088 , G06N3/096 , G06N3/084
Abstract: 本申请提供预训练模型的训练方法、装置和设备,其中所述预训练模型的训练方法包括:获取第一用户界面图像;然后对所述第一用户界面图像中的至少部分页面控件进行替换处理,得到第二用户界面图像;再将所述第二用户界面图像的特征数据输入预训练模型,得到第三用户界面图像,其中,所述第三用户界面图像中包含位于页面控件被替换区域的重建控件;之后,根据所述第一用户界面图像和所述第三用户界面图像之间的损失值,对所述预训练模型进行训练。
-
-
-
-
-
-
-
-
-