-
公开(公告)号:CN117744837B
公开(公告)日:2024-08-20
申请号:CN202311873819.4
申请日:2023-12-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F18/214 , G06F18/22 , G06F18/25 , G06F40/205 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开一种模型训练、文本检测方法、装置、存储介质及设备,可以通过对不同的互联网平台上公开文本数据集进行整理,同时,通过使用多种常见对话大语言模型和丰富的提示语集合,来构造用于训练检测模型的训练数据,并且,由于在构建用于训练检测模型的训练数据的过程中,针对训练数据进行了多次过滤,使得得到的训练数据更接近于实际场景中的对大语言模型生成的文本进行使用的场景。除此之外,在对检测模型进行训练的过程中,通过使用具有较大参数规模的教师大语言模型输出的依据文本供检测模型学习,从而可以提升训练后的检测模型针对通过大语言模型生成的文本进行识别的准确率。
-
公开(公告)号:CN117744837A
公开(公告)日:2024-03-22
申请号:CN202311873819.4
申请日:2023-12-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F18/214 , G06F18/22 , G06F18/25 , G06F40/205 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开一种模型训练、文本检测方法、装置、存储介质及设备,可以通过对不同的互联网平台上公开文本数据集进行整理,同时,通过使用多种常见对话大语言模型和丰富的提示语集合,来构造用于训练检测模型的训练数据,并且,由于在构建用于训练检测模型的训练数据的过程中,针对训练数据进行了多次过滤,使得得到的训练数据更接近于实际场景中的对大语言模型生成的文本进行使用的场景。除此之外,在对检测模型进行训练的过程中,通过使用具有较大参数规模的教师大语言模型输出的依据文本供检测模型学习,从而可以提升训练后的检测模型针对通过大语言模型生成的文本进行识别的准确率。
-