-
公开(公告)号:CN117951527A
公开(公告)日:2024-04-30
申请号:CN202410194929.6
申请日:2024-02-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F40/279
Abstract: 本说明书公开了一种模型训练的方法、实体识别的方法、装置及电子设备,具体包括:通过将第一文本数据输入到原始实体识别模型中,得到第一识别结果,根据第一识别结果与第一标注数据进行训练时各模型参数的变化幅度,确定各模型参数的重要程度值,根据各重要程度值对模型参数的学习率进行调整。将第二文本数据输入到原始实体识别模型中得到第二识别结果,以最小化第二识别结果与第二标注数据的偏差为优化目标,按照调整后的学习率进行训练。将训练后的实体识别模型用于对文本数据进行实体识别,根据识别结果执行目标任务。通过本说明书中的方法可有效提高针对实体识别模型的训练效率,使得后续根据识别结果执行目标任务的执行效率也获得了提升。
-
公开(公告)号:CN117312492A
公开(公告)日:2023-12-29
申请号:CN202311141896.0
申请日:2023-09-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F18/214 , G06N3/0442
Abstract: 本说明书实施例公开了一种数据的检索方法、装置及设备,该方法包括:获取目标事件的查询请求,查询请求中包括目标事件的事件文本,获取针对查询请求的历史事件文书集,对事件文本进行关键信息提取,得到事件文本对应的事件信息,事件信息包括目标事件的事件触发词,对事件信息和事件文本进行编码处理,得到第一编码信息,并对第一编码信息中事件触发词对应的编码信息进行池化处理,得到第二编码信息,对历史事件文书进行编码处理,得到第三编码信息集,基于预先训练的表征模型对第二编码信息和第三编码信息集进行处理,并基于处理后的第二编码信息和第三编码信息集,从历史事件文书集中确定查询到的与目标事件相匹配的历史事件文书。
-
公开(公告)号:CN118194949A
公开(公告)日:2024-06-14
申请号:CN202410384081.3
申请日:2024-03-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06F16/34 , G06F16/35 , G06N3/0455 , G06N3/0475
Abstract: 本说明书公开了一种关键句提取模型的训练方法、装置及存储介质,待训练的提取模型包含编码层、池化层和分类层,获取目标文本,确定组成目标文本的各子句,针对每个子句,将该子句输入编码层,得到由该子句包含的各分词对应的词向量确定的词特征,将词特征输入池化层,得到句特征,将各子句的句特征输入分类层,确定该目标文本的关键句中的首句和尾句,将首句与尾句之间的各子句,作为预测关键句,根据目标文本的标注关键句与预测关键句的差异,训练提取模型。通过池化层将词语级别的词特征转化为句子级别的句特征,并通过句子级别的标注关键句对提取模型进行训练,可以得到连续的子句组成的各预测关键句,从而提取到更加准确的关键句。
-
公开(公告)号:CN118261225A
公开(公告)日:2024-06-28
申请号:CN202410473352.2
申请日:2024-04-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06N3/048 , G06F40/295
Abstract: 本说明书实施例涉及多任务大语言模型训练方法及装置,大语言模型包括已训练好的目标网络层,和用于对目标网络层进行旁路训练的适配器,方法包括:首先,获取针对若干任务类型对适配器进行训练得到的第一适配器;然后,获取多条归属于目标任务类型的文本训练数据;目标任务类型不同于若干任务类型中的任一任务类型;接下来,将待训练的掩码矩阵作用于第一适配器,然后与待训练的第二适配器组合,得到组合适配器;然后,将多条文本训练数据输入到包含组合适配器的大语言模型中,根据大语言模型的输出,调整第二适配器与掩码矩阵中的参数;最后,将训练完成的掩码矩阵作用于第一适配器,然后与训练完成的第二适配器相加,作为新的第一适配器。
-
-
-