-
公开(公告)号:CN111783453B
公开(公告)日:2024-05-21
申请号:CN202010621825.0
申请日:2020-07-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/30 , G06F18/214
Abstract: 本说明书一个或多个实施例公开了一种文本的情感信息处理方法及装置,以解决现有技术中情感倾向识别不准确、导致无法基于情感倾向信息准确调整业务参数的问题。方法包括:提取待预测文本中与业务相关的第一情感词,第一情感词包括正面情感词和负面情感词。以及,对待预测文本进行分句处理,得到待预测文本对应的第一分句。根据第一情感词及第一分句,确定待预测文本对应的第一情感词分布特征。根据第一情感词分布特征及预先训练的情感预测模型,确定待预测文本对应的第一情感倾向信息。根据第一情感倾向信息及第一分句对应的细粒度情感因子,确定待预测文本对应的第二情感倾向信息。向业务的业务处理平台发送第二情感倾向信息。
-
公开(公告)号:CN117951527A
公开(公告)日:2024-04-30
申请号:CN202410194929.6
申请日:2024-02-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F40/279
Abstract: 本说明书公开了一种模型训练的方法、实体识别的方法、装置及电子设备,具体包括:通过将第一文本数据输入到原始实体识别模型中,得到第一识别结果,根据第一识别结果与第一标注数据进行训练时各模型参数的变化幅度,确定各模型参数的重要程度值,根据各重要程度值对模型参数的学习率进行调整。将第二文本数据输入到原始实体识别模型中得到第二识别结果,以最小化第二识别结果与第二标注数据的偏差为优化目标,按照调整后的学习率进行训练。将训练后的实体识别模型用于对文本数据进行实体识别,根据识别结果执行目标任务。通过本说明书中的方法可有效提高针对实体识别模型的训练效率,使得后续根据识别结果执行目标任务的执行效率也获得了提升。
-
公开(公告)号:CN113032566B
公开(公告)日:2023-02-24
申请号:CN202110318186.5
申请日:2021-03-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F16/33 , G06F40/205
Abstract: 本说明书实施例公开了一种舆情聚类方法、装置以及设备。方案包括:对待聚类舆情文本进行分句,得到多个分句片段,并确定分句片段的分句指纹;根据分句指纹,在历史舆情分句指纹库中进行匹配;根据匹配的结果,在历史舆情库中进行模糊搜索,得到与待聚类舆情文本具有相同分句片段的候选历史舆情集合;通过将待聚类舆情文本在候选历史舆情集合中进行相似性比较,从候选历史舆情集合中筛选出相似的历史舆情;根据相似的历史舆情所属的聚类组,对待聚类舆情文本进行中心漂移校验;若中心漂移校验通过,则将待聚类舆情文本加入聚类组中。
-
公开(公告)号:CN114492443A
公开(公告)日:2022-05-13
申请号:CN202210078338.3
申请日:2022-01-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 公开了一种用于训练实体识别模型的方法,包括:构造训练集;以及将该训练集中的训练样本输入到实体识别模型,以得到该训练样本中的句子的序列标注预测输出和实体匹配预测输出,基于该句子的序列标注预测输出和该句子的序列标注标签确定该句子的序列标注损失;至少部分地基于该句子的实体匹配预测输出和该句子的隐喻实体标签确定该句子的实体匹配损失;确定该实体识别模型的总损失,该总损失为该序列标注损失和该实体匹配损失的加权和;以及迭代执行训练以最小化该实体识别模型的总损失,从而得到经训练的实体识别模型。本申请还涉及相对应的实体识别方法以及相关系统、装置和介质。本方案能够全面、高效地识别出包括隐喻实体在内的感兴趣实体。
-
公开(公告)号:CN111783453A
公开(公告)日:2020-10-16
申请号:CN202010621825.0
申请日:2020-07-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本说明书一个或多个实施例公开了一种文本的情感信息处理方法及装置,以解决现有技术中情感倾向识别不准确、导致无法基于情感倾向信息准确调整业务参数的问题。方法包括:提取待预测文本中与业务相关的第一情感词,第一情感词包括正面情感词和负面情感词。以及,对待预测文本进行分句处理,得到待预测文本对应的第一分句。根据第一情感词及第一分句,确定待预测文本对应的第一情感词分布特征。根据第一情感词分布特征及预先训练的情感预测模型,确定待预测文本对应的第一情感倾向信息。根据第一情感倾向信息及第一分句对应的细粒度情感因子,确定待预测文本对应的第二情感倾向信息。向业务的业务处理平台发送第二情感倾向信息。
-
公开(公告)号:CN113626602B
公开(公告)日:2025-05-13
申请号:CN202110955119.4
申请日:2021-08-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/353 , G06F40/30 , G06F40/284 , G06F40/232 , G06F40/253 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/084
Abstract: 说明书披露一种文本分类的方法和装置。所述方法包括:对待分类文本进行切分得到若干文本片段;针对每个文本片段,将其作为入参输入已训练的片段语义提取模型,得到文本片段对应的片段语义向量;将片段语义向量作为入参输入已训练的第一分类模型,得到文本片段的分类结果;若任一文本片段的分类结果满足预设的置信要求,则根据满足置信要求的分类结果,确定待分类文本所属的文本分类;若所有文本片段的分类结果均不满足置信要求,则将若干文本片段对应的若干片段语义向量作为入参输入已训练的文本语义提取模型,得到待分类文本对应的文本语义向量;将文本语义向量作为入参输入已训练的第二分类模型,确定待分类文本所属的文本分类。
-
公开(公告)号:CN118261225A
公开(公告)日:2024-06-28
申请号:CN202410473352.2
申请日:2024-04-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06N3/048 , G06F40/295
Abstract: 本说明书实施例涉及多任务大语言模型训练方法及装置,大语言模型包括已训练好的目标网络层,和用于对目标网络层进行旁路训练的适配器,方法包括:首先,获取针对若干任务类型对适配器进行训练得到的第一适配器;然后,获取多条归属于目标任务类型的文本训练数据;目标任务类型不同于若干任务类型中的任一任务类型;接下来,将待训练的掩码矩阵作用于第一适配器,然后与待训练的第二适配器组合,得到组合适配器;然后,将多条文本训练数据输入到包含组合适配器的大语言模型中,根据大语言模型的输出,调整第二适配器与掩码矩阵中的参数;最后,将训练完成的掩码矩阵作用于第一适配器,然后与训练完成的第二适配器相加,作为新的第一适配器。
-
公开(公告)号:CN113626603B
公开(公告)日:2024-03-29
申请号:CN202110956610.9
申请日:2021-08-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/289 , G06F40/253 , G06F40/232 , G06N3/0464 , G06N3/0455 , G06N3/0442 , G06N3/09 , G06N3/0985
Abstract: 说明书披露一种文本分类的方法和装置。所述方法包括:对待分类文本进行切分,得到若干文本片段;针对每个文本片段,将所述文本片段作为入参输入已训练的片段语义提取模型以对所述文本片段进行语义提取,得到所述文本片段对应的片段语义向量;将所述若干文本片段对应的若干片段语义向量作为入参输入已训练的文本语义提取模型以对所述待分类文本进行语义提取,得到所述待分类文本对应的文本语义向量;将所述文本语义向量作为入参输入已训练的分类模型,根据所述分类模型的输出结果,确定所述待分类文本所属的文本分类。
-
公开(公告)号:CN115293145A
公开(公告)日:2022-11-04
申请号:CN202210749683.5
申请日:2022-06-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/279 , G06F40/216 , G06F40/30
Abstract: 本说明书的实施例提供了一种用于相似案件检索的方法,所述方法包括:接收待查询案件的相似案件查询请求;至少部分地基于所述相似案件查询请求,分别提取所述待查询案件和历史判决案例的文本特征和经验特征,以及提取历史判决案例的知识图谱特征;融合文本特征、经验特征、以及知识图谱特征;以及基于所融合的特征而检索并输出历史判决案例中的相似案件。还提供了众多其他方面。
-
公开(公告)号:CN114861666A
公开(公告)日:2022-08-05
申请号:CN202210468468.8
申请日:2022-04-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F40/186 , G06K9/62 , G06N20/00
Abstract: 本说明书实施例提供了实体分类模型的训练方法、装置及计算机可读存储介质。方法包括以下步骤。获取第一样本集,其中包括第一训练样本,第一训练样本包括第一原始文本及其对应的第一模板文本,第一模板文本用于描述第一原始文本中的第一实体和第一实体对应的多个第一实体类型;将第一原始文本输入第一实体分类模型,得到第一预测结果,其中包括顺次输出第一模板文本中各个字的第一概率得分;根据第一预测结果,确定第一训练样本对应的第一预测损失;基于第一样本集中各训练样本对应的预测损失,训练第一实体分类模型,使得实体分类模型学习原始文本的信息以实现实体的多标签分类。
-
-
-
-
-
-
-
-
-