处理用户行为序列的方法及装置

    公开(公告)号:CN114090401A

    公开(公告)日:2022-02-25

    申请号:CN202111283645.7

    申请日:2021-11-01

    Abstract: 本说明书实施例提供一种处理用户行为序列的方法及装置,在处理用户行为序列的方法中,获取N个样本用户各自的用户行为序列,并对其进行数据增强,得到多个正样本对和多个负样本对。每个正样本对包括按照不同业务,对同一用户行为序列进行拆分所得到的两个子序列。每个负样本对包括来自不同用户行为序列的两个子序列。将各正/负样本对输入神经网络模型,该神经网络模型包括相同的两个子模型,用于处理输入样本对中的两个子序列,以得到各自的行为向量。对于任意的正/负样本对,根据其中的两个子序列各自的行为向量,计算对应的距离。以最小化各正样本对的距离,最大化各负样本的距离为目标,更新神经网络模型,以用于处理待分析的用户行为序列。

    特征补齐方法及装置、特征补齐模型、介质、设备及产品

    公开(公告)号:CN115081512A

    公开(公告)日:2022-09-20

    申请号:CN202210537277.2

    申请日:2022-05-17

    Abstract: 本说明书实施例提供一种特征补齐方法、特征补齐装置、特征补齐模型、计算机可读存储介质、电子设备以及计算机程序产品,该方法包括本说明书示例性的实施例提供的方案基于训练后的机器学习模型(即,基于特征补齐模型)实现的,且该特征补齐模型的生成器的损失函数为基于样本用户特征的显示分布建模确定的。具体地,将关于同一用户的目标特征输入至上述特征补齐模型,其中,上述目标特征中包含一个或多个待补齐元素。经该特征补齐模型的生成器处理后输出与目标特征对应的目标隐向量,其中,该目标隐向量包含目标连续子特征和目标离散子特征。进一步地,根据目标连续子特征确定和目标离散子特征,确定上述目标特征的补齐特征。

    项目处理方法以及装置
    5.
    发明公开

    公开(公告)号:CN113537950A

    公开(公告)日:2021-10-22

    申请号:CN202110962134.1

    申请日:2021-08-20

    Abstract: 本说明书实施例提供项目处理方法以及装置,其中所述项目处理方法包括:基于初始项目的项目属性以及所述初始项目下项目用户的用户属性,对所述项目用户进行类别划分,生成至少两个划分结果,将所述初始项目的项目指标拆分为多个子项目指标,并确定目标划分结果中包含的目标项目用户在所述多个子项目指标的初始指标值和目标指标值,其中,所述目标划分结果为所述至少两个划分结果之一,基于所述初始指标值和所述目标指标值确定所述目标项目用户的目标处理路径,并基于所述目标处理路径对所述目标项目用户的所述多个子项目指标进行处理。

    数据规则生成方法及装置

    公开(公告)号:CN112199416A

    公开(公告)日:2021-01-08

    申请号:CN202011057500.0

    申请日:2020-09-30

    Abstract: 本说明书实施例提供了数据规则生成方法及装置,其中,一种数据规则生成方法包括:对待处理数据进行预处理,获得属性字段的属性数据和业务字段的业务数据;基于所述业务字段的业务数据构建多元参数关系,并求解所述多元参数关系;根据所述属性数据,确定使求解获得的业务关系表达式成立的属性条件;以所述属性条件为数据规则的前置条件、所述业务关系表达式为数据规则的断言,生成目标数据规则。

    大语言模型的训练方法及装置
    7.
    发明公开

    公开(公告)号:CN119443155A

    公开(公告)日:2025-02-14

    申请号:CN202411450863.9

    申请日:2024-10-16

    Abstract: 本说明书实施例提供了大语言模型的训练方法及装置。该方法包括:获取训练样本集,其中的各训练样本均包括问题、偏好回答和非偏好回答,并且部分训练样本各自包括的偏好回答和非偏好回答相同;对于训练样本集中任意的第一样本,将其中的第一问题作为模型输入,在获得参考模型和待优化的大语言模型各自生成第一样本中的第一偏好回答的第一概率后,根据第一概率确定针对第一偏好回答的第一奖励值;确定针对第一样本中的第一非偏好回答的第二奖励值,其响应于确定第一偏好回答和第一非偏好回答相同而为0;基于训练损失更新大语言模型的参数,该训练损失与第一奖励值和第二奖励值的差值负相关。

    项目处理方法以及装置
    8.
    发明授权

    公开(公告)号:CN113537950B

    公开(公告)日:2025-01-21

    申请号:CN202110962134.1

    申请日:2021-08-20

    Abstract: 本说明书实施例提供项目处理方法以及装置,其中所述项目处理方法包括:基于初始项目的项目属性以及所述初始项目下项目用户的用户属性,对所述项目用户进行类别划分,生成至少两个划分结果,将所述初始项目的项目指标拆分为多个子项目指标,并确定目标划分结果中包含的目标项目用户在所述多个子项目指标的初始指标值和目标指标值,其中,所述目标划分结果为所述至少两个划分结果之一,基于所述初始指标值和所述目标指标值确定所述目标项目用户的目标处理路径,并基于所述目标处理路径对所述目标项目用户的所述多个子项目指标进行处理。

    特征补齐方法及装置、特征补齐模型、介质、设备及产品

    公开(公告)号:CN115081512B

    公开(公告)日:2024-10-01

    申请号:CN202210537277.2

    申请日:2022-05-17

    Abstract: 本说明书实施例提供一种特征补齐方法、特征补齐装置、特征补齐模型、计算机可读存储介质、电子设备以及计算机程序产品,该方法包括本说明书示例性的实施例提供的方案基于训练后的机器学习模型(即,基于特征补齐模型)实现的,且该特征补齐模型的生成器的损失函数为基于样本用户特征的显示分布建模确定的。具体地,将关于同一用户的目标特征输入至上述特征补齐模型,其中,上述目标特征中包含一个或多个待补齐元素。经该特征补齐模型的生成器处理后输出与目标特征对应的目标隐向量,其中,该目标隐向量包含目标连续子特征和目标离散子特征。进一步地,根据目标连续子特征确定和目标离散子特征,确定上述目标特征的补齐特征。

    处理用户行为序列的方法及装置

    公开(公告)号:CN114090401B

    公开(公告)日:2024-09-10

    申请号:CN202111283645.7

    申请日:2021-11-01

    Abstract: 本说明书实施例提供一种处理用户行为序列的方法及装置,在处理用户行为序列的方法中,获取N个样本用户各自的用户行为序列,并对其进行数据增强,得到多个正样本对和多个负样本对。每个正样本对包括按照不同业务,对同一用户行为序列进行拆分所得到的两个子序列。每个负样本对包括来自不同用户行为序列的两个子序列。将各正/负样本对输入神经网络模型,该神经网络模型包括相同的两个子模型,用于处理输入样本对中的两个子序列,以得到各自的行为向量。对于任意的正/负样本对,根据其中的两个子序列各自的行为向量,计算对应的距离。以最小化各正样本对的距离,最大化各负样本的距离为目标,更新神经网络模型,以用于处理待分析的用户行为序列。

Patent Agency Ranking