数据处理方法、装置、设备及存储介质

    公开(公告)号:CN117314553A

    公开(公告)日:2023-12-29

    申请号:CN202311191654.2

    申请日:2023-09-14

    Abstract: 本发明公开了一种数据处理方法、装置、设备及存储介质,属于产品推荐技术领域。本发明获取当前信令数据和当前用户属性数据;将当前信令数据进行融合,得到时空统计特征数据;将当前用户属性数据按照预设编码策略映射为统一维度的目标用户基础属性特征;基于时空统计特征数据计算各统计特征的相似度,并根据计算结果得到目标时空信息特征;将目标时空信息特征和目标用户基础属性特征输入至成功率预测模型,得到用户属性;根据用户属性进行产品推荐,成功率预测模型为解码器结构更新后的结构,可以提取到不同模态特征深层的联系,从而更有效的对特征进行融合和提取,适用多种产品推荐场景,提高产品推荐的效果。

    特征处理方法、装置、设备及计算机存储介质

    公开(公告)号:CN115952468A

    公开(公告)日:2023-04-11

    申请号:CN202211646017.5

    申请日:2022-12-20

    Abstract: 本申请公开了一种特征处理方法、装置、设备及计算机存储介质,涉及大数据技术领域。该方法包括:获取样本数据集,所述样本数据集中包括N个用户样本一一对应的目标信息,所述目标信息包括样本标签和在M个特征下分别对应的M个特征标签;基于所述N个用户样本一一对应的目标信息,采用catboost算法对所述样本数据集中的M个特征进行特征交叉,得到Q个混合特征,所述Q个混合特征用于作为目标预测模型的输入特征;其中,所述Q个混合特征中任一混合特征中包括的特征的数量小于或者等于预设阈值。根据本申请实施例,能够直接对样本特征进行特征衍生,从而有效避免了高维稀疏特征的出现。

    数据检索方法、系统、设备以及存储介质

    公开(公告)号:CN117093598A

    公开(公告)日:2023-11-21

    申请号:CN202311052071.1

    申请日:2023-08-18

    Abstract: 本申请公开了一种数据检索方法、系统、设备以及存储介质,应用于搜索引擎服务器与数据库构建的检索系统,其数据检索方法包括:获取待检索字段和计算函数;根据所述待检索字段和所述计算函数,结合预先建立的索引关系返回数据表行键;将所述数据表行键发送至所述数据库,并接收所述数据库根据所述数据表行键返回的检索结果信息。本申请通过在搜索引擎服务器中预先建立索引关系,结合任意组成的待检索字段和计算函数,与索引关系进行检索,能满足多条件检索的需求,提高查询的智能程度。

    一种信息推荐方法及装置
    7.
    发明公开

    公开(公告)号:CN115880015A

    公开(公告)日:2023-03-31

    申请号:CN202111143740.7

    申请日:2021-09-28

    Abstract: 本发明提供一种信息推荐方法及装置。其中,该方法包括:基于枢纽节点联合参与方的数据点,并利用预设密度聚类算子对多域联合数据进行密度聚类分群,得到特征空间差异化的用户群;根据所述用户群的订购产品统计结果,确定预设产品类别对应的初始的偏好用户群分类结果;将所述偏好用户群分类结果输入到相应的模型分类器中基于偏好概率进行产品潜客筛选,得到所述模型分类器输出的目标用户群及其对应的偏好产品类别。采用本发明方法,能够以群为单位进行并行模型预测,根据偏好概率精筛用户,提升了客户分群的准确率和产品推荐效率,为各类别产品细筛出偏好度高的用户群进行精准营销,极大的节省了内部资源,减少获客成本,有效提高了运营效率。

    训练样本的确定方法、装置、设备及存储介质

    公开(公告)号:CN116467632A

    公开(公告)日:2023-07-21

    申请号:CN202310566335.9

    申请日:2023-05-18

    Abstract: 本申请公开了一种训练样本的确定方法、装置、设备及存储介质,涉及通信技术领域。其方法包括:对初始样本集进行分类,得到至少一个用户样本簇,其中,初始用户样本集包括多个用户样本,用户样本包括历史用户的业务数据以及标签;对各用户样本簇进行多次样本融合处理,得到多个融合样本集,其中,各融合样本集包括至少一个融合样本,且不同融合样本集中的融合样本的数量不同,各融合样本包括融合业务数据和融合标签;在各用户样本簇的多个融合样本集中,确定各用户样本簇的目标融合样本集;将至少一个用户样本簇中目标融合样本集的融合样本,确定为目标模型的训练样本,目标模型用于根据用户的业务数据预测用户的所属群体。

    基于GBDT的集成学习方法、装置、及电子设备

    公开(公告)号:CN116204780A

    公开(公告)日:2023-06-02

    申请号:CN202111443697.6

    申请日:2021-11-30

    Abstract: 本申请提供基于GBDT的集成学习方法、装置、及电子设备,涉及数据挖掘技术领域。所述方法包括:基于梯度提升回归树,将原始特征转换为叶子结节位置,形成数据集;基于数据集,利用滑动窗口,得到衍生特征;对原始特征进行稀疏处理;组合衍生特征和稀疏处理后的原始特征,得到若干训练数据集;基于若干训练数据集,训练得到若干基模型;当需要完成分类任务时,基于若干基模型输出的分类结果,根据预设分类汇总条件,得到最终分类结果。本申请提供的基于GBDT的集成学习方法,能够增加样本的多样性,降低模型偏差,改善集成学习效果;还能够发现特征之间的非线性关系,增加基模型的多样性,避免模型产生高方差,提高模型预测准确率。

Patent Agency Ranking