获取信用评分模型的方法、装置、设备及存储介质

    公开(公告)号:CN119941375A

    公开(公告)日:2025-05-06

    申请号:CN202411753402.9

    申请日:2024-12-02

    Inventor: 张益铭 杨青

    Abstract: 本发明实施例涉及大数据处理技术领域,公开一种获取信用评分模型的方法、装置、设备及存储介质,方法为获取目标异构图的多个子图和多个行为数据;将多个子图和多个行为数据输入至初始模型中,针对各子图执行初始化节点表示,利用迭代公式更新子图中各节点表示,调整初始模型的参数;基于多个行为数据和多个节点表示获取目标异构图的多个第一相关度;针对各第一相关度,若第一相关度小于预设阈值,删除第一相关度,若第一相关度不小于预设阈值,保留第一相关度,得到第二相关度;基于第二相关度和迭代公式更新目标异构图的各节点表示,调整初始模型的参数得到目标信用评分模型。实现在低成本可泛化未知节点且计算复杂性较低的基础上得到信用评分。

    一种文本过滤模型训练方法、文本过滤方法及装置

    公开(公告)号:CN119917650A

    公开(公告)日:2025-05-02

    申请号:CN202411868325.1

    申请日:2024-12-18

    Abstract: 本发明提供一种文本过滤模型训练方法、文本过滤方法及装置,训练方法包括:将训练文本序列输入待训练的文本过滤模型中,得到目标文本序列输入至目标文本处理模型中,得到目标文本处理模型输出目标预测值;基于目标预测值及训练文本序列标签,得到目标文本损失;基于目标文本损失训练文本过滤模型,得到目标文本过滤模型。通过训练文本过滤模型进行文本过滤,实现自动文本过滤的同时,能应对较多的长文本过滤场景,降低人工成本,提高文本过滤适用范围及效率,保证目标文本处理模型拟合性,且在目标文本处理模型前增加文本过滤模型进行文本过滤,无需改变目标文本处理模型的结构来进行文本过滤任务,保证目标文本处理模型的拟合能力及处理效率。

    一种用户行为识别方法及相关设备
    143.
    发明公开

    公开(公告)号:CN119863306A

    公开(公告)日:2025-04-22

    申请号:CN202411753392.9

    申请日:2024-12-02

    Inventor: 管梦雅 杨青

    Abstract: 本申请公开了一种用户行为识别方法、装置、服务器、计算机可读存储介质以及计算机程序产品。该方法对获取的连续时间内的用户行为数据进行时间分片,计算每个分片内用户表征,调用变分自编码器对用户表征进行行为特征提取,可以提取关键信息的同时增强样本多样性,再通过双向长短期记忆网络根据不同时间分片间的关联关系捕获用户行为变化,从而实现对用户行为的深层表征,相较于传统模型,该方法充分考虑到行为特征的动态变化,根据用户在不同时间下的行为关联关系对用户行为进行深层表征,可以实现精准的行为识别。

    基于语音的3D数字人口型驱动方法、装置、设备及介质

    公开(公告)号:CN119724221A

    公开(公告)日:2025-03-28

    申请号:CN202411753399.0

    申请日:2024-12-02

    Inventor: 王远强 杨青

    Abstract: 本申请公开了一种基于语音的3D数字人口型驱动方法、装置、设备及介质,所述方法,包括:获取目标语音数据;将所述目标语音数据输入至目标分析模型,得到目标驱动序列数据;所述目标分析模型用于基于所述目标语音数据确定所述目标驱动序列数据,所述目标驱动序列数据对应的特征维度与3D数字人的口部特征维度对应;基于所述目标驱动序列数据,对3D数字人进行渲染驱动,能够有效提高3D数字人口型的准确性。

    一种基于金融风控的多模型集成学习方法及相关设备

    公开(公告)号:CN119515529A

    公开(公告)日:2025-02-25

    申请号:CN202411618700.7

    申请日:2024-11-13

    Inventor: 唐东格 杨青

    Abstract: 本申请公开了一种基于金融风控的多模型集成学习方法、装置、电子设备、计算机可读存储介质以及计算机程序产品。该方法将采用多种训练方式分别训练得到的多个金融风控模型进行多模融合,再将融合模型作为教师模型,调用预搭建的学生模型对教师模型进行蒸馏学习,使用一个低资源的小模型对融合模型进行蒸馏学习,将融合模型学习到的多个大模型的集成学习能力迁移到轻量级的学生模型上,将蒸馏学习后的学生模型作为集成学习模型输出,这样集成学习模型就兼具多个金融风控模型的业务功能,同时体量小,低资源易部署,在保证多个大模型集成效果提升的同时,实现低资源线上部署和推理使用,提升了AI技术在金融科技领域的应用能力。

    数据采样方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN119513595A

    公开(公告)日:2025-02-25

    申请号:CN202411491299.5

    申请日:2024-10-24

    Inventor: 徐天运 杨青

    Abstract: 本申请提供一种数据采样方法、装置、电子设备及计算机可读存储介质,涉及数据处理技术领域。所述数据采样方法包括:获取样本数据集,样本数据集包括第一数据集及第二数据集,第二数据集的产生时间晚于第一数据集;确定第一数据集中各第一样本数据的倾向性得分;其中,倾向性得分用于表征第一样本数据落入第二数据集的概率;基于第一样本数据的倾向性得分,对第一样本数据及第二数据集中的第二样本数据进行匹配;根据匹配结果确定第一数据集的第一采样权重,及第一数据集中各第一样本数据的第二采样权重;基于第一采样权重及第二采样权重从样本数据集中采样目标样本数据。本申请实现了自适应数据采样,有效提升了模型指标性能。

    业务推荐模型的训练方法、装置、电子设备及存储介质

    公开(公告)号:CN119357631A

    公开(公告)日:2025-01-24

    申请号:CN202411385700.7

    申请日:2024-09-30

    Inventor: 冷百强 杨青

    Abstract: 本申请提供一种业务推荐模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域。在本申请中,获取包含为用户推荐目标业务的第一样本集和不为用户推荐目标业务的第二样本集的训练样本集后,便可基于训练样本集训练业务推荐模型获得的梯度信息,更新业务推荐模型包括的多个网络分别对应的网络参数。这样,通过引入能够生成第一网络和第二网络分别对应的网络参数的超网络,第一样本集和第二样本集均可用于第一网络和第二网络分别对应的网络参数的更新,改善了只在浅层网络阶段共享信息仍会造成数据浪费,以及实验组数据和对照组数据的数据量差距较大且实验组数据存在选择偏差的问题,故而,提高了寻找目标用户的准确度。

    训练数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN119294553A

    公开(公告)日:2025-01-10

    申请号:CN202411307910.4

    申请日:2024-09-19

    Inventor: 刘洪涛 杨青

    Abstract: 本公开提供一种训练数据处理方法、装置、电子设备及存储介质,其中该方法包括:从文本数据集中随机抽取多个文本数据;根据每个数据桶对应的文本长度范围确定该多个文本数据中文本长度最大的文本数据对应的数据桶,多个数据桶具有多种文本容量,并且文本容量越大其对应的最小文本长度越大;按照文本长度从大到小依次向该数据桶内填充多个文本数据中的文本数据,其中,优先向数据桶中填充文本长度小于数据桶的剩余容量的文本数据;在该数据桶填满后,将该数据桶的数据输出为一个训练数据,并返回从文本数据集中随机抽取多个文本数据的步骤,直到文本数据集分桶处理结束。能够兼顾短文本训练效果、长上下文的建模能力以及整体的训练速度。

    阅读顺序预测方法、装置、电子设备及存储介质

    公开(公告)号:CN119206757A

    公开(公告)日:2024-12-27

    申请号:CN202411243680.X

    申请日:2024-09-05

    Abstract: 本公开提供一种阅读顺序预测方法、装置、电子设备及计算机可读存储介质,涉及机器学习技术领域。所述方法包括:获取待预测文档图像;获取所述待预测文档图像中各单词的单词信息;获取所述待预测文档图像中各文本块的文本块信息;基于所述单词信息及所述文本块信息预测每个所述文本块内的单词阅读顺序,以及所述文本块之间的文本块阅读顺序;基于所述文本块之间的文本块阅读顺序,以及每个所述文本块内的单词阅读顺序预测所述待预测文档图像的阅读顺序。本公开在光学字符识别(Optical Character Recognition,OCR)无法准确检测出文本行,只能对单个字符进行检测和识别的情况下,实现对排版复杂的文档的阅读顺序预测,提高了文档阅读顺序预测的准确度。

    公式识别方法、装置、存储介质及电子设备

    公开(公告)号:CN119007234A

    公开(公告)日:2024-11-22

    申请号:CN202410983923.7

    申请日:2024-07-22

    Abstract: 本发明提供一种公式识别方法、装置、存储介质及电子设备,该方法包括:调用目标公式检测模型,对目标文档图像进行公式检测,得到目标文档图像包括的至少一个待识别公式中各个待识别公式的位置信息和公式检测类别组;分别基于各个待识别公式的位置信息,从目标文档图像中裁剪出相应待识别公式的裁剪公式图像;并分别基于各个待识别公式的裁剪公式图像,确定相应待识别公式的公式图像;分别基于各个待识别公式的公式检测类别组,确定相应待识别公式对应的目标公式识别模型;分别调用各个待识别公式对应的目标公式识别模型,对相应待识别公式的公式图像进行公式识别,得到各个待识别公式的公式识别文本。本发明实施例可提高公式识别的准确性。

Patent Agency Ranking