模型预训练方法、装置、存储介质及电子设备

    公开(公告)号:CN118132672A

    公开(公告)日:2024-06-04

    申请号:CN202410131223.5

    申请日:2024-01-30

    Inventor: 姜博健 杨青

    Abstract: 本发明提供一种模型预训练方法、装置、存储介质及电子设备,其中,该方法包括:通过压缩处理以得到各个训练数据中各路数据下的压缩数据源;分别对各个训练数据中各路数据下的压缩数据源进行掩码,以及对各个训练数据中相应路数据下的掩码数据源进行编码,得到各个训练数据中各路数据下的编码数据源;基于各个训练数据中各路数据下的编码数据源和各个训练数据中各路数据下的压缩数据源,分别计算各路数据下的模型损失值,并分别按照各路数据下的模型损失值,优化相应路数据对应的初始语言模型中的模型参数,得到各路数据对应的中间语言模型,以确定各路数据对应的目标语言模型。本发明实施例可便捷地进行模型预训练,以提高模型预训练效率。

    一种语音模型训练方法、装置、设备以及可读存储介质

    公开(公告)号:CN118098209A

    公开(公告)日:2024-05-28

    申请号:CN202311811435.X

    申请日:2023-12-26

    Abstract: 本申请提供了一种语音模型训练方法、装置、设备以及可读存储介质,该方法包括:接收来自第二网络设备的第一语音标签,为第二语音模型基于模拟语音数据输出的语音标签,第一语音标签中包括模拟语音数据中每个文字语音与其对应文字类别相似度信息;将模拟语音数据通过第一语音模型进行处理,得到第二语音标签,第二语音标签中包括模拟语音数据中每个文字语音与其对应文字类别相似度信息;根据第一语音标签和第二语音标签得到第一损失值;基于第一损失值调整第一语音模型的网络参数和/或网络结构;其中,第二语音模型是训练好的语音大模型,第一语音模型的网络规模比第二语音模型小。

    信贷利率计算模型训练方法、装置、设备、可读存储介质

    公开(公告)号:CN118037438A

    公开(公告)日:2024-05-14

    申请号:CN202410336555.7

    申请日:2024-03-22

    Inventor: 李东晨 杨青

    Abstract: 本申请提供了一种信贷利率计算模型训练方法、装置、设备、可读存储介质,该方法包括:在数据库中获取M条第一用户的样本数据,将M条第一用户的样本数据通过样本数据收集层进行第一处理,得到M条第一向量;将M条第一向量通过变量分解层进行预处理,得到M条第二向量;将M条第二向量通过网络构建层进行第二处理,得到每个第一用户的预测用信率、预测放款金额以及预测留存率;将每个第一用户的预测用信率、预测放款金额以及预测留存率通过最优求解层进行计算,从而得到每个第一用户信贷预测利率;将每个第一用户的信贷预测利率与第一用户的样本标签进行比对,得到差异函数,并根据差异函数调整信贷利率计算模型的网络结构和/或网络参数。

    行为评分方法、装置、存储介质及电子设备

    公开(公告)号:CN118037437A

    公开(公告)日:2024-05-14

    申请号:CN202410336549.1

    申请日:2024-03-22

    Abstract: 本发明提供一种行为评分方法、装置、存储介质及电子设备,该方法包括:获取目标对象在多个目标观察时点中各个目标观察时点下的初始行为指示数据,目标对象在各个目标观察时点下的初始行为指示数据支持构成时序信息;分别基于目标对象在各个目标观察时点下的初始行为指示数据,确定目标对象在各个目标观察时点下的目标行为指示数据;基于各个目标观察时点下的位置编码和目标对象在各个目标观察时点下的目标行为指示数据,确定目标对象的序列编码数据;调用目标行为评分模型,对目标对象的序列编码数据进行行为评分,得到目标对象的行为预测概率。本发明实施例可通过时序信息进行行为评分,从而获取到精确性较高的行为预测概率。

    一种信用风险预测方法、装置及电子设备

    公开(公告)号:CN118037418A

    公开(公告)日:2024-05-14

    申请号:CN202311708101.X

    申请日:2023-12-12

    Inventor: 刘宏剑 严澄 杨青

    Abstract: 本申请实施例提供了一种信用风险预测方法、装置及电子设备,其中,该方法通过获取新用户的类别型特征以及数值型特征,并将该新用户的类别型特征以及数值型特征输入至预设信用风险预测模型中,借助该预设信用风险预测模型的特征向量拼接模块对类别型特征以及数值型特征进行拼接,得到该新用户的综合特征向量。再借助该预设风险模型的归一化处理模块,基于该新用户的综合特征向量输出新用户在不同信贷周期下的逾期概率。相较于现有技术,本申请实施例借助新用户的多维度的用户特征进行特征向量处理,然后输出该新用户在不同信贷周期下的逾期概率的技术方案,得到的信用风险预测结果更为精准,更具参考性。

    针对不规则表格的信息提取方法、装置、设备及存储介质

    公开(公告)号:CN117891861A

    公开(公告)日:2024-04-16

    申请号:CN202311675674.7

    申请日:2023-12-07

    Inventor: 孙刈凡 杨青

    Abstract: 本申请实施例涉及计算机技术领域,尤其涉及一种针对不规则表格的信息提取方法、装置、设备及存储介质。该方法包括:获取具有文件格式的目标文件;从所述目标文件中解析出不闭合线段;将所述不闭合线段组合单元格的情况下,对所述目标文件中的表格进行提取。采用本申请的技术方案,可以从复杂的PDF文件格式中,提取文本、图形和表格信息,即解决不规则表格的信息提取问题,同时提高表格提取正确率。

    神经网络调整方法、装置、电子设备及可读存储介质

    公开(公告)号:CN117829228A

    公开(公告)日:2024-04-05

    申请号:CN202311686495.3

    申请日:2023-12-08

    Inventor: 杨青

    Abstract: 本发明提供一种神经网络调整方法、装置、电子设备及可读存储介质,包括:接收第一输入,所述第一输入为目标模型的模型参数;响应于所述第一输入,对所述模型参数进行低秩近似,获得若干个所述目标模型的微调子网络;接收第二输入,所述第二输入为所述目标模型的输入信号特征;响应于所述第二输入,自适应匹配所述输入信号特征和若干个所述微调子网络的输出特征,获得目标微调子网络,由所述目标模型和所述目标微调子网络共同根据所述输入信号特征输出结果。本发明有效缓解了模型微调过程中单一低秩参数微调子网络表达容量有限所导致的性能瓶颈。

    一种绘画模型训练方法、设备以及可读存储介质

    公开(公告)号:CN117806505A

    公开(公告)日:2024-04-02

    申请号:CN202311787899.1

    申请日:2023-12-22

    Inventor: 万鑫 单黎平 杨青

    Abstract: 本申请提供了一种绘画模型训练方法、设备以及可读存储介质,该方法包括:显示第一界面,第一界面包括第一图标,第一图标为AI绘图应用对应的图标;响应针对第一图标的第一操作,显示第二界面,第二界面包括智能生图控件和模型训练控件;响应针对模型训练控件的第三操作,显示第三界面,第三界面包括模型选择区域和第二控件,在模型选择区域中包括N个模型图标,N个模型图标对应N个绘画风格模型;响应第四操作,在N个绘画风格模型中选择第一绘画风格模型作为训练模型,对训练模型进行叠加训练,得到目标绘画风格模型,绘画风格模型能够输出具备第一绘画风格和第二绘画风格的图像,第二绘画风格为用户选择的绘画风格。

    一种风险识别方法、装置及电子设备

    公开(公告)号:CN117764706A

    公开(公告)日:2024-03-26

    申请号:CN202311532649.3

    申请日:2023-11-16

    Inventor: 万世想 杨青

    Abstract: 本申请实施例提供了一种风险识别方法、装置及电子设备,其中,该方法通过获取待识别用户的风险观测特征,基于风险观测特征提取高维征信特征、用户画像特征以及平台交互特征,借助预设的风险迁移识别模型,确定出与该待识别用户的风险观测特征相似度满足预设相似度条件的相似用户,根据该相似用户的授信额度对逾期率的影响程度,确定待识别用户的目标风险额度。由于本申请所选取的风险观测特征包含了可能产生风险迁移的各项因素,且基于在风险迁移情况下相似用户的授信额度对逾期率的影响程度,确定目标风险额度,故选用本申请实施例所确定得到的待识别用户的目标风险额度更为精准,有效减少了风险迁移对信贷风险的影响。

    2D/3D口型驱动方法、装置、电子设备及可读存储介质

    公开(公告)号:CN117726724A

    公开(公告)日:2024-03-19

    申请号:CN202311790348.0

    申请日:2023-12-22

    Inventor: 王远强 杨青

    Abstract: 本发明提供一种2D/3D口型驱动方法、装置、电子设备及可读存储介质,包括:接收第一输入,第一输入为视频帧信息中包含的语音特征;响应于第一输入,根据语音特征获得目标生物的表情系数;接收第二输入,第二输入为目标数字生物的输出类型;响应于第二输入,在目标数字生物的输出类型是3D的情况下,根据表情系数获取目标数字生物的口部形态键值,并根据口部形态键值驱动3D数字生物口型;或者,在目标数字生物的输出类型是2D的情况下,根据视频帧的渲染帧和中性帧获取数字生物的面部运动数据,根据面部运动数据驱动2D数字生物口型。本发明实现了不同应用环境下2D或者3D数字生物口型的完整驱动。

Patent Agency Ranking