-
公开(公告)号:CN118865959A
公开(公告)日:2024-10-29
申请号:CN202411271949.5
申请日:2024-09-11
Applicant: 度小满科技(北京)有限公司
IPC: G10L15/06 , G10L15/02 , G10L15/183 , G10L19/16 , G10L21/01
Abstract: 本公开实施例提供一种语音识别模型的生成方法和装置,涉及语音识别技术领域。该方法的具体实施方式包括:获取多个样本语音信号;提取各个样本语音信号中的第一样本语音特征和第二样本语音特征;分别将第一样本语音特征输入无监督模型、将样本第二语音特征输入帧级别对齐模型,得到样本语音信号的第一输出类别和第二输出类别,利用第一输出类别和第二输出类别构建发音词典;组合所述无监督模型、发音词典和语言模型,得到语音识别模型,使得解码器利用所述语音识别模型识别待识别语音。该实施方式既无需使用无监督模型的模型参数,也无需海量的标签数据,可以降低训练成本,能够兼顾无监督模型的泛化能力和鲁棒性、以及有监督模型的识别准确性,降低识别计算量、提高识别效率。
-
公开(公告)号:CN118798429A
公开(公告)日:2024-10-18
申请号:CN202410923090.5
申请日:2024-07-10
Applicant: 度小满科技(北京)有限公司
IPC: G06Q10/04 , G06F18/213
Abstract: 本发明提供一种用户数据处理方法、装置、电子设备及可读存储介质,对于来自多个数据源的用户数据,将其按照不同的序列数据类型映射处理为对应的向量数据。按照向量数据所对应的用户信息,将不同数据源中属于同一用户的向量数据进行同类合并,得到每个用户的多个向量集合。选取每个向量集合中的最大值作为该向量集合的单向量子特征,以便于后续进行用户的用户数据分析预测时,将多个单向量子特征合并为综合特征,按照预测需求进行用户的预测。本发明提供的用户数据处理方法,能够适用于多数据源的各类型序列数据,不需要根据序列数据的类型分建子模型进行分别处理,序列数据的处理效率得到了提升。
-
公开(公告)号:CN118505374A
公开(公告)日:2024-08-16
申请号:CN202410521759.8
申请日:2024-04-28
Applicant: 度小满科技(北京)有限公司
IPC: G06Q40/03 , G06F18/2415 , G06F18/214 , G06F18/25
Abstract: 本发明提供一种模型训练方法、装置、存储介质及电子设备,该方法包括:分别基于征信数据集中的各个征信数据,预测各个对象的逾期状态概率;分别基于各个对象的逾期状态概率,确定各个对象下的K个授信状态训练样本;调用初始征信风控模型中的授信状态概率预测模块,分别基于各个对象下的K个授信状态训练样本,预测各个对象的授信状态概率;基于各个对象的授信状态概率,计算征信风控模型损失值,并按照减小征信风控模型损失值的方向,优化初始征信风控模型中的模型参数,得到模型优化后的初始征信风控模型,以基于模型优化后的初始征信风控模型,确定目标征信风控模型。本发明实施例可通过模型训练,获取到模型性能较高的目标征信风控模型。
-
公开(公告)号:CN118038540A
公开(公告)日:2024-05-14
申请号:CN202311764949.4
申请日:2023-12-20
Applicant: 度小满科技(北京)有限公司
IPC: G06V40/20 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0442 , G06N3/0499 , G06N3/08
Abstract: 本申请提供一种人体动作捕捉模型的确定方法、装置、设备及存储介质通过获取模型的训练数据以及网络构建层,使网络构建层对训练数据进行训练,以得到人体动作捕捉模型,实现精确捕捉人体动作。即通过基于光场重建技术捕获的人体动作数据库构建动作先验,训练深度神经网络模型实现从体感外设采集的RGBD图像中捕捉人体动作。整个系统运行速度快,精确度高,可以达到实时运行的要求,解决了现有技术中存在的问题,具有积极的效果。
-
公开(公告)号:CN117876754A
公开(公告)日:2024-04-12
申请号:CN202311767034.9
申请日:2023-12-20
Applicant: 度小满科技(北京)有限公司
IPC: G06V10/764 , G06V10/26 , G06V10/82 , G06N3/0464 , G06N3/096
Abstract: 本公开公开了一种图像数据处理方法、装置、设备及计算机介质,本公开各实施例提供的技术方案,通过对样本图像进行处理得到样本对象信息和样本背景信息,基于初始视觉转换单元对样本对象信息、样本背景信息、预设对象向量信息和预设背景向量信息进行处理,得到第一子图像特征信息、第二子图像特征信息、对象特征信息和背景特征信息,对第一子图像特征信息、第二子图像特征信息、对象特征信息和背景特征信息进行编码后并计算得到第一损失信息;获取与样本对象对应的预设数量个第一得分,与样本背景对应的预设数量个第二得分及第一损失信息对初始模型进行训练,得到目标模型。从而实现识别零样本的对象属性和背景属性,提高了零样本的识别能力。
-
公开(公告)号:CN117593578A
公开(公告)日:2024-02-23
申请号:CN202311607161.2
申请日:2023-11-28
Applicant: 度小满科技(北京)有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V40/40 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本公开实施例提供一种AI图片的识别方法和装置,涉及图像处理技术领域。该方法的具体实施方式包括:接收一个或多个图片识别请求;其中,所述图片识别请求包括待识别图片;对所述待识别图片进行预处理,得到预处理后的待识别图片;将所述预处理后的待识别图片输入AI图片生成算法识别模型,根据所述AI图片生成算法识别模型的输出,确定各个输出类别对应的概率值;利用所述各个输出类别对应的概率值,确定所述待识别图片是否为AI图片。该实施方式能够防止AI图片的滥用,提升图片真实性校验的判断效率和判断准确度低下,降低隐私泄露和利益损失风险,适用场景广泛,可进行多风格和场景下的AI图片判断。
-
公开(公告)号:CN117556303A
公开(公告)日:2024-02-13
申请号:CN202311577843.3
申请日:2023-11-23
Applicant: 度小满科技(北京)有限公司
IPC: G06F18/24 , G06F18/214 , G06N3/09 , G06Q40/03
Abstract: 本发明提供一种分类模型训练方法、逾期风险预测方法及装置,该分类模型训练方法包括基于预设训练数据集对多个预设模型进行训练,得到多个候选分类模型;基于多个候选分类模型,对待训练的分类模型进行训练,得到目标分类模型;待训练的分类模型中包括多个分类层,至少两个分类层为基于不同候选分类模型训练得到。应用本发明实施例,通过基于多个预先训练的候选分类模型对待训练的分类模型中的各个分类层进行训练,得到目标分类模型,使得目标分类模型具有多个候选分类模型的性能,从而提高目标分类模型的泛化性以及分类准确性,同时,与现有的集成模型相比,在使用目标分类模型时无需使用多个模型进行并行推断,节省模型使用成本以及推断时间。
-
公开(公告)号:CN117454171A
公开(公告)日:2024-01-26
申请号:CN202311406539.2
申请日:2023-10-26
Applicant: 度小满科技(北京)有限公司
IPC: G06F18/214 , G06Q40/03 , G06N3/045
Abstract: 本申请提供了一种借贷模型训练方法、相关装置、设备以及可读存储介质,该方法包括:将M条特征信息预处理,得到N条特征信息;将这N条特征信息通过第一神经网络处理,得到借贷率预测值、借贷率预测值、余额留存率预测值、余额留存率预测值、第一余额预测值和第二余额预测值;将第一借贷率预测值通过第二神经网络处理得到第一数据;将第二借贷率预测值通过第三神经网络处理得到第二数据;基于第一数据、第二数据、第一余额留存率预测值、第二余额留存率预测值得到第一调整值;基于第一数据、第二数据、第一余额预测值和第二余额预测值得到第二调整值;根据第一调整值和第二调整值调整第二神经网络和第三神经网络的网络参数和/或网络结构。
-
公开(公告)号:CN117422101A
公开(公告)日:2024-01-19
申请号:CN202311476879.2
申请日:2023-11-07
Applicant: 度小满科技(北京)有限公司
IPC: G06N3/042 , G06N3/0495 , G06N3/08
Abstract: 本发明提供一种数据处理方法、装置、电子设备及可读存储介质,包括:接收第一输入,所述第一输入为第一图神经网络数据,所述第一图神经网络数据包括节点和连接所述节点的边特征;响应于所述第一输入,将所述第一图神经网络数据按时域压缩为包含全量数据的第二图神经网络结构;接收第二输入,所述第二输入为获取目标第一图神经网络数据的指令;响应于所述第二输入,按时间戳从所述第二图神经网络结构中生成目标图神经网络结构。本发明减少第一图神经网络数据中重复的节点和边特征造成的庞大数据量,加快了建模效率。
-
公开(公告)号:CN117174083A
公开(公告)日:2023-12-05
申请号:CN202311264566.0
申请日:2023-09-27
Applicant: 度小满科技(北京)有限公司
Abstract: 本发明提供一种模型训练方法、装置、存储介质及电子设备,该方法包括:获取训练数据和第一语音识别模型;对训练数据进行特征掩码,得到特征掩码后的训练数据;调用第一语音识别模型,对训练数据进行类别预测,得到训练数据中各个语音特征的参考类别标签;调用第一语音识别模型,对特征掩码后的训练数据进行类别预测,得到特征掩码后的训练数据中各个掩码特征的预测类别标签;采用各个掩码特征的预测类别标签和相应掩码特征对应语音特征的参考类别标签之间的差异,计算模型损失值,并按照减小模型损失值的方向,优化第一语音识别模型中的模型参数,以确定第二语音识别模型。本发明实施例可降低模型训练的成本,并提高语音识别模型的准确率。
-
-
-
-
-
-
-
-
-