-
公开(公告)号:CN119724166A
公开(公告)日:2025-03-28
申请号:CN202510222184.4
申请日:2025-02-27
Applicant: 鹏城实验室
IPC: G10L15/06
Abstract: 本申请实施例提供了一种模型训练方法、语音识别方法、设备及存储介质,属于语音数据处理技术领域;方法包括获取原始多媒体样本数据;根据预设的通用参数配置文件,获取与原始多媒体样本数据对应的格式脚本;根据格式脚本对原始多媒体样本数据进行格式归一化处理,得到原始样本语音数据;通过通用参数配置文件调用多个功能模块,使多个功能模块基于原始样本语音数据对初始的语音识别模型进行训练,得到目标语音识别模型。本申请实施例能进一步缩短语音识别模型的开发周期,从而缩短语音识别模型的部署时长。
-
公开(公告)号:CN118839705A
公开(公告)日:2024-10-25
申请号:CN202411312372.8
申请日:2024-09-20
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种文本翻译方法、装置、计算机设备及可读存储介质。方法包括:获取待翻译文本并将其输入至目标翻译模型中,得到多个候选翻译结果;通过大语言模型确定目标翻译结果;目标翻译模型由预设翻译模型基于目标损失的最小化进行翻译性能学习得到;目标损失由第一损失和第二损失构成,第一损失由预设翻译模型和大语言模型的输出差异确定;第二损失基于第一预测翻译标签和样本翻译标签之间的差异确定;翻译性能学习包括基于第一损失最小化实现的对模拟大语言模型翻译输出的表征学习、以及基于第二损失最小化实现的对第一预测翻译标签和样本翻译标签之间的翻译差异最小化学习。以此,能够提高文本翻译的准确性和流畅性。
-
公开(公告)号:CN118486014A
公开(公告)日:2024-08-13
申请号:CN202410556742.6
申请日:2024-05-07
Applicant: 鹏城实验室
IPC: G06V20/64 , G06V10/82 , G06V10/774 , G06N3/08 , G06N3/0464
Abstract: 本申请公开了一种电容提取方法、装置、电子设备及存储介质,涉及集成电路技术领域,公开了电容提取方法,包括:获取待进行电容提取的目标版图;对所述目标版图进行三维采样,得到待提取样本;基于高斯定理对所述待提取样本进行点云编码,得到待提取编码数据;将所述待提取编码数据输入目标电容提取模型中,得到所述目标电容提取模型输出的目标电容。本申请实现了提升电容提取准确度的技术效果。
-
公开(公告)号:CN116225387A
公开(公告)日:2023-06-06
申请号:CN202310132331.X
申请日:2023-02-07
Applicant: 鹏城实验室
Abstract: 本发明公开了一种基于昇思框架的低耦合情感分析算法库,所述低耦合情感分析算法库包括:算法模块,与算法模块耦合连接的暴露接口,以及与暴露接口耦合连接的统一调用接口;其中,算法模块用于构建和训练所述低耦合情感分析算法库中的算法;算法模块包括数据模块、模型模块和训练模块;暴露接口用于为所述统一调用接口提供每个算法的调用接口;统一调用接口包括超参数配置信息和调用逻辑。本发明基于国产昇思框架来构建算法库,通过保留每个算法的完整性来降低不同算法之间的耦合度,让每个算法自成一体的同时通过暴露一个接口来实现统一调度,从而实现算法库跨平台、统一架构、统一调用接口和易扩展的特性。
-
公开(公告)号:CN118839705B
公开(公告)日:2025-01-07
申请号:CN202411312372.8
申请日:2024-09-20
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种文本翻译方法、装置、计算机设备及可读存储介质。方法包括:获取待翻译文本并将其输入至目标翻译模型中,得到多个候选翻译结果;通过大语言模型确定目标翻译结果;目标翻译模型由预设翻译模型基于目标损失的最小化进行翻译性能学习得到;目标损失由第一损失和第二损失构成,第一损失由预设翻译模型和大语言模型的输出差异确定;第二损失基于第一预测翻译标签和样本翻译标签之间的差异确定;翻译性能学习包括基于第一损失最小化实现的对模拟大语言模型翻译输出的表征学习、以及基于第二损失最小化实现的对第一预测翻译标签和样本翻译标签之间的翻译差异最小化学习。以此,能够提高文本翻译的准确性和流畅性。
-
-
-
-