-
公开(公告)号:CN118839705B
公开(公告)日:2025-01-07
申请号:CN202411312372.8
申请日:2024-09-20
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种文本翻译方法、装置、计算机设备及可读存储介质。方法包括:获取待翻译文本并将其输入至目标翻译模型中,得到多个候选翻译结果;通过大语言模型确定目标翻译结果;目标翻译模型由预设翻译模型基于目标损失的最小化进行翻译性能学习得到;目标损失由第一损失和第二损失构成,第一损失由预设翻译模型和大语言模型的输出差异确定;第二损失基于第一预测翻译标签和样本翻译标签之间的差异确定;翻译性能学习包括基于第一损失最小化实现的对模拟大语言模型翻译输出的表征学习、以及基于第二损失最小化实现的对第一预测翻译标签和样本翻译标签之间的翻译差异最小化学习。以此,能够提高文本翻译的准确性和流畅性。
-
公开(公告)号:CN116341652A
公开(公告)日:2023-06-27
申请号:CN202310133976.5
申请日:2023-02-08
Applicant: 鹏城实验室
Abstract: 本发明针对使用跨地域算力中心算力进行深度模型训练的场景需求,设计了一种面向云际环境的深度模型训练方法,采用按照网络层次拆分模型参数到不同算力中心、跨域算力节点间采用压缩通信、算力中心内和算力中心间采用混合并行等策略,实现利用跨域算力协同完成深度模型训练。本发明可以使大模型训练不再受单算力中心算力资源的限制,能够高效利用跨域算力中心的算力,在低带宽环境下利用跨域算力协同完成大规模模型的训练任务。
-
公开(公告)号:CN119724166A
公开(公告)日:2025-03-28
申请号:CN202510222184.4
申请日:2025-02-27
Applicant: 鹏城实验室
IPC: G10L15/06
Abstract: 本申请实施例提供了一种模型训练方法、语音识别方法、设备及存储介质,属于语音数据处理技术领域;方法包括获取原始多媒体样本数据;根据预设的通用参数配置文件,获取与原始多媒体样本数据对应的格式脚本;根据格式脚本对原始多媒体样本数据进行格式归一化处理,得到原始样本语音数据;通过通用参数配置文件调用多个功能模块,使多个功能模块基于原始样本语音数据对初始的语音识别模型进行训练,得到目标语音识别模型。本申请实施例能进一步缩短语音识别模型的开发周期,从而缩短语音识别模型的部署时长。
-
公开(公告)号:CN118839705A
公开(公告)日:2024-10-25
申请号:CN202411312372.8
申请日:2024-09-20
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种文本翻译方法、装置、计算机设备及可读存储介质。方法包括:获取待翻译文本并将其输入至目标翻译模型中,得到多个候选翻译结果;通过大语言模型确定目标翻译结果;目标翻译模型由预设翻译模型基于目标损失的最小化进行翻译性能学习得到;目标损失由第一损失和第二损失构成,第一损失由预设翻译模型和大语言模型的输出差异确定;第二损失基于第一预测翻译标签和样本翻译标签之间的差异确定;翻译性能学习包括基于第一损失最小化实现的对模拟大语言模型翻译输出的表征学习、以及基于第二损失最小化实现的对第一预测翻译标签和样本翻译标签之间的翻译差异最小化学习。以此,能够提高文本翻译的准确性和流畅性。
-
公开(公告)号:CN119940374A
公开(公告)日:2025-05-06
申请号:CN202411967206.1
申请日:2024-12-26
Applicant: 鹏城实验室
Abstract: 本申请实施例提出的译文质量评估模型训练方法、评估方法及相关设备,方法包括:获取译文质量评估数据集,译文质量评估数据集包括至少一个训练批次,训练批次包括多个样本文本对和样本文本对的第一译文质量分数,样本文本对至少包括待评估译文和标签译文;对于每个训练批次,利用译文质量评估模型基于样本文本对中标签译文对待评估译文进行打分,得到第二译文质量分数;根据第一译文质量分数和第二译文质量分数计算训练批次对应的批散度损失值;根据批散度损失值对译文质量评估模型进行训练,得到训练完成的译文质量评估模型,从而提高译文质量评估模型的训练可靠性,进而提高利用该译文质量评估模型对目标译文进行质量评估的精准性。
-
公开(公告)号:CN116489678A
公开(公告)日:2023-07-25
申请号:CN202310389923.X
申请日:2023-04-04
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种深度学习模型的通信优化方法及装置、存储介质,方法包括:对深度学习模型进行切分,得到位于第一通信节点下的第一子模型和位于第二通信节点下的第二子模型;在第一通信节点下,根据稀疏化比例参数和第一子模型传输的前向数据,计算前向数据的稀疏化阈值,并且根据稀疏化阈值和稀疏化比例参数对前向数据进行压缩,得到中间数据;在第二通信节点下,根据量化参数对中间数据进行解压缩,得到后向数据;向第二子模型传输后向数据以进行训练。本申请实施例中,两个子模型所处的两个通信节点之间采用低带宽网络连接,整个通信过程的负载消耗能够得到限制,从而能够在保持深度学习模型的训练精度的前提下,有效地降低通信负载。
-
公开(公告)号:CN119204031A
公开(公告)日:2024-12-27
申请号:CN202411097546.3
申请日:2024-08-09
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种翻译文本质量评估方法、装置、计算机设备及存储介质。方法包括:获取待评估译文的翻译源文和参考译文,并基于翻译源文对参考译文进行质量评估,得到参考译文的参考质量;通过翻译源文对待评估译文进行质量打分,得到第一质量分数;通过参考译文对待评估译文进行质量打分,得到第二质量分数;根据参考译文的参考质量,对第一质量分数进行权重的调整,得到第一目标质量分数,并对第二质量分数进行权重的调整,得到第二目标质量分数;其中,第一质量分数的权重随着参考质量的增加而减少;基于第一目标质量分数和第二目标质量分数,得到待评估译文的质量评估结果。以此,能够有效提高对翻译文本进行质量评估的准确性。
-
公开(公告)号:CN118820077A
公开(公告)日:2024-10-22
申请号:CN202410793744.7
申请日:2024-06-19
Applicant: 鹏城实验室
Abstract: 本申请公开了模型的在线评测方法、系统、电子设备及介质,方法包括:接收模型评测请求以及模型评测资源,并创建调试任务;根据模型评测资源确定与调试任务对应的目标资源,并根据目标资源确定目标镜像、目标代码以及目标模型;通过目标镜像创建与调试任务对应的调试容器,并在调试容器中挂载目标代码和目标模型,对目标代码进行检测;当完成调试任务且对目标代码的检测通过时,根据目标资源创建推理任务;通过目标镜像创建与推理任务对应的推理容器,并在推理容器中对获取到的评测数据集进行预测,生成推理结果;对推理结果进行在线评测,得到评测结果。在本发明实施例中,无需用户再次上传资源,避免资源重复上传,提高评测效率。
-
公开(公告)号:CN116225387A
公开(公告)日:2023-06-06
申请号:CN202310132331.X
申请日:2023-02-07
Applicant: 鹏城实验室
Abstract: 本发明公开了一种基于昇思框架的低耦合情感分析算法库,所述低耦合情感分析算法库包括:算法模块,与算法模块耦合连接的暴露接口,以及与暴露接口耦合连接的统一调用接口;其中,算法模块用于构建和训练所述低耦合情感分析算法库中的算法;算法模块包括数据模块、模型模块和训练模块;暴露接口用于为所述统一调用接口提供每个算法的调用接口;统一调用接口包括超参数配置信息和调用逻辑。本发明基于国产昇思框架来构建算法库,通过保留每个算法的完整性来降低不同算法之间的耦合度,让每个算法自成一体的同时通过暴露一个接口来实现统一调度,从而实现算法库跨平台、统一架构、统一调用接口和易扩展的特性。
-
-
-
-
-
-
-
-