-
公开(公告)号:CN117390598A
公开(公告)日:2024-01-12
申请号:CN202311399658.X
申请日:2023-10-25
Applicant: 鹏城实验室
Abstract: 本发明公开了一种模型溯源方法、装置、设备及存储介质。该方法包括:获取源模型对应的训练数据;根据所述训练数据确定所述源模型对应的源模型DNA以及目标模型对应的目标模型DNA;基于所述源模型DNA和所述目标模型DNA确定组合DNA;将所述组合DNA输入至预设判别器模型,根据所述预设判别器模型输出的判别结果确定模型溯源结果。由于本发明是通过源模型对应的源模型DNA以及目标模型对应的目标模型DNA确定组合DNA,将组合DNA输入至预设判别器模型,得到模型溯源结果。本发明首次引入了机器学习模型DNA的概念。可以实现对模型的追溯,以追踪模型的来源。这有助于确保模型的可信度和安全性。
-
公开(公告)号:CN118839705B
公开(公告)日:2025-01-07
申请号:CN202411312372.8
申请日:2024-09-20
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种文本翻译方法、装置、计算机设备及可读存储介质。方法包括:获取待翻译文本并将其输入至目标翻译模型中,得到多个候选翻译结果;通过大语言模型确定目标翻译结果;目标翻译模型由预设翻译模型基于目标损失的最小化进行翻译性能学习得到;目标损失由第一损失和第二损失构成,第一损失由预设翻译模型和大语言模型的输出差异确定;第二损失基于第一预测翻译标签和样本翻译标签之间的差异确定;翻译性能学习包括基于第一损失最小化实现的对模拟大语言模型翻译输出的表征学习、以及基于第二损失最小化实现的对第一预测翻译标签和样本翻译标签之间的翻译差异最小化学习。以此,能够提高文本翻译的准确性和流畅性。
-
公开(公告)号:CN116362265A
公开(公告)日:2023-06-30
申请号:CN202310595862.2
申请日:2023-05-25
Applicant: 鹏城实验室
IPC: G06F40/58 , G06F40/42 , G06F40/126 , G06F40/226 , G06F40/166
Abstract: 本发明实施例提供文本翻译方法、装置、设备和存储介质,涉及人工智能技术领域。该方法包括:通过对源语言句子进行编码,得到第一隐藏层向量;然后根据第一隐藏层向量执行迭代翻译过程,在迭代翻译过程中对预测序列的错误进行定位,将错误词语进行掩码后重新预测,直至满足迭代结束条件,将预测序列作为源语言句子的目标语言翻译句子。本申请实施例针对非自回归文本翻译,利用迭代式解码机制提升翻译性能,不同于一次性生成翻译结果的方式,并且其通过迭代翻译过程多次微调中间翻译结果的预测序列,准确判断生成的预测序列中词语的正确性,对其进行错误进行定位,根据定位结果替换需要修改的预测词,能够提升推理速度以及翻译结果。
-
公开(公告)号:CN116341652A
公开(公告)日:2023-06-27
申请号:CN202310133976.5
申请日:2023-02-08
Applicant: 鹏城实验室
Abstract: 本发明针对使用跨地域算力中心算力进行深度模型训练的场景需求,设计了一种面向云际环境的深度模型训练方法,采用按照网络层次拆分模型参数到不同算力中心、跨域算力节点间采用压缩通信、算力中心内和算力中心间采用混合并行等策略,实现利用跨域算力协同完成深度模型训练。本发明可以使大模型训练不再受单算力中心算力资源的限制,能够高效利用跨域算力中心的算力,在低带宽环境下利用跨域算力协同完成大规模模型的训练任务。
-
公开(公告)号:CN115952809A
公开(公告)日:2023-04-11
申请号:CN202211709287.6
申请日:2022-12-29
Applicant: 鹏城实验室
IPC: G06F40/58 , G06F40/242 , G06N3/08 , G06F16/36 , G06F40/216 , G06F40/289 , G06F18/22 , G06N3/04
Abstract: 本发明公开了一种基于图网络的多语言翻译的词表初始化方法及装置,包括:根据每种语言对应的双语词典、词语及词元的分解构成关系,构建每种语言与核心语言之间的词表映射异质图;根据异质图神经网络和对比学习算法,在词表映射异质图上学习不同语言词表与核心语言词表之间的词元映射关系;将多语言机器翻译任务中的核心语言词表的词元利用核心语言BERT模型的词表进行初始化,并根据词元映射关系将其他语言映射到核心语言BERT模型的词表空间,完成多语言机器翻译任务中所有词元的初始化。本发明利用构建词元异质图的方式来完成不同语言词元的映射来初始化词元,提高了多语言机器翻译模型的翻译准确率,同时也加快了模型收敛速度。
-
公开(公告)号:CN119724166A
公开(公告)日:2025-03-28
申请号:CN202510222184.4
申请日:2025-02-27
Applicant: 鹏城实验室
IPC: G10L15/06
Abstract: 本申请实施例提供了一种模型训练方法、语音识别方法、设备及存储介质,属于语音数据处理技术领域;方法包括获取原始多媒体样本数据;根据预设的通用参数配置文件,获取与原始多媒体样本数据对应的格式脚本;根据格式脚本对原始多媒体样本数据进行格式归一化处理,得到原始样本语音数据;通过通用参数配置文件调用多个功能模块,使多个功能模块基于原始样本语音数据对初始的语音识别模型进行训练,得到目标语音识别模型。本申请实施例能进一步缩短语音识别模型的开发周期,从而缩短语音识别模型的部署时长。
-
公开(公告)号:CN118839705A
公开(公告)日:2024-10-25
申请号:CN202411312372.8
申请日:2024-09-20
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了一种文本翻译方法、装置、计算机设备及可读存储介质。方法包括:获取待翻译文本并将其输入至目标翻译模型中,得到多个候选翻译结果;通过大语言模型确定目标翻译结果;目标翻译模型由预设翻译模型基于目标损失的最小化进行翻译性能学习得到;目标损失由第一损失和第二损失构成,第一损失由预设翻译模型和大语言模型的输出差异确定;第二损失基于第一预测翻译标签和样本翻译标签之间的差异确定;翻译性能学习包括基于第一损失最小化实现的对模拟大语言模型翻译输出的表征学习、以及基于第二损失最小化实现的对第一预测翻译标签和样本翻译标签之间的翻译差异最小化学习。以此,能够提高文本翻译的准确性和流畅性。
-
公开(公告)号:CN119940374A
公开(公告)日:2025-05-06
申请号:CN202411967206.1
申请日:2024-12-26
Applicant: 鹏城实验室
Abstract: 本申请实施例提出的译文质量评估模型训练方法、评估方法及相关设备,方法包括:获取译文质量评估数据集,译文质量评估数据集包括至少一个训练批次,训练批次包括多个样本文本对和样本文本对的第一译文质量分数,样本文本对至少包括待评估译文和标签译文;对于每个训练批次,利用译文质量评估模型基于样本文本对中标签译文对待评估译文进行打分,得到第二译文质量分数;根据第一译文质量分数和第二译文质量分数计算训练批次对应的批散度损失值;根据批散度损失值对译文质量评估模型进行训练,得到训练完成的译文质量评估模型,从而提高译文质量评估模型的训练可靠性,进而提高利用该译文质量评估模型对目标译文进行质量评估的精准性。
-
公开(公告)号:CN119443122A
公开(公告)日:2025-02-14
申请号:CN202411539532.2
申请日:2024-10-30
Applicant: 鹏城实验室
IPC: G06F40/58 , G06F40/205 , G06F40/253 , G06F40/284
Abstract: 本申请实施例提供文本翻译方法、装置、设备和存储介质,涉及文本翻译技术领域。该方法获取初始文本以及翻译元素,将翻译元素输入语法解析智能体、修辞理解智能体和文化背景智能体得到语法解析数据、修辞解析数据和文化解析数据,将初始文本、语法解析数据、修辞解析数据和文化解析数据输入任务分配智能体进行任务分配得到语法解析数据的第一比例、修辞解析数据的第二比例和文化解析数据的第三比例,基于第一比例、第二比例、第三比例生成初始解析数据,将初始文本和初始解析数据输入翻译智能体进行翻译处理,得到初始文本的翻译文本。结合多智能体的集体智慧,在翻译过程中综合利用修辞及文化差异等信息,提升翻译结果的准确性。
-
公开(公告)号:CN119443049A
公开(公告)日:2025-02-14
申请号:CN202411417310.3
申请日:2024-10-11
Applicant: 鹏城实验室
IPC: G06F40/157 , G06F40/284 , G06F18/213 , G06F18/22 , G06F18/25 , G06N20/20
Abstract: 本申请实施例提供了一种文本处理方法、装置、电子设备以及存储介质,属于人工智能技术领域。该方法包括:将获取到的待处理的初始文本信息分别输入至预设的大语言模型中,得到各个大语言模型对应输出的初始特征,大语言模型包括模型结构不同的目标大语言模型和多个异构大语言模型;基于与目标大语言模型以及每个异构大语言模型的模型结构对应的各个向量转换矩阵,对任意一个初始特征进行映射处理,得到在同一向量空间下各个大语言模型对应的映射特征;基于多个不同的映射特征确定目标特征,并基于目标大语言模型对目标特征进行逆映射处理,得到初始文本信息对应的目标文本信息。本申请能够提高输出的目标文本信息的准确度。
-
-
-
-
-
-
-
-
-