-
公开(公告)号:CN119782813A
公开(公告)日:2025-04-08
申请号:CN202411829513.3
申请日:2024-12-12
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
Inventor: 林德煜 , 李盛阁 , 郑丁瑜 , 马德琳 , 张树业 , 毕金龙 , 徐经纬 , 肖聪 , 李高正 , 何志澎 , 张子川 , 朱方路 , 黄思颖 , 姚望 , 郑仰佳 , 卜志雄 , 曾嘉伟
IPC: G06F18/214 , G06F18/22 , G06F16/3329 , G06F40/16
Abstract: 本申请关于一种训练数据生成方法、装置、计算机设备、存储介质及产品,涉及机器学习技术领域。该方法包括:获取基于原始文档得到任意一个目标文本段;通过不同提示方式设置的多个大语言模型对目标文本段进行问答对提取,得到目标文本段的多个问答对;在多个问答对中包含问题文本相同的至少两个目标问答对的情况下,基于至少两个目标问答对生成重组问答对;重组问答对中包含问题文本以及重组回答文本;该重组回答文本是基于至少两个目标问答对中的回答文本生成的;基于重组问答对以及多个问答对中的非目标问答对生成训练数据;通过上述方法,可以实现训练数据生成的自动化,提高训练数据的生成效率,并且提高训练数据的数据质量以及全面性。
-
公开(公告)号:CN119783850A
公开(公告)日:2025-04-08
申请号:CN202411826324.0
申请日:2024-12-12
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
Inventor: 林德煜 , 胡文辉 , 李盛阁 , 郑丁瑜 , 马德琳 , 毕金龙 , 张树业 , 徐经纬 , 张子川 , 卜志雄 , 朱方路 , 何志澎 , 罗志鹏 , 王磊 , 覃复慧 , 郑仰佳 , 阮晓军 , 余洁文 , 方海滨
Abstract: 本申请公开一种文本推理模型训练方法、数字人文本推理方法及相关设备,属于人工智能技术领域。其中,该方法包括:响应第一终端发起的模型训练请求,获取模型训练请求对应的训练文件和训练实例标识;根据预先配置的模型训练预处理工具,对训练文件进行预处理,得到模型训练数据;通过将所述模型训练数据分配至所述训练实例标识对应的模型学习服务实例,获取所述模型学习服务实例根据所述模型训练数据对预训练语言模型进行训练得到的文本推理模型。通过该方式,可以简化预训练语言模型的微调和训练过程,降低操作复杂度,从而使得模型应用更易于推广。
-
公开(公告)号:CN119918660A
公开(公告)日:2025-05-02
申请号:CN202411913765.4
申请日:2024-12-24
Applicant: 中移互联网有限公司 , 中国移动通信集团有限公司
IPC: G06N5/04
Abstract: 本申请公开了一种请求处理方法,所述方法包括:响应于接收到第一客户端发送的推理请求,获取与目标模型对应的映射实例表,其中,所述推理请求用于请求所述目标模型执行推理任务,所述映射实例表包括所述目标模型与至少一个第一候选服务实例的对应关系;从所述映射实例表中选择目标服务实例,并将所述推理请求转发至所述目标服务实例;响应于接收到所述目标服务实例针对所述推理请求返回的推理结果,将所述推理结果发送至所述第一客户端。
-
-