-
公开(公告)号:CN119517430A
公开(公告)日:2025-02-25
申请号:CN202411429652.7
申请日:2024-10-14
Applicant: 北京邮电大学
Abstract: 本申请提供一种医疗领域大模型训练数据生成方法,通过以真实病例数据为参考,通过自动化程序调用大语言模型,使大语言模型批量生成问题数据、参考数据与答案数据,并且通过设置的prompt提示词引导大语言模型生成并优化模型精调数据,从而为医疗领域行业模型生成特化的模型精调数据,节省了后续行业大模型的训练时间。并且由于病例数据获取难度较高,隐私信息较多,相较于直接获取真实病例信息,本申请所公开的技术方案还具有成本低、隐私性强的优点。