一种敦煌垂直领域大模型训练方法、系统、介质及设备

    公开(公告)号:CN119322830A

    公开(公告)日:2025-01-17

    申请号:CN202411349613.6

    申请日:2024-09-26

    Applicant: 浙江大学

    Abstract: 本发明公开了一种敦煌垂直领域大模型训练方法、系统、介质及设备,属于人工智能领域和文化领域。本发明通过整理敦煌大辞典、敦煌概论、敦煌18讲等敦煌垂直领域知识,形成了敦煌指令微调数据和“关键词‑解释”的字典类向量知识库,通过继续预训练、有监督微调、外挂向量知识库等步骤,训练出了面向文化旅游和语言专家的敦煌垂直领域大模型。进而提出PhiloCoP框架,以便于敦煌垂直领域大模型的应用。本发明为敦煌爱好者和考古学家提供了更便利的查询知识和辅助研究的工具,有助于在更大范围内更便捷的宣传敦煌文化,能够应用在古代语言学研究领域和旅游场景。

Patent Agency Ranking