-
公开(公告)号:CN118800239A
公开(公告)日:2024-10-18
申请号:CN202410994241.6
申请日:2024-07-24
Applicant: 华东师范大学
Abstract: 本发明公开了一种基于具备音乐理解能力的大语言模型自动生成音乐描述文本的方法,包括:a)使用大语言模型对现有的具备音乐‑描述文本‑音乐标签的小规模人工标注音乐数据集进行数据增强,得到多种不同的训练用提示词并训练多个具备音乐理解能力的大语言模型;b)利用现有的具备音乐‑音乐标签的数据集中的音乐标签构建多种不同的标注用提示词,将数据集中的音乐信息和多种标注用提示词分别输入训练后的模型中联合进行音乐自动标注,生成音乐描述文本。本发明使用成熟大语言模型的数据增强方式,在不改变现有数据集的准确性的前提下对数据集进行扩充,由此训练多个模型进行联合标注,获得更为准确的音乐描述文本。