-
公开(公告)号:CN119476448A
公开(公告)日:2025-02-18
申请号:CN202510055895.7
申请日:2025-01-14
Applicant: 国家气象中心(中央气象台、中国气象局气象导航中心)
Abstract: 本发明公开了一种气象语料库构建方法、系统及相关装置,属于气象数据处理技术领域。该方法包括:收集气象领域的原始语料文件,将原始语料文件转换成统一的markdown格式数据;对所述markdown格式数据进行清洗,并组织成统一结构化的气象语料库;将所述统一结构化的气象语料库结合外部知识库构建气象服务大模型所需要的各类数据集,各类数据集包括用于预训练的数据集、微调的数据集以及检索增强生成所需的数据集和评估基准数据集。该方法显著提高了构建效率,降低了人工成本,同时也确保了气象语料库的质量和一致性。
-
公开(公告)号:CN119476449A
公开(公告)日:2025-02-18
申请号:CN202510055944.7
申请日:2025-01-14
Applicant: 国家气象中心(中央气象台、中国气象局气象导航中心)
IPC: G06N5/022 , G06F16/36 , G06F16/31 , G06F16/335 , G06F16/951 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种天气预报服务文本数据集生成方法、系统及相关装置,属于气象数据处理技术领域。该方法包括:采集天气预报服务数据;对天气预报服务数据进行预处理,得到天气预报服务文本数据;基于大语言模型,对天气预报服务文本数据进行扩展,得到天气预报服务文本扩展数据集;采用大语言模型和定量评估算法相结合的方式,对天气预报服务文本扩展数据集进行检验评估;将天气预报服务文本扩展数据集中满足检验评估的数据构建得到天气预报服务文本数据集。该方法可以实现天气预报服务文本数据集的半自动化构建,有效提升了数据集的生成效率。
-
公开(公告)号:CN119476449B
公开(公告)日:2025-05-16
申请号:CN202510055944.7
申请日:2025-01-14
Applicant: 国家气象中心(中央气象台、中国气象局气象导航中心)
IPC: G06N5/022 , G06F16/36 , G06F16/31 , G06F16/335 , G06F16/951 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种天气预报服务文本数据集生成方法、系统及相关装置,属于气象数据处理技术领域。该方法包括:采集天气预报服务数据;对天气预报服务数据进行预处理,得到天气预报服务文本数据;基于大语言模型,对天气预报服务文本数据进行扩展,得到天气预报服务文本扩展数据集;采用大语言模型和定量评估算法相结合的方式,对天气预报服务文本扩展数据集进行检验评估;将天气预报服务文本扩展数据集中满足检验评估的数据构建得到天气预报服务文本数据集。该方法可以实现天气预报服务文本数据集的半自动化构建,有效提升了数据集的生成效率。
-
公开(公告)号:CN119476249A
公开(公告)日:2025-02-18
申请号:CN202510077774.2
申请日:2025-01-17
Applicant: 国家气象中心(中央气象台、中国气象局气象导航中心)
IPC: G06F40/186 , G06F40/284 , G01W1/10
Abstract: 本发明公开了一种天气公报材料自动生成方法、装置、设备及存储介质,所述方法通过获取气象预报实况数据和国家级天气公报的公报类型,根据所述公报类型通过数据服务接口对所述气象预报实况数据进行处理,获得气象信息;根据分析服务接口对所述气象信息进行分析,获得符合预设规范的气象服务文字数据;将所述气象服务文字数据输入至公报自动生成服务模型,通过材料组织接口输出综合公报材料,能够有效提升服务材料的编写效率,自动生成的预报文本内容正确、语句通顺、语义、语法正确,文本风格符合预报员行文习惯,保障了文档的正确性、一致性、规范性,规避了手工操作时可能导致的错误,提高了天气公报材料自动生成的速度和效率。
-
-
-