-
公开(公告)号:CN118982008A
公开(公告)日:2024-11-19
申请号:CN202411040944.1
申请日:2024-07-31
Applicant: 上海勘测设计研究院有限公司
IPC: G06F40/174 , G06F40/18 , G06F40/205 , G06F40/226 , G06F16/33
Abstract: 本发明涉及文档处理技术领域,公开了一种文档处理方法、系统、设备、存储介质和产品,该方法包括:基于第一大语言模型对接收的文档进行文档解析,提取关键数据并将关键数据存储到预先设置的表格库中;基于第二大语言模型提取预设表格的表格内容,根据表格内容从表格库中检索匹配项,并将匹配项填写到预设表格中。本发明采用第一大型语言模型和第二大语言模型分别实现文档提取和表格填写,只需通过弱监督学习进行训练即可实现较为优秀的填写效果,不仅大幅减少了训练所需的时间成本,还能达到高达95%的成功率,显著提升了文档处理的准确性和效率。