基于深度学习的电子文档中标题印章指纹特征检测方法

    公开(公告)号:CN111476165A

    公开(公告)日:2020-07-31

    申请号:CN202010266816.4

    申请日:2020-04-07

    Abstract: 本发明公开了一种基于深度学习的电子文档中标题印章指纹特征检测方法,包括:对电子文档图片按比例进行手工标注作为训练集,其余作为测试集;搭建并训练集训练Faster-RCNN模型;将测试集输入训练好的Faster-RCNN模型预测目标类别和坐标,对测试集进行自动标注,形成标注数据集;采用标注数据集对Faster-RCNN模型进行迭代训练,导出最终的Faster-RCNN模型的模型参数,输入电子文档图片,得到电子文档中标题印章指纹信息。本发明采用多次修改模型参数和迭代训练的方法,将基于深度学习的目标检测用于传统的案件电子卷宗文档处理领域后,极大方便了文档处理;采用半自动化标注,节约了人力。

    基于规则和模型结合的法律文书信息抽取方法及系统

    公开(公告)号:CN111476034B

    公开(公告)日:2023-05-12

    申请号:CN202010266180.3

    申请日:2020-04-07

    Abstract: 本发明公开了一种基于规则和模型结合的法律文书信息抽取方法,包括:创建词典和文书实体抽取规则,采用基于规则的抽取方法进行法律文书实体抽取;将抽取结果作为初次标注数据进行数据标注操作、训练模型以及发布模型;采用基于规则和模型相结合的抽取方法进行法律文书实体抽取,选取评估结果高的为输出结果;对结果进行评估,如果满足要求则结束;如果不满足要求继续迭代。还公开了一种法律文书信息抽取系统,包括数据采集模块、信息提取模块、数据标注模块、数据集管理模块和评估模块。本发明将规则与模型的方法有效结合、形成互补,提高法律文书信息提取效果,同时系统可拓展性、移植性更强。

    基于规则和模型结合的法律文书信息抽取方法及系统

    公开(公告)号:CN111476034A

    公开(公告)日:2020-07-31

    申请号:CN202010266180.3

    申请日:2020-04-07

    Abstract: 本发明公开了一种基于规则和模型结合的法律文书信息抽取方法,包括:创建词典和文书实体抽取规则,采用基于规则的抽取方法进行法律文书实体抽取;将抽取结果作为初次标注数据进行数据标注操作、训练模型以及发布模型;采用基于规则和模型相结合的抽取方法进行法律文书实体抽取,选取评估结果高的为输出结果;对结果进行评估,如果满足要求则结束;如果不满足要求继续迭代。还公开了一种法律文书信息抽取系统,包括数据采集模块、信息提取模块、数据标注模块、数据集管理模块和评估模块。本发明将规则与模型的方法有效结合、形成互补,提高法律文书信息提取效果,同时系统可拓展性、移植性更强。

    一种基于大模型和检索增强技术的智能查询方法及系统

    公开(公告)号:CN119003743A

    公开(公告)日:2024-11-22

    申请号:CN202411473863.0

    申请日:2024-10-22

    Abstract: 本发明涉及自然语言处理大模型的数据分析领域,具体是涉及一种基于大模型和检索增强技术的智能查询方法及系统,主要用于使查询系统能够稳定运行并快速响应用户请求,所述方法包括:S1.相似问题检索,在向量知识库中检索用户提出的相似问题和答案;S2.大模型利用检索结果生成SQL;S3.数据验证与展示,对大模型生成的SQL在数据库中执行验证,展示SQL查询结果数据;S4.记录和收集数据,记录用户问题与大模型生成并能正确执行的SQL,存入向量数据库;S5.微调和更新大模型,定期更新发布大模型。本发明使得非专业人员能够从复杂的数据库系统中获取专业数据的问题,同时结合RAG检索增强提高大模型性能,并记录历史数据不断微调训练大模型。

Patent Agency Ranking