-
公开(公告)号:CN111476165A
公开(公告)日:2020-07-31
申请号:CN202010266816.4
申请日:2020-04-07
Applicant: 同方赛威讯信息技术有限公司
Abstract: 本发明公开了一种基于深度学习的电子文档中标题印章指纹特征检测方法,包括:对电子文档图片按比例进行手工标注作为训练集,其余作为测试集;搭建并训练集训练Faster-RCNN模型;将测试集输入训练好的Faster-RCNN模型预测目标类别和坐标,对测试集进行自动标注,形成标注数据集;采用标注数据集对Faster-RCNN模型进行迭代训练,导出最终的Faster-RCNN模型的模型参数,输入电子文档图片,得到电子文档中标题印章指纹信息。本发明采用多次修改模型参数和迭代训练的方法,将基于深度学习的目标检测用于传统的案件电子卷宗文档处理领域后,极大方便了文档处理;采用半自动化标注,节约了人力。
-
公开(公告)号:CN111476034B
公开(公告)日:2023-05-12
申请号:CN202010266180.3
申请日:2020-04-07
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F40/295 , G06F40/247 , G06Q50/18
Abstract: 本发明公开了一种基于规则和模型结合的法律文书信息抽取方法,包括:创建词典和文书实体抽取规则,采用基于规则的抽取方法进行法律文书实体抽取;将抽取结果作为初次标注数据进行数据标注操作、训练模型以及发布模型;采用基于规则和模型相结合的抽取方法进行法律文书实体抽取,选取评估结果高的为输出结果;对结果进行评估,如果满足要求则结束;如果不满足要求继续迭代。还公开了一种法律文书信息抽取系统,包括数据采集模块、信息提取模块、数据标注模块、数据集管理模块和评估模块。本发明将规则与模型的方法有效结合、形成互补,提高法律文书信息提取效果,同时系统可拓展性、移植性更强。
-
公开(公告)号:CN111476034A
公开(公告)日:2020-07-31
申请号:CN202010266180.3
申请日:2020-04-07
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F40/295 , G06F40/247 , G06Q50/18
Abstract: 本发明公开了一种基于规则和模型结合的法律文书信息抽取方法,包括:创建词典和文书实体抽取规则,采用基于规则的抽取方法进行法律文书实体抽取;将抽取结果作为初次标注数据进行数据标注操作、训练模型以及发布模型;采用基于规则和模型相结合的抽取方法进行法律文书实体抽取,选取评估结果高的为输出结果;对结果进行评估,如果满足要求则结束;如果不满足要求继续迭代。还公开了一种法律文书信息抽取系统,包括数据采集模块、信息提取模块、数据标注模块、数据集管理模块和评估模块。本发明将规则与模型的方法有效结合、形成互补,提高法律文书信息提取效果,同时系统可拓展性、移植性更强。
-
公开(公告)号:CN119149569B
公开(公告)日:2025-01-28
申请号:CN202411605795.9
申请日:2024-11-12
Applicant: 同方赛威讯信息技术有限公司
Abstract: 本发明公开了一种基于全文检索和大模型的法律监督线索挖掘方法及系统,属于数据采集与数据检索和大模型应用领域,所述方法包括:S1.梳理监督规则和检索关键词;S2.全文检索,利用监督专题梳理的关键词和全文检索系统进行数据检索,从多种数据源收集指定时间段内所有相关的图文数据;S3.信息蒸馏和信息过滤;S4.构建专题分析的知识库;S5.知识库检索与排序;S6.大模型智能分析与线索挖掘。本发明通过设定关键词自动全文检索收集基础数据,再通过大模型的自动要素解析和对话推理分析,便能够从海量的数据中挖掘出有价值的法律监督线索,提高了基于图文电子数据的法律监督线索挖掘效率。
-
公开(公告)号:CN119149569A
公开(公告)日:2024-12-17
申请号:CN202411605795.9
申请日:2024-11-12
Applicant: 同方赛威讯信息技术有限公司
Abstract: 本发明公开了一种基于全文检索和大模型的法律监督线索挖掘方法及系统,属于数据采集与数据检索和大模型应用领域,所述方法包括:S1.梳理监督规则和检索关键词;S2.全文检索,利用监督专题梳理的关键词和全文检索系统进行数据检索,从多种数据源收集指定时间段内所有相关的图文数据;S3.信息蒸馏和信息过滤;S4.构建专题分析的知识库;S5.知识库检索与排序;S6.大模型智能分析与线索挖掘。本发明通过设定关键词自动全文检索收集基础数据,再通过大模型的自动要素解析和对话推理分析,便能够从海量的数据中挖掘出有价值的法律监督线索,提高了基于图文电子数据的法律监督线索挖掘效率。
-
公开(公告)号:CN119003743A
公开(公告)日:2024-11-22
申请号:CN202411473863.0
申请日:2024-10-22
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本发明涉及自然语言处理大模型的数据分析领域,具体是涉及一种基于大模型和检索增强技术的智能查询方法及系统,主要用于使查询系统能够稳定运行并快速响应用户请求,所述方法包括:S1.相似问题检索,在向量知识库中检索用户提出的相似问题和答案;S2.大模型利用检索结果生成SQL;S3.数据验证与展示,对大模型生成的SQL在数据库中执行验证,展示SQL查询结果数据;S4.记录和收集数据,记录用户问题与大模型生成并能正确执行的SQL,存入向量数据库;S5.微调和更新大模型,定期更新发布大模型。本发明使得非专业人员能够从复杂的数据库系统中获取专业数据的问题,同时结合RAG检索增强提高大模型性能,并记录历史数据不断微调训练大模型。
-
-
-
-
-