-
公开(公告)号:CN117290384A
公开(公告)日:2023-12-26
申请号:CN202311587845.0
申请日:2023-11-27
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F16/2453 , G06F16/242 , G06F16/2455 , G06F16/248 , G06F16/28
Abstract: 本发明公开了一种基于大数据与计算机视觉结合的图文检索系统及方法,所述系统包括:数据采集模块,用于获取业务数据、文书数据与卷宗数据;数据检索模块,用于提供数据检索功能;数据源管理模块,用于管理结构化数据源以及非结构化数据源,也支持插件化动态扩展数据源类型;词库管理模块,用于配置数据检索的分词词库,并提供词库隔离功能;ES监控与运维模块,用于提供对ES集群服务的监控面板,以及对ES集群动态扩容与缩容的操作;系统管理模块,用于实现系统的用户权限管理,并提供数据隔离功能;图像识别模块,用于识别文书卷宗中的目标物品,并结合数据检索功能,实现以文搜图的功能。本发明有效提高了案件、文书与卷宗的检索效率。
-
公开(公告)号:CN117290384B
公开(公告)日:2024-02-02
申请号:CN202311587845.0
申请日:2023-11-27
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F16/2453 , G06F16/242 , G06F16/2455 , G06F16/248 , G06F16/28
Abstract: 本发明公开了一种基于大数据与计算机视觉结合的图文检索系统及方法,所述系统包括:数据采集模块,用于获取业务数据、文书数据与卷宗数据;数据检索模块,用于提供数据检索功能;数据源管理模块,用于管理结构化数据源以及非结构化数据源,也支持插件化动态扩展数据源类型;词库管理模块,用于配置数据检索的分词词库,并提供词库隔离功能;ES监控与运维模块,用于提供对ES集群服务的监控面板,以及对ES集群动态扩容与缩容的操作;系统管理模块,用于实现系统的用户权限管理,并提供数据隔离功能;图像识别模块,用于识别文书卷宗中的目(56)对比文件S. S. Badhya 等.Natural Language toStructured Query Language usingElasticsearch for descriptivecolumns.2019 4th International Conferenceon Computational Systems and InformationTechnology for Sustainable Solution(CSITSS).2020,1-5.
-
公开(公告)号:CN111476034B
公开(公告)日:2023-05-12
申请号:CN202010266180.3
申请日:2020-04-07
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F40/295 , G06F40/247 , G06Q50/18
Abstract: 本发明公开了一种基于规则和模型结合的法律文书信息抽取方法,包括:创建词典和文书实体抽取规则,采用基于规则的抽取方法进行法律文书实体抽取;将抽取结果作为初次标注数据进行数据标注操作、训练模型以及发布模型;采用基于规则和模型相结合的抽取方法进行法律文书实体抽取,选取评估结果高的为输出结果;对结果进行评估,如果满足要求则结束;如果不满足要求继续迭代。还公开了一种法律文书信息抽取系统,包括数据采集模块、信息提取模块、数据标注模块、数据集管理模块和评估模块。本发明将规则与模型的方法有效结合、形成互补,提高法律文书信息提取效果,同时系统可拓展性、移植性更强。
-
公开(公告)号:CN111476034A
公开(公告)日:2020-07-31
申请号:CN202010266180.3
申请日:2020-04-07
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F40/295 , G06F40/247 , G06Q50/18
Abstract: 本发明公开了一种基于规则和模型结合的法律文书信息抽取方法,包括:创建词典和文书实体抽取规则,采用基于规则的抽取方法进行法律文书实体抽取;将抽取结果作为初次标注数据进行数据标注操作、训练模型以及发布模型;采用基于规则和模型相结合的抽取方法进行法律文书实体抽取,选取评估结果高的为输出结果;对结果进行评估,如果满足要求则结束;如果不满足要求继续迭代。还公开了一种法律文书信息抽取系统,包括数据采集模块、信息提取模块、数据标注模块、数据集管理模块和评估模块。本发明将规则与模型的方法有效结合、形成互补,提高法律文书信息提取效果,同时系统可拓展性、移植性更强。
-
公开(公告)号:CN117371534A
公开(公告)日:2024-01-09
申请号:CN202311669625.2
申请日:2023-12-07
Applicant: 同方赛威讯信息技术有限公司
IPC: G06N5/025 , G06N5/02 , G06F16/36 , G06F40/284 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于BERT的知识图谱构建方法及系统,所述方法包括以下步骤:S1.从非结构化文本数据中进行实体的定位与抽取,完成实体识别;S2.根据文本内容抽取实体间的关系;S3.定位实体名称及其代词,并把同一实体的指代聚类到一起,将同一实体的多个关系连接到一个实体节点上,完成指代消解;S4.计算实体指称与实体的相似度,将实体指称与知识图谱中的实体对应起来;S5.预测并补全知识图谱中缺失的三元组,并利用得到的三元组构建知识图谱。本发明有助于提高知识图谱的构建质量以及知识图谱的完整度。
-
公开(公告)号:CN117371534B
公开(公告)日:2024-02-27
申请号:CN202311669625.2
申请日:2023-12-07
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F16/36 , G06N5/025 , G06N5/02 , G06F40/284 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于BERT的知识图谱构建方法及系统,所述方法包括以下步骤:S1.从非结构化文本数据中进行实体的定位与抽取,完成实体识别;S2.根据文本内容抽取实体间的关系;S3.定位实体名称及其代词,并把同一实体的指代聚类到一起,将同一实体的多个关系连接到一个实体节点上,完成指代消解;S4.计算实体指称与实体的相似度,将实体指称与知识图谱中的实体对应起来;S5.预测并补全知识图谱中缺失的三元组,并利用得到的三元组构建知识图谱。本发明有助于提高知识图谱的构建质量以及知识图谱的完整度。(56)对比文件陈雨等.基于深度学习和指代消解的中文人名识别《.数据与计算发展前沿》.2022,第4卷(第2期),63-73.Weiwei Hu等.KGNER: Improving ChineseNamed Entity Recognition by BERT Infusedwith the Knowledge Graph《.Appl. Sci.》.2022,第12卷(第15期),1-16.Mayank Kejriwal.amed EntityResolution in Personal Knowledge Graphs.《arXiv:2307.12173v1》.2023,1-22.
-
公开(公告)号:CN117372787A
公开(公告)日:2024-01-09
申请号:CN202311649289.5
申请日:2023-12-05
Applicant: 同方赛威讯信息技术有限公司
IPC: G06V10/764 , G06V10/25 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种图像多类别识别方法及装置,所述方法包括以下步骤:训练目标检测模型及图像相似度模型;确定需要分类的类别并进行相应的配置;获取待分类的图像;通过目标检测识别图像中主要目标的位置及类别;将检测出的主要目标进行截取,对图像进行纠偏并用相似度模型提取图像特征,并与已知分类的特征依次进行对比;对比结果中概率最高的类别与目标检测结果组成最终类别。本发明提供的图像多类别识别方法及装置在有限多的数据量且需要分类的类别很多的情况下,实现较高精度的图像识别。
-
公开(公告)号:CN111476165A
公开(公告)日:2020-07-31
申请号:CN202010266816.4
申请日:2020-04-07
Applicant: 同方赛威讯信息技术有限公司
Abstract: 本发明公开了一种基于深度学习的电子文档中标题印章指纹特征检测方法,包括:对电子文档图片按比例进行手工标注作为训练集,其余作为测试集;搭建并训练集训练Faster-RCNN模型;将测试集输入训练好的Faster-RCNN模型预测目标类别和坐标,对测试集进行自动标注,形成标注数据集;采用标注数据集对Faster-RCNN模型进行迭代训练,导出最终的Faster-RCNN模型的模型参数,输入电子文档图片,得到电子文档中标题印章指纹信息。本发明采用多次修改模型参数和迭代训练的方法,将基于深度学习的目标检测用于传统的案件电子卷宗文档处理领域后,极大方便了文档处理;采用半自动化标注,节约了人力。
-
公开(公告)号:CN117372787B
公开(公告)日:2024-02-20
申请号:CN202311649289.5
申请日:2023-12-05
Applicant: 同方赛威讯信息技术有限公司
IPC: G06V10/764 , G06V10/25 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种图像多类别识别方法及装置,所述方法包括以下步骤:训练目标检测模型及图像相似度模型;确定需要分类的类别并进行相应的配置;获取待分类的图像;通过目标检测识别图像中主要目标的位置及类别;将检测出的主要目标进行截取,对图像进行纠偏并用相似度模型提取图像特征,并与已知分类的特征依次进行对比;对比结果中概率最高的类别与目标检测结果组成最终类别。本发明提供的图像多类别识别方法及装置在有限多的数据量且需要分类的类别很多的情况下,实现较高精度的图像识别。
-
-
-
-
-
-
-
-