-
公开(公告)号:CN117371534A
公开(公告)日:2024-01-09
申请号:CN202311669625.2
申请日:2023-12-07
Applicant: 同方赛威讯信息技术有限公司
IPC: G06N5/025 , G06N5/02 , G06F16/36 , G06F40/284 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于BERT的知识图谱构建方法及系统,所述方法包括以下步骤:S1.从非结构化文本数据中进行实体的定位与抽取,完成实体识别;S2.根据文本内容抽取实体间的关系;S3.定位实体名称及其代词,并把同一实体的指代聚类到一起,将同一实体的多个关系连接到一个实体节点上,完成指代消解;S4.计算实体指称与实体的相似度,将实体指称与知识图谱中的实体对应起来;S5.预测并补全知识图谱中缺失的三元组,并利用得到的三元组构建知识图谱。本发明有助于提高知识图谱的构建质量以及知识图谱的完整度。
-
公开(公告)号:CN117371534B
公开(公告)日:2024-02-27
申请号:CN202311669625.2
申请日:2023-12-07
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F16/36 , G06N5/025 , G06N5/02 , G06F40/284 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于BERT的知识图谱构建方法及系统,所述方法包括以下步骤:S1.从非结构化文本数据中进行实体的定位与抽取,完成实体识别;S2.根据文本内容抽取实体间的关系;S3.定位实体名称及其代词,并把同一实体的指代聚类到一起,将同一实体的多个关系连接到一个实体节点上,完成指代消解;S4.计算实体指称与实体的相似度,将实体指称与知识图谱中的实体对应起来;S5.预测并补全知识图谱中缺失的三元组,并利用得到的三元组构建知识图谱。本发明有助于提高知识图谱的构建质量以及知识图谱的完整度。(56)对比文件陈雨等.基于深度学习和指代消解的中文人名识别《.数据与计算发展前沿》.2022,第4卷(第2期),63-73.Weiwei Hu等.KGNER: Improving ChineseNamed Entity Recognition by BERT Infusedwith the Knowledge Graph《.Appl. Sci.》.2022,第12卷(第15期),1-16.Mayank Kejriwal.amed EntityResolution in Personal Knowledge Graphs.《arXiv:2307.12173v1》.2023,1-22.
-
公开(公告)号:CN117372787A
公开(公告)日:2024-01-09
申请号:CN202311649289.5
申请日:2023-12-05
Applicant: 同方赛威讯信息技术有限公司
IPC: G06V10/764 , G06V10/25 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种图像多类别识别方法及装置,所述方法包括以下步骤:训练目标检测模型及图像相似度模型;确定需要分类的类别并进行相应的配置;获取待分类的图像;通过目标检测识别图像中主要目标的位置及类别;将检测出的主要目标进行截取,对图像进行纠偏并用相似度模型提取图像特征,并与已知分类的特征依次进行对比;对比结果中概率最高的类别与目标检测结果组成最终类别。本发明提供的图像多类别识别方法及装置在有限多的数据量且需要分类的类别很多的情况下,实现较高精度的图像识别。
-
公开(公告)号:CN118864302A
公开(公告)日:2024-10-29
申请号:CN202411346844.1
申请日:2024-09-26
Applicant: 同方赛威讯信息技术有限公司
Abstract: 本申请公开了一种图像处理方法、系统、设备及介质,涉及图像处理的技术领域,所述方法包括:获取原始扫描图像,并对所述原始扫描图像进行二值化处理,得到对应的二值图像;对所述二值图像进行图像闭运算,得到对应的原始掩码;根据预先生成的语义分割模型对所述原始扫描图像进行污点识别,得到对应的污点掩码;根据所述原始掩码确定所述原始掩码中的文本区域,生成对应的文本掩码;根据所述污点掩码和文本掩码确定清除区域,生成对应的背景掩码;根据所述背景掩码对所述二值图像或所述原始扫描图像中的污点进行清除,得到对应的去污点图像。本申请具有提高去除污点的效率的效果。
-
公开(公告)号:CN117290384B
公开(公告)日:2024-02-02
申请号:CN202311587845.0
申请日:2023-11-27
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F16/2453 , G06F16/242 , G06F16/2455 , G06F16/248 , G06F16/28
Abstract: 本发明公开了一种基于大数据与计算机视觉结合的图文检索系统及方法,所述系统包括:数据采集模块,用于获取业务数据、文书数据与卷宗数据;数据检索模块,用于提供数据检索功能;数据源管理模块,用于管理结构化数据源以及非结构化数据源,也支持插件化动态扩展数据源类型;词库管理模块,用于配置数据检索的分词词库,并提供词库隔离功能;ES监控与运维模块,用于提供对ES集群服务的监控面板,以及对ES集群动态扩容与缩容的操作;系统管理模块,用于实现系统的用户权限管理,并提供数据隔离功能;图像识别模块,用于识别文书卷宗中的目(56)对比文件S. S. Badhya 等.Natural Language toStructured Query Language usingElasticsearch for descriptivecolumns.2019 4th International Conferenceon Computational Systems and InformationTechnology for Sustainable Solution(CSITSS).2020,1-5.
-
公开(公告)号:CN118864302B
公开(公告)日:2025-01-07
申请号:CN202411346844.1
申请日:2024-09-26
Applicant: 同方赛威讯信息技术有限公司
Abstract: 本申请公开了一种图像处理方法、系统、设备及介质,涉及图像处理的技术领域,所述方法包括:获取原始扫描图像,并对所述原始扫描图像进行二值化处理,得到对应的二值图像;对所述二值图像进行图像闭运算,得到对应的原始掩码;根据预先生成的语义分割模型对所述原始扫描图像进行污点识别,得到对应的污点掩码;根据所述原始掩码确定所述原始掩码中的文本区域,生成对应的文本掩码;根据所述污点掩码和文本掩码确定清除区域,生成对应的背景掩码;根据所述背景掩码对所述二值图像或所述原始扫描图像中的污点进行清除,得到对应的去污点图像。本申请具有提高去除污点的效率的效果。
-
公开(公告)号:CN117372787B
公开(公告)日:2024-02-20
申请号:CN202311649289.5
申请日:2023-12-05
Applicant: 同方赛威讯信息技术有限公司
IPC: G06V10/764 , G06V10/25 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种图像多类别识别方法及装置,所述方法包括以下步骤:训练目标检测模型及图像相似度模型;确定需要分类的类别并进行相应的配置;获取待分类的图像;通过目标检测识别图像中主要目标的位置及类别;将检测出的主要目标进行截取,对图像进行纠偏并用相似度模型提取图像特征,并与已知分类的特征依次进行对比;对比结果中概率最高的类别与目标检测结果组成最终类别。本发明提供的图像多类别识别方法及装置在有限多的数据量且需要分类的类别很多的情况下,实现较高精度的图像识别。
-
公开(公告)号:CN119149569B
公开(公告)日:2025-01-28
申请号:CN202411605795.9
申请日:2024-11-12
Applicant: 同方赛威讯信息技术有限公司
Abstract: 本发明公开了一种基于全文检索和大模型的法律监督线索挖掘方法及系统,属于数据采集与数据检索和大模型应用领域,所述方法包括:S1.梳理监督规则和检索关键词;S2.全文检索,利用监督专题梳理的关键词和全文检索系统进行数据检索,从多种数据源收集指定时间段内所有相关的图文数据;S3.信息蒸馏和信息过滤;S4.构建专题分析的知识库;S5.知识库检索与排序;S6.大模型智能分析与线索挖掘。本发明通过设定关键词自动全文检索收集基础数据,再通过大模型的自动要素解析和对话推理分析,便能够从海量的数据中挖掘出有价值的法律监督线索,提高了基于图文电子数据的法律监督线索挖掘效率。
-
公开(公告)号:CN119149569A
公开(公告)日:2024-12-17
申请号:CN202411605795.9
申请日:2024-11-12
Applicant: 同方赛威讯信息技术有限公司
Abstract: 本发明公开了一种基于全文检索和大模型的法律监督线索挖掘方法及系统,属于数据采集与数据检索和大模型应用领域,所述方法包括:S1.梳理监督规则和检索关键词;S2.全文检索,利用监督专题梳理的关键词和全文检索系统进行数据检索,从多种数据源收集指定时间段内所有相关的图文数据;S3.信息蒸馏和信息过滤;S4.构建专题分析的知识库;S5.知识库检索与排序;S6.大模型智能分析与线索挖掘。本发明通过设定关键词自动全文检索收集基础数据,再通过大模型的自动要素解析和对话推理分析,便能够从海量的数据中挖掘出有价值的法律监督线索,提高了基于图文电子数据的法律监督线索挖掘效率。
-
公开(公告)号:CN119003743A
公开(公告)日:2024-11-22
申请号:CN202411473863.0
申请日:2024-10-22
Applicant: 同方赛威讯信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本发明涉及自然语言处理大模型的数据分析领域,具体是涉及一种基于大模型和检索增强技术的智能查询方法及系统,主要用于使查询系统能够稳定运行并快速响应用户请求,所述方法包括:S1.相似问题检索,在向量知识库中检索用户提出的相似问题和答案;S2.大模型利用检索结果生成SQL;S3.数据验证与展示,对大模型生成的SQL在数据库中执行验证,展示SQL查询结果数据;S4.记录和收集数据,记录用户问题与大模型生成并能正确执行的SQL,存入向量数据库;S5.微调和更新大模型,定期更新发布大模型。本发明使得非专业人员能够从复杂的数据库系统中获取专业数据的问题,同时结合RAG检索增强提高大模型性能,并记录历史数据不断微调训练大模型。
-
-
-
-
-
-
-
-
-