一种基于BERT的知识图谱构建方法及系统

    公开(公告)号:CN117371534B

    公开(公告)日:2024-02-27

    申请号:CN202311669625.2

    申请日:2023-12-07

    Abstract: 本发明公开了一种基于BERT的知识图谱构建方法及系统,所述方法包括以下步骤:S1.从非结构化文本数据中进行实体的定位与抽取,完成实体识别;S2.根据文本内容抽取实体间的关系;S3.定位实体名称及其代词,并把同一实体的指代聚类到一起,将同一实体的多个关系连接到一个实体节点上,完成指代消解;S4.计算实体指称与实体的相似度,将实体指称与知识图谱中的实体对应起来;S5.预测并补全知识图谱中缺失的三元组,并利用得到的三元组构建知识图谱。本发明有助于提高知识图谱的构建质量以及知识图谱的完整度。(56)对比文件陈雨等.基于深度学习和指代消解的中文人名识别《.数据与计算发展前沿》.2022,第4卷(第2期),63-73.Weiwei Hu等.KGNER: Improving ChineseNamed Entity Recognition by BERT Infusedwith the Knowledge Graph《.Appl. Sci.》.2022,第12卷(第15期),1-16.Mayank Kejriwal.amed EntityResolution in Personal Knowledge Graphs.《arXiv:2307.12173v1》.2023,1-22.

    一种图像处理方法、系统、设备及介质

    公开(公告)号:CN118864302A

    公开(公告)日:2024-10-29

    申请号:CN202411346844.1

    申请日:2024-09-26

    Abstract: 本申请公开了一种图像处理方法、系统、设备及介质,涉及图像处理的技术领域,所述方法包括:获取原始扫描图像,并对所述原始扫描图像进行二值化处理,得到对应的二值图像;对所述二值图像进行图像闭运算,得到对应的原始掩码;根据预先生成的语义分割模型对所述原始扫描图像进行污点识别,得到对应的污点掩码;根据所述原始掩码确定所述原始掩码中的文本区域,生成对应的文本掩码;根据所述污点掩码和文本掩码确定清除区域,生成对应的背景掩码;根据所述背景掩码对所述二值图像或所述原始扫描图像中的污点进行清除,得到对应的去污点图像。本申请具有提高去除污点的效率的效果。

    一种基于大数据与计算机视觉结合的图文检索系统及方法

    公开(公告)号:CN117290384B

    公开(公告)日:2024-02-02

    申请号:CN202311587845.0

    申请日:2023-11-27

    Abstract: 本发明公开了一种基于大数据与计算机视觉结合的图文检索系统及方法,所述系统包括:数据采集模块,用于获取业务数据、文书数据与卷宗数据;数据检索模块,用于提供数据检索功能;数据源管理模块,用于管理结构化数据源以及非结构化数据源,也支持插件化动态扩展数据源类型;词库管理模块,用于配置数据检索的分词词库,并提供词库隔离功能;ES监控与运维模块,用于提供对ES集群服务的监控面板,以及对ES集群动态扩容与缩容的操作;系统管理模块,用于实现系统的用户权限管理,并提供数据隔离功能;图像识别模块,用于识别文书卷宗中的目(56)对比文件S. S. Badhya 等.Natural Language toStructured Query Language usingElasticsearch for descriptivecolumns.2019 4th International Conferenceon Computational Systems and InformationTechnology for Sustainable Solution(CSITSS).2020,1-5.

    一种图像处理方法、系统、设备及介质

    公开(公告)号:CN118864302B

    公开(公告)日:2025-01-07

    申请号:CN202411346844.1

    申请日:2024-09-26

    Abstract: 本申请公开了一种图像处理方法、系统、设备及介质,涉及图像处理的技术领域,所述方法包括:获取原始扫描图像,并对所述原始扫描图像进行二值化处理,得到对应的二值图像;对所述二值图像进行图像闭运算,得到对应的原始掩码;根据预先生成的语义分割模型对所述原始扫描图像进行污点识别,得到对应的污点掩码;根据所述原始掩码确定所述原始掩码中的文本区域,生成对应的文本掩码;根据所述污点掩码和文本掩码确定清除区域,生成对应的背景掩码;根据所述背景掩码对所述二值图像或所述原始扫描图像中的污点进行清除,得到对应的去污点图像。本申请具有提高去除污点的效率的效果。

    一种基于大模型和检索增强技术的智能查询方法及系统

    公开(公告)号:CN119003743A

    公开(公告)日:2024-11-22

    申请号:CN202411473863.0

    申请日:2024-10-22

    Abstract: 本发明涉及自然语言处理大模型的数据分析领域,具体是涉及一种基于大模型和检索增强技术的智能查询方法及系统,主要用于使查询系统能够稳定运行并快速响应用户请求,所述方法包括:S1.相似问题检索,在向量知识库中检索用户提出的相似问题和答案;S2.大模型利用检索结果生成SQL;S3.数据验证与展示,对大模型生成的SQL在数据库中执行验证,展示SQL查询结果数据;S4.记录和收集数据,记录用户问题与大模型生成并能正确执行的SQL,存入向量数据库;S5.微调和更新大模型,定期更新发布大模型。本发明使得非专业人员能够从复杂的数据库系统中获取专业数据的问题,同时结合RAG检索增强提高大模型性能,并记录历史数据不断微调训练大模型。

Patent Agency Ranking