-
公开(公告)号:CN118349690A
公开(公告)日:2024-07-16
申请号:CN202410421863.X
申请日:2024-04-09
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/38 , G06F16/332 , G06F16/33 , G06F16/335 , G06F16/338 , G06N20/00
Abstract: 本发明公开一种基于大模型的数据资源元数据语义检索方法及系统,属于语义关联技术领域。所述方法包括:向量化数据资源的元数据,以构建向量数据库;抽取用户问句中的查询条件;对查询条件中的搜索词进行语义扩展,得到关键词元素;根据用户问句和关键词元素,获取向量检索过滤条件,并使用所述向量检索过滤条件检索向量数据库,得到该用户问句的答案。本发明可以弥补传统RDF检索缺乏语义以及无法有效地将复杂的RDF检索结果给到大模型的不足。本发明可以支持数据中心不同领域的元数据检索,借助于大模型的上下文理解能力、语言组织能力和语义扩展,提升数据资源元数据语义检索能力,增强检索结果的准确性和用户体验。
-
公开(公告)号:CN111259006B
公开(公告)日:2023-06-27
申请号:CN202010020974.1
申请日:2020-01-09
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明涉及一种通用的分布式异构数据一体化物理汇聚、组织、发布与服务方法及系统。该方法包括:1)在中心端对公共基础数据进行注册;2)分布端向中心端进行分布式异构数据的汇聚传输与同步;3)在中心端对汇聚的数据资源进行建库组织与编辑;4)在中心端对数据资源进行统一发布与审核;5)在中心端进行数据资源的集成共享服务。本发明实现了分布式异构实体数据的高效汇聚传输与同步,实现了数据资源的集中建库、组织管理与统一发布,在数据资源门户实现了多种形式的数据发布服务集成与共享,具有一体化,通用可定制特点,保证了数据汇聚、管理、发布与服务过程的整体连通、高可定制和高可复用,大大提升了数据服务封装的通用性和灵活性。
-
公开(公告)号:CN109344306B
公开(公告)日:2021-12-10
申请号:CN201810841547.2
申请日:2018-07-27
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/907
Abstract: 本发明涉及一种领域多标准元数据定制化在线汇交与服务方法及系统。该方法包括:1)建立多标准元数据定制化汇交模板,通过对领域核心元数据标准的继承、覆盖修改和扩展新增的模式实现模板的定制化设置;2)对所述多标准元数据定制化汇交模板进行解析,并根据解析结果动态生成在线元数据汇交录入及管理功能页面;3)根据生成的在线元数据汇交录入及管理功能页面,进行多标准元数据的在线汇交录入与校验;4)对汇交的多标准元数据进行存储管理,并提供全局统一的各类元数据发现服务。本发明在保持多个元数据标准间相同元数据项语义通用性和一致性的同时,实现了多标准元数据的精细化和专业化管理,极大增强了领域资源服务的效果和质量。
-
公开(公告)号:CN107463603A
公开(公告)日:2017-12-12
申请号:CN201710454837.7
申请日:2017-06-16
Applicant: 中国科学院计算机网络信息中心
IPC: G06F17/30
Abstract: 本发明涉及一种基于量化DMP的科研项目生命周期数据管理定制化控制方法和系统。该方法首先建立科研项目生命周期数据管理的模型和规范,然后基于建立的模型和规范对数据管理计划DMP的内容进行量化;根据量化DMP元数据规范并结合功能控制需求,分类归纳科研项目生命周期数据管理的规约控制功能点及其触发条件;根据触发条件触发相应的规约控制功能点,进而将规约控制需求提交给数据管理规约控制引擎进行集中处理,经过规约控制逻辑判定完成相应功能的控制实现。本发明实现了数据管理系统规约控制功能与量化DMP元数据要素设置的解耦,大力提升了面向科研项目生命周期数据管理系统设计开发的效率,增强了系统的高可定制性和高复用性。
-
公开(公告)号:CN118364073A
公开(公告)日:2024-07-19
申请号:CN202410421861.0
申请日:2024-04-09
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06N20/00 , G06F16/9032 , G06F16/903
Abstract: 本发明公开一种基于大模型的分布式RDF数据语义检索方法及系统,属于语义关联技术领域。所述方法包括:基于大语言模型,从用户问句中提取实体关键词组;在RDF数据资源的基础上构建一向量数据库,并通过用户问句与该向量数据库中向量数据的相似度匹配,得到大模型的第一外部知识文本;通过SPARQL的联邦查询得到与实体关键词组相关的RDF数据信息,并对该RDF数据信息进行扩展,得到大模型的第二外部知识文本;对用户问句、第一外部知识文本和第二外部知识文本进行整合,并将整合结果提交到大模型,以得到用户问句的答案。本发明可以弥补传统RDF检索缺乏语义以及无法有效地将复杂的RDF检索结果给到大模型的不足。
-
公开(公告)号:CN118035190A
公开(公告)日:2024-05-14
申请号:CN202410036687.8
申请日:2024-01-10
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/176 , G06F8/30 , G06F9/445 , G06F21/62 , G06F11/34
Abstract: 本发明公开一种科学数据内容级细粒度可控供给方法及系统,该方法包括:构建科学数据解析器的热加载运行环境;建设科学数据解析器资源池,所述科学数据解析器资源池中的科学数据解析器包括:为所有数据文件提供的默认数据解析器、为常见数据格式的数据文件提供的通用格式数据文件解析器和为特定领域数据文件提供的领域专用数据解析器;建立每一数据文件和科学数据解析器的对应关系,并在所述科学数据解析器资源池更新时,对所述对应关系进行更新;基于所述对应关系组装所述数据文件和所述科学数据解析器,以实现数据文件的线上内容级供给服务。本发明实现了数据利用的安全可控、可用不可见以及可计量可评价。
-
公开(公告)号:CN116090469A
公开(公告)日:2023-05-09
申请号:CN202310055777.7
申请日:2023-01-18
Applicant: 中国科学院计算机网络信息中心
IPC: G06F40/30 , G06F40/295 , G06F18/25
Abstract: 本发明涉及一种长文本科学数据标准化语义关联发布方法和系统。该方法首先对长文本科学数据进行知识抽取,获取其中的语义信息;对获取的语义信息进行数据语义标准化,并构建RDF三元组;将构建的RDF三元组进行数据关联发布。本发明面向长文本科学数据,采用一体化流程,可以直接将长文本以Linked Data形式发布,提升长文本科学数据的语义能力和关联能力;对长文本提取出的语义信息进行标准化语义描述,使长文本科学数据能够被Web所理解,利于与其他Linked Data开放数据进行关联融合,使得长文本中描述的科学数据资源更容易在Web中被探索和发现。
-
公开(公告)号:CN111444694B
公开(公告)日:2023-03-28
申请号:CN202010139717.X
申请日:2020-03-03
Applicant: 中国科学院计算机网络信息中心
IPC: G06F40/186 , G06F40/18 , G06F40/174 , G06F40/253 , G06F16/907 , G06F16/901
Abstract: 本发明公开了一种通用的信息资源定制化汇交、发布方法,其步骤包括:1)进行基础运行数据注册与用户角色分发授权;根据基础运行数据中的汇交管理组织结构的层次关系生成一树状结构树;树状结构树中的每一一级节点设置一审核员,完成审核员与一级节点的映射绑定;树状结构树中的每一叶子节点设置一注册员,叶子节点的注册员通过其上一级节点或对应的一级节点的审核员进行分配和授权,完成注册员与对应叶子节点的映射绑定;2)对注册员提交的信息资源结构元数据进行校验;校验通过后提交发送给上级审核员进行审核;3)信息资源审核发布管理;审核员和系统管理员对提交的信息进行两级审核,并对审核通过的信息资源进行公开发布。
-
公开(公告)号:CN107463603B
公开(公告)日:2021-01-12
申请号:CN201710454837.7
申请日:2017-06-16
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明涉及一种基于量化DMP的科研项目生命周期数据管理定制化控制方法和系统。该方法首先建立科研项目生命周期数据管理的模型和规范,然后基于建立的模型和规范对数据管理计划DMP的内容进行量化;根据量化DMP元数据规范并结合功能控制需求,分类归纳科研项目生命周期数据管理的规约控制功能点及其触发条件;根据触发条件触发相应的规约控制功能点,进而将规约控制需求提交给数据管理规约控制引擎进行集中处理,经过规约控制逻辑判定完成相应功能的控制实现。本发明实现了数据管理系统规约控制功能与量化DMP元数据要素设置的解耦,大力提升了面向科研项目生命周期数据管理系统设计开发的效率,增强了系统的高可定制性和高复用性。
-
公开(公告)号:CN111274294A
公开(公告)日:2020-06-12
申请号:CN202010021145.5
申请日:2020-01-09
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/25 , G06F16/28 , G06F16/955
Abstract: 本发明涉及一种通用的分布式异构数据一体化逻辑汇聚组织、发布与服务方法及系统。该方法包括:1)在中心端对公共基础数据进行注册,包括分布端的数据节点注册、元数据扩展要素注册、分类体系注册、许可协议注册;2)在分布端进行分布式异构数据的建库、管理与描述;3)在分布端进行分布式异构数据的统一封装与发布组织;4)在中心端进行数据资源集中发布审核与监控;5)在中心端进行数据资源的集成共享服务。本发明具有一体化、通用可定制特点,保证了数据组织、管理、封装、发布、审核与服务全流程的整体连通、高可定制和高可复用,大大提升了数据服务封装的通用性和灵活性。
-
-
-
-
-
-
-
-
-