-
公开(公告)号:CN116894271B
公开(公告)日:2024-04-26
申请号:CN202310980143.2
申请日:2023-08-04
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种基于匿名化算法的数据共享隐私保护方法,涉及隐私保护技术领域,包括:识别和归并需要进行隐私保护的属性,明确匿名化处理对象;采用MSAK匿名算法第一次聚类将原始数据集划分为多个第一子数据集,分离每个第一子数据集的离群值,形成第二子数据集和第一待分配元组集合;第二次聚类对每个第二子数据集聚类,生成多个由相似元组构成的聚类簇,判断聚类簇的大小和过远元组剪裁,形成第一聚类簇集合、第二聚类簇集合和第二待分配元组集合;在所有聚类簇的基础上进行第三次聚类,将所有待分配元组分配到第一聚类簇集合、第二聚类簇集合中,用聚类中心取代聚类簇内所有元组,生成满足隐私保护模型的等价类,从而实现数据的匿名化。
-
公开(公告)号:CN116894271A
公开(公告)日:2023-10-17
申请号:CN202310980143.2
申请日:2023-08-04
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种基于匿名化算法的数据共享隐私保护方法,涉及隐私保护技术领域,包括:识别和归并需要进行隐私保护的属性,明确匿名化处理对象;采用MSAK匿名算法第一次聚类将原始数据集划分为多个第一子数据集,分离每个第一子数据集的离群值,形成第二子数据集和第一待分配元组集合;第二次聚类对每个第二子数据集聚类,生成多个由相似元组构成的聚类簇,判断聚类簇的大小和过远元组剪裁,形成第一聚类簇集合、第二聚类簇集合和第二待分配元组集合;在所有聚类簇的基础上进行第三次聚类,将所有待分配元组分配到第一聚类簇集合、第二聚类簇集合中,用聚类中心取代聚类簇内所有元组,生成满足隐私保护模型的等价类,从而实现数据的匿名化。
-
公开(公告)号:CN113488127A
公开(公告)日:2021-10-08
申请号:CN202110856219.1
申请日:2021-07-28
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种人口健康数据集敏感度处理方法及系统,包括:获取待评估的人口健康数据集;对所述人口健康数据集的各个特征进行敏感信息识别,获得每一特征对应的敏感特征,所述特征包括元数据特征、数据项特征和数据值特征;对每一所述敏感特征进行分析,获得每一敏感特征对应的分析结果;基于每一敏感特征对应的分析结果进行计算,得到所述人口健康数据集的敏感度综合评估结果;基于所述敏感度综合评估结果,生成所述人口健康数据集的敏感度评估报告。本发明实现了敏感信息发现、识别、分析和处理,并且通过多维度分析满足了人口健康数据集敏感度评估的应用需求,以及提升了后续人口健康数据应用的效率和安全性。
-
公开(公告)号:CN110704639A
公开(公告)日:2020-01-17
申请号:CN201910942205.4
申请日:2019-09-30
Applicant: 中国医学科学院医学信息研究所
IPC: G06F16/36
Abstract: 本发明提供了一种缩略语文档的生成方法及装置,在不同知识组织系统互操作过程中,提取不同来源词表中的术语并对其进行同义归并形成概念,生成集成词表,术语包括全称和缩略语多种形式;基于缩略语构词规则,识别集成词表中含有缩略语的目标概念;提取目标概念的全部术语及每个术语的属性,并确定每个术语的术语类型;基于ISO25964国际标准,对目标概念及目标概念的全部术语进行规范化知识表示,生成语义丰富且标准规范的缩略语文档。其中,缩略语及其所在概念继承了来源词表和集成词表的丰富语义属性信息,减少了缩略语歧义问题。
-
公开(公告)号:CN102129527A
公开(公告)日:2011-07-20
申请号:CN201110099016.9
申请日:2011-04-20
Applicant: 中国医学科学院医学信息研究所
IPC: G06F19/00
Abstract: 本发明涉及一种传染病信息知识服务系统,包括:用于存放传染病相关信息知识的资源库,该资源库具有预先定义的规范的结构;用于对传染病领域的信息资源进行采集,加工成资源库所需结构,并存储到资源库中的资源获取模块;使用传染病领域相关概念对资源库中的信息进行知识标引的信息自动处理模块;针对传染病领域具体应用的应用模块。本发明基于传染病领域的数据特点和用户需求,提供了一种使用该领域的概念和关系对信息资源进行知识标引的知识服务系统,该系统集信息收集、分析、加工、整理、共享等多功能于一体,能够有效地组织该领域的信息资源,并为用户提供智能化的检索与分析服务。
-
公开(公告)号:CN113488127B
公开(公告)日:2023-10-20
申请号:CN202110856219.1
申请日:2021-07-28
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种人口健康数据集敏感度处理方法及系统,包括:获取待评估的人口健康数据集;对所述人口健康数据集的各个特征进行敏感信息识别,获得每一特征对应的敏感特征,所述特征包括元数据特征、数据项特征和数据值特征;对每一所述敏感特征进行分析,获得每一敏感特征对应的分析结果;基于每一敏感特征对应的分析结果进行计算,得到所述人口健康数据集的敏感度综合评估结果;基于所述敏感度综合评估结果,生成所述人口健康数据集的敏感度评估报告。本发明实现了敏感信息发现、识别、分析和处理,并且通过多维度分析满足了人口健康数据集敏感度评估的应用需求,以及提升了后续人口健康数据应用的效率和安全性。
-
公开(公告)号:CN113488180B
公开(公告)日:2023-07-18
申请号:CN202110857537.X
申请日:2021-07-28
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种临床指南知识建模方法及系统,包括:获取临床指南数据集;对临床指南数据集进行文本解析,并生成文档层信息;基于文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并生成模块层信息;对模块层信息中的模块内容进行知识化处理,获得知识层信息,知识层信息表征临床指南的知识图谱信息;构建文档层信息、模块层信息和知识层信息之间的关联关系,生成关联关系库,并对关联关系库进行可视化展示,得到跨层多维关联模型。实现了对不同版本的临床指南进行规范和整合,便于对指南信息的关联关系和内容逐层展示,满足了对临床指南知识的应用需求,提升了临床指南知识建模的实用性。
-
公开(公告)号:CN111813798B
公开(公告)日:2023-06-23
申请号:CN202010661422.9
申请日:2020-07-10
Applicant: 中国医学科学院医学信息研究所
IPC: G06F16/242 , G06F16/2453 , G06F16/28
Abstract: 本发明提供一种基于R2RML标准的映射方法、装置、设备及存储介质,确定用户创建的基于R2RML标准的关系数据库到资源描述框架映射任务,连接映射任务指示的关系数据库;对关系数据库进行显性结构特征、数据特点和隐性语义分析得到关系数据库的关联关系表;确定用户从预先设置的至少一种映射模式中选取的目标映射模式;利用目标映射模式和关联关系表进行RDF三元组定义,并基于R2RML映射规则自动生成R2RML映射文档,进而根据R2RML映射文档生成RDF三元组文件。本发明能够自动生成R2RML映射文档,实现RDF三元组文件的自动生成。
-
公开(公告)号:CN102136152A
公开(公告)日:2011-07-27
申请号:CN201110099030.9
申请日:2011-04-20
Applicant: 中国医学科学院医学信息研究所
IPC: G06T11/00
Abstract: 本发明涉及一种网状关系图形的动态可视化显示方法,包括以下步骤:一、将所有节点模拟成带同种电荷的质点;二、将节点间的关系模拟成弹簧;三、设定各个节点的初始位置和显示速度,之后根据每个节点所受到的静电斥力和弹簧拉力,计算出下一帧时刻该节点的位置并显示。本发明将网状关系模拟为由带电荷质点和弹簧组成的真实物理系统,从而提供了一种生动、有趣、能够吸引用户眼球的表现方式来表示网状关系图形,也使网状关系的表示更加灵活。
-
公开(公告)号:CN119226516A
公开(公告)日:2024-12-31
申请号:CN202411354562.6
申请日:2024-09-26
Applicant: 中国医学科学院医学信息研究所
IPC: G06F16/35 , G06F18/2431 , G06F18/241
Abstract: 本申请实施例提供了一种论文数据可用性分类方法、装置、设备及存储介质。在执行所述方法时,先获取待分类论文文本,并对待分类论文文本进行前期的数据处理,提取到论文数据可用性声明文本;然后,将论文数据可用性声明文本输入数据可用性分类模型;通过数据可用性分类模型对论文数据可用性声明文本进行预处理得到向量序列,并对向量序列进行卷积操作得到文本特征,进而根据文本特征映射到预设分类合集中,输出该待分类论文文本中数据可用性的分类结果,实现了对论文中的数据可用性进行分类,为后续根据数据可用性分类构建数据库提供基础。
-
-
-
-
-
-
-
-
-