-
公开(公告)号:CN113488127B
公开(公告)日:2023-10-20
申请号:CN202110856219.1
申请日:2021-07-28
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种人口健康数据集敏感度处理方法及系统,包括:获取待评估的人口健康数据集;对所述人口健康数据集的各个特征进行敏感信息识别,获得每一特征对应的敏感特征,所述特征包括元数据特征、数据项特征和数据值特征;对每一所述敏感特征进行分析,获得每一敏感特征对应的分析结果;基于每一敏感特征对应的分析结果进行计算,得到所述人口健康数据集的敏感度综合评估结果;基于所述敏感度综合评估结果,生成所述人口健康数据集的敏感度评估报告。本发明实现了敏感信息发现、识别、分析和处理,并且通过多维度分析满足了人口健康数据集敏感度评估的应用需求,以及提升了后续人口健康数据应用的效率和安全性。
-
公开(公告)号:CN113488180B
公开(公告)日:2023-07-18
申请号:CN202110857537.X
申请日:2021-07-28
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种临床指南知识建模方法及系统,包括:获取临床指南数据集;对临床指南数据集进行文本解析,并生成文档层信息;基于文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并生成模块层信息;对模块层信息中的模块内容进行知识化处理,获得知识层信息,知识层信息表征临床指南的知识图谱信息;构建文档层信息、模块层信息和知识层信息之间的关联关系,生成关联关系库,并对关联关系库进行可视化展示,得到跨层多维关联模型。实现了对不同版本的临床指南进行规范和整合,便于对指南信息的关联关系和内容逐层展示,满足了对临床指南知识的应用需求,提升了临床指南知识建模的实用性。
-
公开(公告)号:CN111813798B
公开(公告)日:2023-06-23
申请号:CN202010661422.9
申请日:2020-07-10
Applicant: 中国医学科学院医学信息研究所
IPC: G06F16/242 , G06F16/2453 , G06F16/28
Abstract: 本发明提供一种基于R2RML标准的映射方法、装置、设备及存储介质,确定用户创建的基于R2RML标准的关系数据库到资源描述框架映射任务,连接映射任务指示的关系数据库;对关系数据库进行显性结构特征、数据特点和隐性语义分析得到关系数据库的关联关系表;确定用户从预先设置的至少一种映射模式中选取的目标映射模式;利用目标映射模式和关联关系表进行RDF三元组定义,并基于R2RML映射规则自动生成R2RML映射文档,进而根据R2RML映射文档生成RDF三元组文件。本发明能够自动生成R2RML映射文档,实现RDF三元组文件的自动生成。
-
公开(公告)号:CN116130084A
公开(公告)日:2023-05-16
申请号:CN202211596200.9
申请日:2022-12-12
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明涉及一种老年肺癌发病高危人群干预效果预测方法,属于生物医学信息处理技术领域。首先,通过整合人体健康调查类数据和环境气象类数据两方面资源,按性别、年龄开展数据预处理,识别出肺癌发病的高危人群,以确定干预对象。然后,基于深度强化学习的深度Q网络算法构建肺癌发病高危人群的干预效果预测模型,并优化干预策略,形成干预对象、干预策略和干预效果的协同。本方法计算准确率高、计算速度快,可作为大规模数据的高速计算使用,同时,具有定量化预测、定性和定量相结合、准确率高的优点,且操作简单,可以更好地帮助医生进行干预效果的预判。
-
公开(公告)号:CN119415245A
公开(公告)日:2025-02-11
申请号:CN202411388540.1
申请日:2024-09-30
Applicant: 中国医学科学院医学信息研究所
IPC: G06F9/50
Abstract: 本发明公开了一种基于动态权重计算的GPU资源调度方法及系统,涉及算法服务技术领域,包括:根据算法初始权重和分析任务设计的算法流程对算法进行预运行;获取算法算力资源数据,并对算法算力资源进行预评估;根据算法算力资源数据、预评估的算法算力资源以及算法任务解析,设置执行算法流程的优先级顺序和动态权重,计算算法算力资源并生成动态调度方案;对算法算力资源进行验证和调整;加载全量数据运行算法,执行算法流程,并监测算法流程的执行过程。本发明可有效解决在服务器、GPU有限的情况下,满足尽可能更多的用户执行分析任务,而不出现排队等待或因资源竞争导致任务失败的情况,确保算法平台高效稳定运行。
-
公开(公告)号:CN118394954B
公开(公告)日:2024-10-22
申请号:CN202410595015.0
申请日:2024-05-14
Applicant: 中国医学科学院医学信息研究所
IPC: G06F16/36 , G06F16/35 , G16H50/70 , G06F40/284 , G06F40/30 , G06F40/247 , G06F18/22
Abstract: 本发明公开了一种生物医学数据集标准数据元的知识图谱构建方法及系统,涉及医学数据处理技术领域,收集不同类型的生物医学数据集数据元的相关标准文本和生物医学数据集相关标准的数据;并进行分析和归纳;构建生物医学数据集标准数据元知识图谱的知识模型;从结构化数据和结构化数据中的非结构化文本抽取实体类型数据及属性数据;根据建立的实体类型之间的语义关联关系类型,进行多类数据的知识融合,得到生物医学数据集标准数据元知识图谱。本发明不仅增强领域数据集元数据和数据元、分类、值域标准的可用性和利用率,而且还实现数据元的统一和数据集创建的规范性以及提高机器可读性和语义互操作性。
-
公开(公告)号:CN116894271B
公开(公告)日:2024-04-26
申请号:CN202310980143.2
申请日:2023-08-04
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种基于匿名化算法的数据共享隐私保护方法,涉及隐私保护技术领域,包括:识别和归并需要进行隐私保护的属性,明确匿名化处理对象;采用MSAK匿名算法第一次聚类将原始数据集划分为多个第一子数据集,分离每个第一子数据集的离群值,形成第二子数据集和第一待分配元组集合;第二次聚类对每个第二子数据集聚类,生成多个由相似元组构成的聚类簇,判断聚类簇的大小和过远元组剪裁,形成第一聚类簇集合、第二聚类簇集合和第二待分配元组集合;在所有聚类簇的基础上进行第三次聚类,将所有待分配元组分配到第一聚类簇集合、第二聚类簇集合中,用聚类中心取代聚类簇内所有元组,生成满足隐私保护模型的等价类,从而实现数据的匿名化。
-
公开(公告)号:CN116894271A
公开(公告)日:2023-10-17
申请号:CN202310980143.2
申请日:2023-08-04
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种基于匿名化算法的数据共享隐私保护方法,涉及隐私保护技术领域,包括:识别和归并需要进行隐私保护的属性,明确匿名化处理对象;采用MSAK匿名算法第一次聚类将原始数据集划分为多个第一子数据集,分离每个第一子数据集的离群值,形成第二子数据集和第一待分配元组集合;第二次聚类对每个第二子数据集聚类,生成多个由相似元组构成的聚类簇,判断聚类簇的大小和过远元组剪裁,形成第一聚类簇集合、第二聚类簇集合和第二待分配元组集合;在所有聚类簇的基础上进行第三次聚类,将所有待分配元组分配到第一聚类簇集合、第二聚类簇集合中,用聚类中心取代聚类簇内所有元组,生成满足隐私保护模型的等价类,从而实现数据的匿名化。
-
公开(公告)号:CN113488127A
公开(公告)日:2021-10-08
申请号:CN202110856219.1
申请日:2021-07-28
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种人口健康数据集敏感度处理方法及系统,包括:获取待评估的人口健康数据集;对所述人口健康数据集的各个特征进行敏感信息识别,获得每一特征对应的敏感特征,所述特征包括元数据特征、数据项特征和数据值特征;对每一所述敏感特征进行分析,获得每一敏感特征对应的分析结果;基于每一敏感特征对应的分析结果进行计算,得到所述人口健康数据集的敏感度综合评估结果;基于所述敏感度综合评估结果,生成所述人口健康数据集的敏感度评估报告。本发明实现了敏感信息发现、识别、分析和处理,并且通过多维度分析满足了人口健康数据集敏感度评估的应用需求,以及提升了后续人口健康数据应用的效率和安全性。
-
公开(公告)号:CN119226516A
公开(公告)日:2024-12-31
申请号:CN202411354562.6
申请日:2024-09-26
Applicant: 中国医学科学院医学信息研究所
IPC: G06F16/35 , G06F18/2431 , G06F18/241
Abstract: 本申请实施例提供了一种论文数据可用性分类方法、装置、设备及存储介质。在执行所述方法时,先获取待分类论文文本,并对待分类论文文本进行前期的数据处理,提取到论文数据可用性声明文本;然后,将论文数据可用性声明文本输入数据可用性分类模型;通过数据可用性分类模型对论文数据可用性声明文本进行预处理得到向量序列,并对向量序列进行卷积操作得到文本特征,进而根据文本特征映射到预设分类合集中,输出该待分类论文文本中数据可用性的分类结果,实现了对论文中的数据可用性进行分类,为后续根据数据可用性分类构建数据库提供基础。
-
-
-
-
-
-
-
-
-