-
公开(公告)号:CN116992869B
公开(公告)日:2024-08-16
申请号:CN202310881921.2
申请日:2023-07-18
Applicant: 中国中医科学院中医药信息研究所
IPC: G06F40/279 , G06F16/35 , G06F16/36
Abstract: 本发明涉及自然语言处理技术领域,特别是指一种基于搜索引擎和分类器的远程监督关系抽取方法及装置。对小样本数据进行标注,获得远程监督知识库;输入未标注文本,根据远程监督知识库对未标注文本进行标注,获得第一监督文本;将第一监督文本以及监督知识库进行降噪处理,获得第二监督文本;基于词性表达式库,对第二监督文本进行分析,获得第三监督文本;根据第三监督文本,通过预设的训练模型进行相似语句生成,获得第四监督文本;根据第四监督文本进行关系抽取,获得远程监督文本关系。本发明是一种效率高、鲁邦性好的远程监督关系抽取方法。
-
公开(公告)号:CN114791955A
公开(公告)日:2022-07-26
申请号:CN202210413257.4
申请日:2022-04-20
Applicant: 中国中医科学院中医药信息研究所
IPC: G06F16/36 , G06F16/34 , G06F16/84 , G06F40/242 , G06F40/279 , G06F40/30 , G16H70/40
Abstract: 本申请提供一种中医药文献语料库与知识库一体化系统,其包括元数据模块、语料库、文档标注模块、查询模块和语义知识库;元数据模块用于设定实体类、词典和语义关系并进行维护;语料库用于根据导入的文献形成半结构化文档;文档标注模块以词典为标注依据对半结构化文档进行标注;查询模块用于对元数据进行查询,以获得实体类、词典和语义关系的查询结果。本申请能够对文档进行标注、查询和语义检索,提供一种集语料库、文献标注、知识加工、分析、知识库检索一体化的系统;不仅能够单独检索语义的相关基础信息,还能够与文献形成关联,追踪到相关联的文献及相类似知识,检索效率高。
-
公开(公告)号:CN115660000A
公开(公告)日:2023-01-31
申请号:CN202210780981.0
申请日:2022-07-04
Applicant: 中国中医科学院中医药信息研究所
IPC: G06F40/58 , G06F40/284 , G06F18/24 , G06N3/096 , G06N20/00
Abstract: 本发明公开了一种中医药垂直领域中英机器翻译方法,包括以下步骤:1.中医药平行语料库建设;2.利用迁移学习的方式搭建神经机器翻译模型;3.中医药领域术语库加工;4.远程监督知识库构建;5.综合利用。本发明与现有技术相比的优点在于:更好的利用了迁移学习的策略,并优化了模型参数和改进了模型结构,使其在充分继承原预训练模型优点和海量参数的同时极大的改进了模型训练的精度和效率,形成了具有中医药语言学特色的中英领域翻译模型,利用了远程监督的方式,把高质量中医药中英平行语料资源、专业中英术语词汇资源、正异名资源进行整合为知识库,仅通过知识库就可以译出目标语言,并且准确率极高,同时对正异名词汇也有很好的合并功能。
-
公开(公告)号:CN114201962A
公开(公告)日:2022-03-18
申请号:CN202111467467.3
申请日:2021-12-03
Applicant: 中国中医科学院中医药信息研究所
IPC: G06F40/279 , G06F40/216
Abstract: 本发明公开了一种论文新颖性分析方法,包括构建论文集的语料库,利用LDA主题模型将词语集合中的词语分为多个主题,得到第二主题集合;根据第二主题集合和语料库,得到论文集中每一篇论文属于第二主题集合中的每一个主题的概率和第二主题集合中每一个主题的新颖度,并根据论文集中每一篇论文属于第二主题集合中的每一个主题的概率和第二主题集合中每一个主题的新颖度,得到论文集中每一篇论文的新颖度。本发明梳理了论文新颖性评价的工作流程,并结合特殊算法,实现计算机自动化处理不仅辅助人工评价新颖性,减低主观因素带来的误差,而且大大提高了工作效率。本发明还公开了一种论文新颖性分析装置、介质和设备。
-
公开(公告)号:CN119049729A
公开(公告)日:2024-11-29
申请号:CN202411137314.6
申请日:2024-08-19
Applicant: 中国中医科学院中医药信息研究所
IPC: G16H50/70 , G06F18/241
Abstract: 本发明涉及中医医案数据处理技术领域,且公开了一种基于卫生健康信息数据元的中医医案数据标准化方法和系统,具体包括以下步骤:第一步:数据收集与整理;第二步:数据预处理;第三步:数据标准化;第四步:平台开发与构建;第五步:维护与更新,该系统和方法能够整合来自不同医疗机构、不同数据来源的中医医案数据,通过数据映射和标准化处理,实现了多源数据的统一管理和分析,通过标准化处理,实现了中医医案数据的统一格式和编码标准,提高了数据的互操作性和可扩展性,使得中医医案数据能够更好地被利用和分析,不仅提高了中医医案数据的质量和准确性,还为用户提供了便捷的数据处理和分析平台,具有重要的实际应用价值。
-
公开(公告)号:CN116821199A
公开(公告)日:2023-09-29
申请号:CN202310786367.X
申请日:2023-06-29
Applicant: 中国中医科学院中医药信息研究所
IPC: G06F16/2457 , G06F16/25 , G06F16/248 , G06F16/28 , G06F40/30
Abstract: 本发明涉及中医信息化技术领域,且公开了一种中医医案数据提取系统,包括元数据模块、语料库、数据采集模块、数据验证模块、数据分解模块、医案建档模块、查询模块;所述元数据模块用于设定实体类、词典和语义关系并进行维护;所述语料库用于根据导入的文献形成半结构化文档;所述数据采集模块针对现有医案进行数据采集;所述数据验证模块对数据采集模块采集的数据进行验证,通过才有图像信息采集的方式提高对医案文本信息的采集速率,且在提取数据前引用规范标准的元数据模块和语料库,用于对采集数据进行规范化,提高了对医案数据的分析效率,保证了医案建档的规范,避免非常规性医案导致后续整理苦难。
-
公开(公告)号:CN114201962B
公开(公告)日:2023-07-25
申请号:CN202111467467.3
申请日:2021-12-03
Applicant: 中国中医科学院中医药信息研究所
IPC: G06F40/279 , G06F40/216
Abstract: 本发明公开了一种论文新颖性分析方法,包括构建论文集的语料库,利用LDA主题模型将词语集合中的词语分为多个主题,得到第二主题集合;根据第二主题集合和语料库,得到论文集中每一篇论文属于第二主题集合中的每一个主题的概率和第二主题集合中每一个主题的新颖度,并根据论文集中每一篇论文属于第二主题集合中的每一个主题的概率和第二主题集合中每一个主题的新颖度,得到论文集中每一篇论文的新颖度。本发明梳理了论文新颖性评价的工作流程,并结合特殊算法,实现计算机自动化处理不仅辅助人工评价新颖性,减低主观因素带来的误差,而且大大提高了工作效率。本发明还公开了一种论文新颖性分析装置、介质和设备。
-
公开(公告)号:CN116992869A
公开(公告)日:2023-11-03
申请号:CN202310881921.2
申请日:2023-07-18
Applicant: 中国中医科学院中医药信息研究所
IPC: G06F40/279 , G06F16/35 , G06F16/36
Abstract: 本发明涉及自然语言处理技术领域,特别是指一种基于搜索引擎和分类器的远程监督关系抽取方法及装置。对小样本数据进行标注,获得远程监督知识库;输入未标注文本,根据远程监督知识库对未标注文本进行标注,获得第一监督文本;将第一监督文本以及监督知识库进行降噪处理,获得第二监督文本;基于词性表达式库,对第二监督文本进行分析,获得第三监督文本;根据第三监督文本,通过预设的训练模型进行相似语句生成,获得第四监督文本;根据第四监督文本进行关系抽取,获得远程监督文本关系。本发明是一种效率高、鲁邦性好的远程监督关系抽取方法。
-
公开(公告)号:CN308349023S
公开(公告)日:2023-11-28
申请号:CN202330451798.1
申请日:2023-07-19
Applicant: 中国中医科学院中医药信息研究所
Abstract: 1.本外观设计产品的名称:折页宣传册(呦呦鹿鸣中文版)。
2.本外观设计产品的用途:中医药文化创意书签配套折页宣传册(中文版)。
3.本外观设计产品的设计要点:在于形状。
4.最能表明设计要点的图片或照片:主视图。
5.本外观设计产品为薄型产品,省略左视图;本外观设计产品为薄型产品,省略右视
图;本外观设计产品为薄型产品,省略俯视图;本外观设计产品为薄型产品,省略仰视图。
3
-
-
-
-
-
-
-
-