-
公开(公告)号:CN110399450B
公开(公告)日:2023-06-23
申请号:CN201910536642.6
申请日:2019-06-20
Applicant: 东华大学 , 上海交通大学医学院附属瑞金医院
IPC: G06F40/103 , G06F40/30 , G06F40/289 , G16H15/00 , G16H70/00
Abstract: 本发明涉及一种基于语义树的甲状腺超声报告结构化扫描方法,通过三个步骤进行实现:1)甲状腺超声文本数据预处理,包括分块分句分词、同义词替换;2)语义树定位,相应的规则结合dewey编码进行结点定位,标记,删除等不同操作;3)记录所有结点,输出结构化结果。在甲状腺超声报告中,主要关注点在于甲状腺和甲状腺病灶的病变情况,所以本发明立足于解剖学的基础构建了基于甲状腺超声领域的语义树。通过扫描报告与语义树作相应匹配,将文本报告结构化,从中提取有用信息可用于后续研究,从而更好地辅助医生进行病情诊断和治疗。
-
公开(公告)号:CN110069639A
公开(公告)日:2019-07-30
申请号:CN201910256716.0
申请日:2019-04-01
Applicant: 东华大学 , 上海交通大学医学院附属瑞金医院
IPC: G06F16/36
Abstract: 本发明涉及一种构建甲状腺超声领域本体的方法,其特征在于,包括以下步骤:步骤1、对甲状腺超声报告进行数据预处理;步骤2、实体抽取;步骤3、依存关系抽取;步骤4、语义关系抽取;步骤5、构建甲状腺超声领域本体。在甲状腺超声报告中,本发明的主要关注点在于甲状腺和甲状腺病灶的病变情况,并不需要过于关注人体其余组织或基因层面的知识,所以本发明立足于解剖学的基础构建了适合于甲状腺超声领域的医学本体。运用甲状腺超声领域本体可以更好地从超声报告中提取有用的诊疗信息,从而更好地辅助医生进行病情诊断和治疗。
-
公开(公告)号:CN107423289A
公开(公告)日:2017-12-01
申请号:CN201710590651.4
申请日:2017-07-19
Applicant: 东华大学 , 上海交通大学医学院附属瑞金医院
CPC classification number: G06F17/277 , G06F17/271
Abstract: 本发明提供了一种跨类型乳腺肿瘤临床文档的结构化处理方法,步骤1:对乳腺肿瘤临床文档的文本进行预处理,包括:切分短文本、及对切分后的短文本进行分词;步骤2:针对分词结果,进行单类型报告的部分语料标注;步骤3:采用所述单类型报告的语料,实现跨类型实体识别;步骤4:提取出结构化结果,包括:组织、位置、特征、特征值。本发明提供的方法克服了现有技术的不足,结构化信息的提取是自动形成,节省了人力与时间,且不局限于报告类型,可以应用于不同报告的特征识别与文本结构化,解决了中文跨类型临床文档的结构化处理问题。方法实现简单,处理速度快,处理结果准确率高。
-
公开(公告)号:CN110765274A
公开(公告)日:2020-02-07
申请号:CN201910957032.3
申请日:2019-10-10
Applicant: 东华大学 , 上海交通大学医学院附属瑞金医院
Abstract: 本发明提供了一种语音输入B超异常关键字生成甲状腺超声报告的方法。包括以下步骤:定义甲状腺超声语义树;根据甲状腺超声语义树生成子结构;B超异常关键字语音输入;定位描述范围;定位腺体背景描述部位并进行属性定位;定位局灶性病变描述结节并进行属性定位;补充必要属性;补充默认信息;生成文本。本发明使得B超医生在进行超声影像诊断的同时语音输入B超异常描述,无需额外医生手工录入超声文本报告,大大节约人力。在医生语音输入结束后可自动填充未提及属性的正常属性值,避免医生语音描述大量默认冗余信息,在尽可能少的语音输入情况下确保报告的完整性。最后,基于生成的样本树生成文本,解决报告歧义问题。
-
公开(公告)号:CN104899260A
公开(公告)日:2015-09-09
申请号:CN201510260060.1
申请日:2015-05-20
Applicant: 东华大学 , 上海交通大学医学院附属瑞金医院
IPC: G06F17/30
CPC classification number: G06F17/30705 , G06F17/30731
Abstract: 本发明涉及一种中文病理文本结构化处理方法,包括以下步骤:从病理报告文本数据的样本与指标的层次结构中提取出各个样本所对应的模板信息;对模板信息进行提取,包括短句切分和指标名提取;短句分类;对每个样本结合分类结果集合CLUSTER和短句集CLAUSE,计算指标名列表中的每个指标名在短句语料中的TF值、IDF值和C-value值,筛选出TF值、IDF值和C-value值满足阈值的指标名,作为最终模板中的成分。本发明能够将非结构化的中文病理文本结构化。
-
公开(公告)号:CN110765274B
公开(公告)日:2023-10-24
申请号:CN201910957032.3
申请日:2019-10-10
Applicant: 东华大学 , 上海交通大学医学院附属瑞金医院
Abstract: 本发明提供了一种语音输入B超异常关键字生成甲状腺超声报告的方法。包括以下步骤:定义甲状腺超声语义树;根据甲状腺超声语义树生成子结构;B超异常关键字语音输入;定位描述范围;定位腺体背景描述部位并进行属性定位;定位局灶性病变描述结节并进行属性定位;补充必要属性;补充默认信息;生成文本。本发明使得B超医生在进行超声影像诊断的同时语音输入B超异常描述,无需额外医生手工录入超声文本报告,大大节约人力。在医生语音输入结束后可自动填充未提及属性的正常属性值,避免医生语音描述大量默认冗余信息,在尽可能少的语音输入情况下确保报告的完整性。最后,基于生成的样本树生成文本,解决报告歧义问题。
-
公开(公告)号:CN109243616A
公开(公告)日:2019-01-18
申请号:CN201810699364.1
申请日:2018-06-29
Applicant: 东华大学 , 上海交通大学医学院附属瑞金医院
Abstract: 本发明涉及一种基于深度学习的乳腺电子病历联合关系抽取与结构化系统,包括乳腺电子病历数据的结构化模块和乳腺电子病历数据的关系抽取模块,所述乳腺电子病历数据的结构化模块基于深度学习将大量非结构化的文本数据转化为评估算法可识别的结构化数据;所述乳腺电子病历数据的关系抽取模块基于深度学习建立电子病历结构化模型,得到评估结果。本发明能够有效提高乳腺电子病历中的结构化以及关系抽取的自动化和智能化水平。
-
公开(公告)号:CN104899260B
公开(公告)日:2018-02-23
申请号:CN201510260060.1
申请日:2015-05-20
Applicant: 东华大学 , 上海交通大学医学院附属瑞金医院
IPC: G06F17/30
Abstract: 本发明涉及一种中文病理文本结构化处理方法,包括以下步骤:从病理报告文本数据的样本与指标的层次结构中提取出各个样本所对应的模板信息;对模板信息进行提取,包括短句切分和指标名提取;短句分类;对每个样本结合分类结果集合CLUSTER和短句集CLAUSE,计算指标名列表中的每个指标名在短句语料中的TF值、IDF值和C‑value值,筛选出TF值、IDF值和C‑value值满足阈值的指标名,作为最终模板中的成分。本发明能够将非结构化的中文病理文本结构化。
-
公开(公告)号:CN107220506A
公开(公告)日:2017-09-29
申请号:CN201710414761.5
申请日:2017-06-05
Applicant: 东华大学 , 上海交通大学医学院附属瑞金医院
CPC classification number: G06N3/084
Abstract: 本发明涉及一种基于深度卷积神经网络的乳腺癌风险评估分析系统,包括医疗文档预处理模块,用于对医学文本大数据进行预处理生成字向量训练使用的字表;字向量训练模块,通过训练一个深度卷积神经网络生成初级字向量;分布式语义特征医学信息抽取模块,使用全连接层将学到的分布式特征表示映射到样本标记空间,并生成医学领域的分布式语义特征;长时语义关联特征提取模块,用于使用分布式语义特征表示,提取医疗临床文档的长时语义关联特征;乳腺癌风险评估分析模块,使用长时语义关联特征训练一个用于乳腺癌风险评估的深度神经网络,并进行乳腺癌风险评估。本发明提高了乳腺癌筛查的自动化和智能化水平。
-
公开(公告)号:CN106502982A
公开(公告)日:2017-03-15
申请号:CN201610894239.7
申请日:2016-10-13
Applicant: 东华大学 , 上海交通大学医学院附属瑞金医院
IPC: G06F17/27
CPC classification number: G06F17/2785 , G06F17/271 , G06F17/2795
Abstract: 本发明涉及本发明涉及非结构化中文乳腺超声文本的结构化处理方法,该方法接受由超声科医生书写的非结构化中文乳腺超声文本,输出结构化之后的超声特征及其特征值,该方法包括以下步骤:对乳腺超声文本内容按照描述规则,分别切分为描述双、左、右侧乳腺的文本短句;对切分后的文本短句进行同义词替换;对替换后的文本短句分别进行句法分析;乳腺超声特征、特征值的提取。本发明能够将非结构化的中文乳腺超声文本进行结构化处理。
-
-
-
-
-
-
-
-
-