-
公开(公告)号:CN116721703A
公开(公告)日:2023-09-08
申请号:CN202310508403.6
申请日:2023-05-08
Applicant: 中国医学科学院北京协和医院
IPC: G16B50/00 , G16B50/10 , G16B45/00 , G16B20/20 , G16B20/40 , G16B20/50 , G16B30/00 , G16B30/20 , G16H70/00 , G16H10/60 , G06F40/194 , G06F18/22 , G06F16/31 , G06F16/33
Abstract: 本发明涉及一种基于NLP构建孟德尔遗传疾病分子诊断数据库的方法、设备、系统及可存储介质。所述数据库构建的方法包括:获取与孟德尔遗传疾病相关的文献;基于NLP提取所述文献中的信息,所述文献中的信息包括孟德尔遗传疾病信息和孟德尔遗传疾病基因信息;将所述文献中的信息进行向量化表示,得到向量化表示的孟德尔遗传疾病信息和基因信息;基于所述向量化表示的孟德尔遗传疾病信息和基因信息,构建孟德尔遗传疾病分子诊断数据库。本发明构建的数据库基于研究前沿、数据全面可靠、可快速更新,为孟德尔遗传疾病分子诊断和治疗领域的研究人员、临床医生提供了宝贵资源,有重要的科研和临床价值。