-
公开(公告)号:CN118888046A
公开(公告)日:2024-11-01
申请号:CN202410915423.X
申请日:2024-07-09
Applicant: 之江实验室
Abstract: 本发明公开了一种基于大型语言模型的化学文献解析和反应信息提取方法和装置,对化学文献进行收集并经过OCR和筛选处理,得到处理后的化学文献数据集;对处理后的化学文献数据集进行信息提取,得到反应信息提取集合。相比于传统的常规工具包或成熟软件,本发明可适用于风格迥异的各类学术期刊,而传统的软件只能适用于专利文献或格式比较单一的某一类文献;因此本发明相比现有技术具有更好的普适性。本发明的针对性更强且在面对复杂问题时性能效果更加优良。本发明与传统上通过人工收集提取化学数据的方式相比,效率更高、成本更低且综合性能更加稳定。
-
公开(公告)号:CN118116491A
公开(公告)日:2024-05-31
申请号:CN202410297931.6
申请日:2024-03-15
Applicant: 之江实验室
IPC: G16C20/10 , G16C20/70 , G06N3/042 , G06N3/0895
Abstract: 本发明公开了一种基于大型语言模型的化学反应产率预测方法及装置,利用大型语言模型从文献数据库中收集并参考类似的化学反应,来预测和优化新的化学反应的产率,旨在弥合现有产率预测模型与经验丰富的化学家之间的差距。通过用大语言模型生成代码来访问PubChem和Sci‑Finder等化学数据库,该人工智能助手可以像化学家一样访问最新且实时更新的文献数据,从而提高现有产率预测算法泛化能力以及实时知识获取能力。
-