-
公开(公告)号:CN119443093A
公开(公告)日:2025-02-14
申请号:CN202510050672.1
申请日:2025-01-13
Applicant: 之江实验室
IPC: G06F40/279 , G06V30/19 , G06V10/774
Abstract: 本发明提出了一种基于大型语言模型的酶活参数抽取方法与系统,属于文本信息处理和数据挖掘领域。本发明通过OCR技术将PDF格式文献转换为Markdown格式,随后利用大型语言模型结合优化的提示词自动提取关键数据;自动提取流程经过严格的提示词优化和后处理操作,确保数据的准确性和一致性;然后通过精确度和召回率验证自动提取的有效性,最终生成的酶数据库可供后续的研究和分析使用。本发明通过结合OCR技术与大型语言模型,突破了现有手动数据提取的局限,显著提升了文献解析和数据提取的自动化程度;通过提示词工程和优化的提示词设计,实现了复杂文献中的结构化数据自动提取,特别是对于酶动力学参数的精确识别和提取。
-
公开(公告)号:CN117402853A
公开(公告)日:2024-01-16
申请号:CN202311327109.1
申请日:2023-10-12
Applicant: 之江实验室
IPC: C12N9/22 , C12N15/55 , C12N15/113 , C12N15/70
Abstract: 本发明公开了一种具有DNA切割活性的Cas12m蛋白及其应用,涉及基因编辑领域。本发明提供了一种新型的Cas12m亚型蛋白,命名为IMGVR_18,该Cas12m亚型蛋白具有明显的DNA切割活性,在基因编辑领域中具有潜在的应用前景。本发明IMGVR_18蛋白和crRNA复合体构成CRISPR/Cas12m系统,能准确定位靶向DNA序列,并产生切割,使DNA断裂损伤。
-