一种化合物结构跨模态搜索方法及系统

    公开(公告)号:CN120032757A

    公开(公告)日:2025-05-23

    申请号:CN202510024250.7

    申请日:2025-01-07

    Abstract: 本发明提供一种化合物结构跨模态搜索方法及系统,基于CLIP模型将文本形式或图片形式的化合物结构数据进行向量化,以映射到相同语义空间,通过对预设的化合物向量数据库进行搜索,能够对化合物结构实现跨模态搜索。化合物向量数据库通过构建联合索引和跨模态相似性搜索算法,实现了高效的跨模态搜索功能。联合索引能够同时支持图像、文本向量的存储和检索,提高了搜索的速度和效率。跨模态相似性搜索算法能够综合考虑图像和文本信息的相似性,提高了搜索的准确性。通过构建向量的分片存储,实现了分布式存储向量数据的功能,能够灵活应对后期数据量增大带来的存储和检索的问题,增强了系统的可扩展性。

Patent Agency Ranking