-
公开(公告)号:CN118866167A
公开(公告)日:2024-10-29
申请号:CN202411000281.0
申请日:2024-07-24
Applicant: 南京大学
Abstract: 本发明公开一种基于哈希学习的药物虚拟筛选方法:首先获取蛋白质‑分子复合物数据集;分别定义蛋白质和分子编码器;定义对比学习目标函数,学习蛋白质和分子的相似性信息;定义多模态哈希目标函数,学习蛋白质和分子的二值向量;将对比学习和多模态哈希目标函数构成最终损失函数,训练模型。将分子数据库中的分子表示成二值向量。在进行药物虚拟筛选时,将蛋白质靶标表示为二值向量。计算蛋白质靶标的二值向量和分子数据库中二值向量之间海明距离,或是通过二值向量数据库构建倒排索引来检索最可能结合的分子。根据实际需求,选取一定比例的分子作为候选药物分子。本发明提升了药物虚拟筛选的精度,减少了存储开销,提升了检索速度。
-
公开(公告)号:CN117649337A
公开(公告)日:2024-03-05
申请号:CN202311748636.X
申请日:2023-12-19
IPC: G06T3/04 , G06T7/00 , G06T7/10 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于条件生成对抗网络将背部照片转换成脊柱X光的方法,包括以下步骤:采集背部照片和脊柱X光影像,建立训练集数据库;采用LabelMe对数据库中的背部照片和脊柱X光影像进行标注和预处理;使用预处理后的X光影像训练目标检测模型;处理全部数据集,对同一患者截取后的背部外观和X光影像的配对图像进行图像对齐;训练一种基于滑动窗口自注意力机制的条件生成对抗网络的模型,将对齐后的背部照片作为输入,生成与X光影像相匹配的输出,预测脊柱侧凸的病情;使用内部及外部数据集对模型的转换性能进行测试。本发明可以应用于脊柱畸形的远程诊疗及随访,加强医生对脊柱畸形患者的健康监测。
-
公开(公告)号:CN116386803A
公开(公告)日:2023-07-04
申请号:CN202310247097.5
申请日:2023-03-15
Applicant: 南京大学
Abstract: 本发明公开了一种基于图的细胞病理报告生成方法,包括以下两个内容:基于图的细胞病理报告生成模型,以及对生成的模型进行训练。本发明通过构建细胞图的方式对细胞空间结构进行显式建模,并有效融合细胞空间结构特征和细胞形态特征,能够自动生成高质量的细胞病理报告。本发明相比于已有方法,能够显著提升细胞病理报告生成的质量,在临床场景中可以辅助医生完成繁琐的细胞病理报告编写工作、提升病理诊断的效率,同时报告中所给出的结论也能辅助确认诊断的准确性。
-
公开(公告)号:CN110287031B
公开(公告)日:2023-05-09
申请号:CN201910583390.2
申请日:2019-07-01
Applicant: 南京大学
Abstract: 本发明公开了一种减少分布式机器学习通信开销的方法,基于参数服务器架构,既适用于数据中心的多机集群分布式机器学习,也适用于服务器作为云端、手机或嵌入式设备作为终端的端云协同分布式机器学习。包括以下步骤:首先所有工作节点计算梯度,并结合两轮参数差求出全局动量,将全局动量与上一轮记忆梯度求和得到新一轮记忆梯度,对其取部分发给服务器节点,剩下部分进行累积;随后服务器节点累积所有稀疏的记忆梯度和,以此更新参数并将两轮的参数差广播给所有工作节点;最后工作节点接收两轮参数差,并更新参数。本发明的方法基于全局梯度压缩,工作节点与服务器节点间通信时只传递全局动量的一部分,从而减小了分布式机器学习中的通信开销。
-
公开(公告)号:CN114936015A
公开(公告)日:2022-08-23
申请号:CN202210625568.7
申请日:2022-06-02
Applicant: 南京大学
Abstract: 本发明公开了一种基于硬件计算图的深度学习编译器,包括软件计算图生成模块,硬件计算图生成模块,软件计算图优化模块,硬件计算图优化模块,以及代码生成模块;软件计算图生成模块用于将外部框架定义的深度学习模型转化为内部软件计算图;所述硬件计算图生成模块,在软件计算图的指导下,先生成基础节点集合,再使用贪心搜索对节点集合调整直到满足整个深度学习模型所需的计算要求,最后生成硬件计算图的边;代码生成模块用于生成深度学习模型对应的硬件代码以及仿真代码。本发明可以对复杂拓扑的模型进行高效,且高性能的部署,减少了部署所需的成本。并且本发明能够应用于CPU、GPU、FPGA以及人工智能专用芯片等多种硬件平台。
-
公开(公告)号:CN108427773A
公开(公告)日:2018-08-21
申请号:CN201810429012.4
申请日:2018-05-08
Applicant: 南京大学
Abstract: 本发明公开了一种分布式知识图谱嵌入方法。工业界常用的普通服务器计算能力和内存容量有限,在处理大规模知识图谱数据时,单台服务器往往不能完成处理工作。为了解决这个问题,本发明提出了一种分布式知识图谱嵌入方法,该方法采用一种分布式架构,将多台服务器统一在一个计算系统中,通过网络进行通信,共享CPU和内存等计算资源,从而完成大规模知识图谱嵌入的计算。该方法中,参数按照维度划分到各台服务器上,从而减少计算中产生的通信开销,加快运行速度。
-
公开(公告)号:CN118917435A
公开(公告)日:2024-11-08
申请号:CN202411000289.7
申请日:2024-07-24
Applicant: 南京大学
IPC: G06N20/00
Abstract: 本发明公开一种基于有序动量的异步分布式机器学习方法,基于有序动量的思想,将动量引入异步随机梯度下降法。在服务器端将梯度按照其迭代索引的顺序组织成有序动量。这里的有序动量是若干个梯度存储桶的加权和,梯度到达服务器端后,根据其迭代索引放入相应的梯度存储桶中。相比较异步随机梯度下降方法,本方法不引入除了动量项外的额外存储开销,并且可以有效提升算法的收敛性能和模型的泛化性能。相比较现有的带动量的同步分布式机器学习方法,本方法可以大幅度提升训练集群分布式训练的速度,尤其是在训练集群中各工作节点计算能力异构的场景下,本方法的速度优势更加明显。
-
公开(公告)号:CN117975021A
公开(公告)日:2024-05-03
申请号:CN202410298770.2
申请日:2024-03-15
Applicant: 南京大学
IPC: G06V10/26 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06V10/764 , G06V10/74
Abstract: 本发明公开一种基于大模型的医疗图像全自动语义分割方法,基于MedSAM的结构以及预训练权重,使用LoRA模块对模型的编码器权重进行高效更新,将预训练权重中包含的大量医疗图像领域知识迁移到具体的医疗图像分割任务中。对解码器模块进行针对性的全自动分割设计,仅包含图像特征序列与掩膜令牌的双向注意力运算,并通过对输出模块进行相应预测头数量的设置,保证预测结果包含明确的类别语义信息。已有大模型需要人工输入提示,因此只能实现半自动语义分割。本发明设计了能实现全自动语义分割的大模型,不需要人工输入提示信息。可以有效提升医疗图像语义分割的准确率,不受疾病和病灶种类的限制,具有很好的普适性和通用性。
-
公开(公告)号:CN111144411B
公开(公告)日:2024-02-27
申请号:CN201911373170.3
申请日:2019-12-27
Applicant: 南京大学 , 南京和光智能制造研究院有限公司
IPC: G06V10/24 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/082
Abstract: 本发明公开了一种基于显著图的不规则文本修正与识别方法及系统,将不规则文本图片输入至预先训练好的不规则文本修正网络模型,输出字符级别的分类显著图;利用条状区域变换算法对不规则文本图片和分类显著图进行修正,输出修正图片;将修正图片输入至预先训练好的不规则文本识别网络模型,输出文本图片识别信息。优点:通过训练好的不规则文本修正网络模型,条状区域变换算法,训练好的不规则文本识别网络模型,对不规则文本图片进行处理,提高了不规则文本识别的准确率和鲁棒性。
-
公开(公告)号:CN117275591A
公开(公告)日:2023-12-22
申请号:CN202311257894.8
申请日:2023-09-27
Applicant: 南京大学
IPC: G16B50/30 , G16B40/00 , G06F16/903 , G06F16/901 , G06F16/9038 , G06F18/214 , G06F18/22 , G06N3/042
Abstract: 本发明公开一种基于哈希学习的相似蛋白质结构检索方法:首先获取蛋白质结构数据集,计算两两之间的相似度信息;针对查询样本,采样正样本与负样本;将蛋白质结构建模为图,并提取节点和边特征,更新节点和边的特征表示,定义量化损失和相似性损失,得到最终损失函数,训练模型。基于训练得到的模型将已收集的每个蛋白质结构表示成二值向量,得到二值向量数据库。在检索时,用训练得到的模型将待检索的新蛋白质结构表示为二值向量,通过直接计算二值向量间的海明距离或是构建倒排索引的方式来检索相似的结构,也可以对基于二值向量检索返回的靠前的蛋白质结构用其他实值向量或者更复杂的算法进行重新排序。本发明减少了存储开销,提升了检索速度。
-
-
-
-
-
-
-
-
-