-
公开(公告)号:CN116010821A
公开(公告)日:2023-04-25
申请号:CN202310161824.6
申请日:2023-02-23
Applicant: 清华大学
IPC: G06F18/214 , G06N20/00 , G06F18/2415
Abstract: 本申请提出了一种基于个性化学习的联邦学习方法及装置,涉及人工智能领域,包括:收集多个中心的数据,其中,各中心均采用ResNet50模型作为模型架构;分别拆分各中心的ResNet50模型,其中,ResNet50模型被拆分为数据层、任务层与特征层;所有中心共同参与联邦学习进行联合建模,确定各中心的个性化本地模型,其中,各中心的数据层和任务层在各自数据上进行本地训练,特征层在各自数据上完成本地训练后发送到云服务器进行聚合后再发回本地以更新本地的特征层;对各中心的个性化本地模型进行模型评估,确定评估结果。本申请通过拓展基于模型的个性化学习方法,不仅保护各个中心的数据隐私,各个中心也能处理不同的数据类型和任务,从而拓宽联邦学习的泛用性。
-
公开(公告)号:CN112802080A
公开(公告)日:2021-05-14
申请号:CN202110098807.3
申请日:2021-01-25
Applicant: 清华大学
Abstract: 本发明提出一种基于深度学习的单目绝对深度估计方法和装置,其中,方法包括:获取样本RGB图片对应的深度数据和绝对深度;将样本RGB图片的相对深度输入初始模型,获取初始模型输出的参考绝对深度;根据预设的第一损失函数计算参考绝对深度和相对深度对应的绝对深度的损失值;若损失值大于预设阈值,则调整初始模型,直至损失值小于预设阈值时,训练完成与初始模型对应的目标模型;根据目标模型计算场景的绝对深度。由此,可以较好地应用于自动驾驶等对场景深度测算要求较高的场景中。
-
公开(公告)号:CN109903393B
公开(公告)日:2021-03-16
申请号:CN201910133353.1
申请日:2019-02-22
Applicant: 清华大学
Abstract: 本申请提出基于深度学习的新视角场景合成方法和装置,其中,方法包括:通过控制相机在训练场景下按照预设圆轨道旋转,每旋转预设角度对所述训练场景拍摄一张图像得到训练图像集,获取训练图像集中N张连续训练图像中第一张训练图像和第N张训练图像及其对应的相机位置参数信息;通过计算得到第一张训练图像和第N张训练图像的图像特征以对场景合成模型进行训练,根据合成场景图像和真实训练场景图像对应的损失函数值对场景合成模型的网络参数进行调整,以完成对场景合成模型的训练。由此,通过训练场景中的训练图像的不同图像特征对场景合成模型进行训练,提高了场景合成的准确度。
-
公开(公告)号:CN117830712A
公开(公告)日:2024-04-05
申请号:CN202311816575.6
申请日:2023-12-26
Applicant: 清华大学
IPC: G06V10/764 , G06T7/00 , G16H50/20 , G16H30/00
Abstract: 本发明公开了基于深度学习的三维医学影像疾病全流程综合诊断方法,该方法,包括按照预设的轴位将三维医学影像数据拆分为不同的二维影像;将不同的二维影像输入至训练好的分割模型得到二维置信度图,并分别拼接二维置信度图得到对应轴位的三维置信度图;对三维置信度图进行逐体素取平均值,进行二值化操作得到三维分割结果;将三维分割结果和三维医学影像数据输入至训练好的主型和亚型分类模型,提取整体影像特征和病灶局部特征,并对整体影像特征和病灶局部特征进行融合以得到主型和亚型分类预测结果。本发明通过综合考虑三维医学影像特征、三维疾病病灶特征和全流程中不同阶段信息等,有效克服复杂疾病的诊断难题,实现复杂疾病的全流程诊断。
-
公开(公告)号:CN116883725A
公开(公告)日:2023-10-13
申请号:CN202310744247.3
申请日:2023-06-21
Applicant: 清华大学
IPC: G06V10/764 , G06T7/00 , G06T17/00
Abstract: 本申请涉及一种三维医学影像疾病类别分类方法及装置,其中,方法包括:采集多例训练三维医学影像;获取多例训练三维医学影像的每例训练影像对应的疾病真实类别;利用多例训练三维医学影像和每例训练影像对应的疾病真实类别训练,同时关注病灶全局和局部特征的医学影像疾病类别分类全局‑局部Transformer模型,直至模型达到预设收敛条件,得到三维医学影像疾病类别分类模型。由此,解决了相关技术中,主要基于整个病灶的全局特征来进行疾病类别的判断,忽略了病灶的局部细节,容易导致在影像上病灶整体外观相似的疾病之间的相互错判的问题。
-
公开(公告)号:CN114332527A
公开(公告)日:2022-04-12
申请号:CN202111415287.0
申请日:2021-11-25
Applicant: 清华大学
IPC: G06V10/764 , G06V10/762 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请提出了一种基于分类树构造的细粒度图像多分类方法,涉及计算机视觉技术领域,其中,该方法包括:收集多分类图像数据,划分为训练集和验证集;基于训练集和验证集构造多类别的二叉树拓扑结构;在二叉树的每个非叶结点训练二分类模型;获取待预测的图像数据,输入到二叉树结构中逐层二分类直至叶结点,得到图像对应的最终类别。采用上述方案的本申请能够降低细粒度多分类的难度从而提高分类精度。
-
公开(公告)号:CN113689369A
公开(公告)日:2021-11-23
申请号:CN202110762252.8
申请日:2021-07-06
Applicant: 清华大学
Abstract: 本发明提出一种基于深度学习的医学分割多阶段融合方法及装置,其中,包括:获取待分割的三维医学影像数据;从三个相互正交的方向分别将三维医学影像数据切分为多个三维切片;获取预先训练完成的与三个相互正交的方向分别对应的三个二维神经网络,并将同一方向上的多个三维切片输入至对应的二维神经网络中;通过每个二维神经网络对输入的每个三维切片进行分割预测,依次获取每两个相邻的三维切片间相同的影像数据的三个分割预测结果;对三个二维神经网络输出的分割预测结果进行第二阶段的融合。本申请提出的方法可以保证分割结果的连贯性并且减少假阳的出现,从而提高分割结果的准确性。
-
公开(公告)号:CN109903393A
公开(公告)日:2019-06-18
申请号:CN201910133353.1
申请日:2019-02-22
Applicant: 清华大学
Abstract: 本申请提出基于深度学习的新视角场景合成方法和装置,其中,方法包括:通过控制相机在训练场景下按照预设圆轨道旋转,每旋转预设角度对所述训练场景拍摄一张图像得到训练图像集,获取训练图像集中N张连续训练图像中第一张训练图像和第N张训练图像及其对应的相机位置参数信息;通过计算得到第一张训练图像和第N张训练图像的图像特征以对场景合成模型进行训练,根据合成场景图像和真实训练场景图像对应的损失函数值对场景合成模型的网络参数进行调整,以完成对场景合成模型的训练。由此,通过训练场景中的训练图像的不同图像特征对场景合成模型进行训练,提高了场景合成的准确度。
-
公开(公告)号:CN114332527B
公开(公告)日:2024-08-13
申请号:CN202111415287.0
申请日:2021-11-25
Applicant: 清华大学
IPC: G06V10/764 , G06V10/762 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/08
Abstract: 本申请提出了一种基于分类树构造的细粒度图像多分类方法,涉及计算机视觉技术领域,其中,该方法包括:收集多分类图像数据,划分为训练集和验证集;基于训练集和验证集构造多类别的二叉树拓扑结构;在二叉树的每个非叶结点训练二分类模型;获取待预测的图像数据,输入到二叉树结构中逐层二分类直至叶结点,得到图像对应的最终类别。采用上述方案的本申请能够降低细粒度多分类的难度从而提高分类精度。
-
公开(公告)号:CN113689369B
公开(公告)日:2022-12-02
申请号:CN202110762252.8
申请日:2021-07-06
Applicant: 清华大学
Abstract: 本发明提出一种基于深度学习的医学分割多阶段融合方法及装置,其中,包括:获取待分割的三维医学影像数据;从三个相互正交的方向分别将三维医学影像数据切分为多个三维切片;获取预先训练完成的与三个相互正交的方向分别对应的三个二维神经网络,并将同一方向上的多个三维切片输入至对应的二维神经网络中;通过每个二维神经网络对输入的每个三维切片进行分割预测,依次获取每两个相邻的三维切片间相同的影像数据的三个分割预测结果;对三个二维神经网络输出的分割预测结果进行第二阶段的融合。本申请提出的方法可以保证分割结果的连贯性并且减少假阳的出现,从而提高分割结果的准确性。
-
-
-
-
-
-
-
-
-