基于深度学习的单视图三维物体重建方法

    公开(公告)号:CN119152121A

    公开(公告)日:2024-12-17

    申请号:CN202411362684.X

    申请日:2024-09-27

    Abstract: 本发明公开了基于深度学习的单视图三维物体重建方法,涉及计算机视觉领域,包括S1、构建物体重建模型,物体重建模型包括图像编码器、生成器G和鉴别器D,图像编码器用于从单视图图像中提取高层次特征,并通过重参数化技巧将高层次特征转化为潜在向量;S2、获取训练数据集;S3、训练数据集导入物体重建模型,并对物体重建模型进行训练优化,获得优化后的物体重建模型;S4、获取待重建的数据;S5、利用优化后的物体重建模型对待重建的数据进行三维物体重建;采用先进的神经网络架构,生成对抗网络GAN和图像编码器VAE,并在GAN网络中添加空间注意力机制来挖掘单视图图像中的深层特征和空间关系,从而提升3D物体重建的精度和鲁棒性。

    基于混合损失函数扩散模型的增强CT图像生成方法及装置

    公开(公告)号:CN118379208B

    公开(公告)日:2024-10-29

    申请号:CN202410816691.6

    申请日:2024-06-24

    Abstract: 本发明公开了一种基于混合损失函数扩散模型的增强CT图像生成方法及装置,该方法包括:采集CT图像数据及其配对的造影剂增强CT图像数据,并采用数据增强方法和面向数据的正则化方法对其进行预处理,以按比例划分为训练集、测试集和验证集;构建用于生成造影剂增强CT图像的扩散模型;使用训练集对扩散模型进行迭代训练,基于混合损失函数调整扩散模型的参数,以获取训练好的扩散模型;将测试集中的CT图像数据输入至训练好的扩散模型中,得到对应的造影剂增强CT图像数据。本发明能够生成清晰可靠的造影剂增强CT图像,能够更好地捕捉数据分布的特征,提高了对不同特征的感知能力,增强了合成图像的质量,提高了模型的泛化性。

    一种低剂量CT图像去噪方法
    24.
    发明公开

    公开(公告)号:CN117196987A

    公开(公告)日:2023-12-08

    申请号:CN202311187498.2

    申请日:2023-09-14

    Abstract: 本发明公开了一种低剂量CT图像去噪方法,包括以下步骤:S1:建立数据集,设定带有噪声的LDCT图像集合x,和与LDCT图像集合x对应的高质量的NDCT图像集合y;S2:搭建参数为θ的去噪模型 使用模构建 的映射;S3:使用混合损失训练去噪模型 设置学习率和动量参数,采用误差反向传播训练去噪模型 达到迭代最大次数,生成训练好的去噪模型;S4:图像去噪;将测试集中的LDCT图像预处理后,输入至训练好的去噪模型,得到对应的去噪后图像,本申请提出的去噪方法考虑到了图像不同区域的去噪难度,通过添加权重的方式对其进行自适应平衡,并通过高频信息损失促进图像纹理细节的生成,避免去噪后图像变得过度平滑。

    基于深度学习的术中肺恶性肿瘤热消融疗效预测的方法

    公开(公告)号:CN117174301A

    公开(公告)日:2023-12-05

    申请号:CN202310569396.0

    申请日:2023-05-19

    Abstract: 本发明公开了基于深度学习的术中肺恶性肿瘤热消融疗效预测的方法,其特征在于,包括获得热消融CT图像;在热消融CT图像上感兴趣区域及感兴趣区域图像;将持续获得的热消融CT图像批量转换为jpg格式的图像,将感兴趣区域图像与热消融图像相结合,得到高亮感兴趣区域的CT图像,收集多名患者的热消融CT图像和高亮感兴趣区域的CT图像,进行剪裁得到分割图像;将分割图像输入深度残差网络,得到输出特征;对输出特征使用归一化指数函数后,得到分类概率,根据分类概率得到肺癌热消融的预测结果;在测试平台上进行测试,最终得到训练完成的深度残差神经网络模型。将患者的病灶CT图像输入训练完成的深度残差神经网络模型后,得出肺癌热消融预测效果。

    一种基于双重软约束的视觉对话信息识别方法

    公开(公告)号:CN117131879A

    公开(公告)日:2023-11-28

    申请号:CN202310591677.6

    申请日:2023-05-24

    Abstract: 本发明涉及一种基于双重软约束的视觉对话信息识别方法,包括:采用多层Transformer编码器作为基准模型,并以图像区域特征I、提出的问题qt、图片描述C、历史对话Ht和附加的候选答案作为模型的输入;通过掩码语言模型损失、掩码图像区域损失和下句预测损失对模型进行多任务训练;使用POS标签信息并引入POS标签预损失帮助对话中的代词找到对应的名词作为第一个软约束,采用正弦位置编码并引入句子位置向量作为第二个软约束,通过两个软约束增强模型的表达能力;通过最后得到的模型对视觉对话信息进行解析识别。本发明基于双重软约束的视觉对话算法能够有效地解析代词指代的实体,并提升视觉对话模型答案的准确性。

    基于深度学习构建肾透明细胞癌分级模型的方法

    公开(公告)号:CN116664523A

    公开(公告)日:2023-08-29

    申请号:CN202310642810.6

    申请日:2023-06-01

    Abstract: 本发明公开了基于深度学习构建肾透明细胞癌分级模型的方法,包括获取肾透明癌细胞患者的CT图像;CT图像进行切割,获得切割图像;对切割图像进行旋转生成操作并标注,基于RegNetY400MF、RegNetY800MF、SE‑ResNet50和ResNet101四类网络模型,以普通交叉熵为损失函数,使用旋转后的切割图像对四类网络模型进行预训练;在普通的交叉熵中加入噪声修正策略作为损失函数,对经过预训练的四类网络模型进行实际训练;实际训练完成后的四类网络模型基于输出概率最大的CT图像对患者的病理进行诊断,获得四类网络模型的表现AUC;以四类网络模型的表现AUC作为其权重,对患者的最终诊断进行加权计算,得到其最终诊断,本申请实现了更有效的模型集成,达到了更好的最终预测准确度。

    一种基于四元数旋转的时序知识图谱表示学习方法

    公开(公告)号:CN114756651A

    公开(公告)日:2022-07-15

    申请号:CN202210333887.0

    申请日:2022-03-30

    Abstract: 本发明涉及一种基于四元数旋转的时序知识图谱表示学习方法,包括:S1、给定一个四元组(h,r,t,τ),其中,h表示头实体,r表示关系,t表示尾实体,τ表示时间戳,将实体和时间信息进行融合并进行四元数空间中的旋转,完成模型的构建;S2、为了衡量四元组的有效性以及基于向量之间的夹角来衡量向量之间的相似性,设置评分函数对样本进行评分,并设置损失函数、参数正则化和设置时间平滑约束得到目标函数;S3、通过在时序知识图谱上的链接预测性能评估模型性能。本发明将实体随时间的动态演化特性建模为四元数空间中的旋转变换,能有效表达时序知识图谱中的复杂关系模型,通过添加参数正则化项和时序平滑约束项,可以有效提升原本模型的性能。

Patent Agency Ranking