-
公开(公告)号:CN117409019B
公开(公告)日:2024-08-30
申请号:CN202311191861.8
申请日:2023-09-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T7/11 , G06T7/194 , G06N3/0464 , G06N3/0455 , G06N3/0985 , G06N20/20
Abstract: 本发明公开了一种基于集成学习的多模态脑肿瘤图像分割方法及系统,涉及脑肿瘤图像分割技术领域,包括获取四个模态的脑肿瘤图像并进行预处理,得到预处理后的图像数据;分别输入集成模型中进行训练,得出每个模态的图像分割结果;使用元学习获取每个模态的所占权重,对每个模态的图像分割结果进行集成,得出最终预测结果。本发明采用集成学习方法,将多个模型和多个模态的信息结合,有效提高预测和决策的准确性和鲁棒性,减少过拟合,增强模型泛化能力,预测结果更加稳定和可靠;引入注意力机制和自注意机制,提高图像分割的效果和效率,增强图像分割的性能;通过元学习帮助集成学习更加精确地选取模型组合,提高整体模型的性能。
-
公开(公告)号:CN117409019A
公开(公告)日:2024-01-16
申请号:CN202311191861.8
申请日:2023-09-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T7/11 , G06T7/194 , G06N3/0464 , G06N3/0455 , G06N3/0985 , G06N20/20
Abstract: 本发明公开了一种基于集成学习的多模态脑肿瘤图像分割方法及系统,涉及脑肿瘤图像分割技术领域,包括获取四个模态的脑肿瘤图像并进行预处理,得到预处理后的图像数据;分别输入集成模型中进行训练,得出每个模态的图像分割结果;使用元学习获取每个模态的所占权重,对每个模态的图像分割结果进行集成,得出最终预测结果。本发明采用集成学习方法,将多个模型和多个模态的信息结合,有效提高预测和决策的准确性和鲁棒性,减少过拟合,增强模型泛化能力,预测结果更加稳定和可靠;引入注意力机制和自注意机制,提高图像分割的效果和效率,增强图像分割的性能;通过元学习帮助集成学习更加精确地选取模型组合,提高整体模型的性能。
-
公开(公告)号:CN116563303B
公开(公告)日:2023-10-27
申请号:CN202310842854.3
申请日:2023-07-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供一种场景可泛化的交互式辐射场分割方法,涉及图像处理技术领域,方法包括:获取2D图像中的点击点,根据点击点生成2D交互引导图;对2D交互引导图进行扩散处理,得到3D交互引导图,3D交互引导图中的各个网格点对应的值分别反映3D辐射场的各个网格点与点击点之间的相似性;将3D交互引导图和3D辐射场对应的3D不透明度体素模型连接后输入至3D分割神经网络模型,获取前景概率预测体素模型,前景概率预测体素模型中的各个网格点对应一个前景概率预测值,前景概率预测值反映网格点为前景部分的概率;基于前景概率预测体素模型输出3D场景中的前景部分以实现辐射场分割。本发明可以实现场景可泛化的辐射场分割。
-
公开(公告)号:CN116563840A
公开(公告)日:2023-08-08
申请号:CN202310828211.3
申请日:2023-07-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V20/62 , G06V20/70 , G06V30/14 , G06V30/18 , G06V10/82 , G06V30/19 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/0895
Abstract: 本发明提供基于弱监督跨模态对比学习的场景文本检测与识别方法,涉及图像处理技术领域。方法包括:将待识别图像输入至文本识别模型中的第一图像编码器得到第一图像特征图;基于第一图像特征图获取概率特征图、字符位置特征图以及字符语义特征图;基于概率特征图、字符位置特征图和字符语义特征图中确定待识别图像中的文本识别结果;文本识别模型是基于多组包括样本待识别图像以及样本待识别图像对应的第一文本内容标签和文本区域位置标签的第一训练数据训练得到的;文本区域位置标签是基于标签生成模型生成的,标签生成模型基于多组包括样本待标注图像以及样本待标注图像中的第二文本内容标签的第二训练数据训练得到。本发明可以降低标注成本。
-
公开(公告)号:CN116563303A
公开(公告)日:2023-08-08
申请号:CN202310842854.3
申请日:2023-07-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供一种场景可泛化的交互式辐射场分割方法,涉及图像处理技术领域,方法包括:获取2D图像中的点击点,根据点击点生成2D交互引导图;对2D交互引导图进行扩散处理,得到3D交互引导图,3D交互引导图中的各个网格点对应的值分别反映3D辐射场的各个网格点与点击点之间的相似性;将3D交互引导图和3D辐射场对应的3D不透明度体素模型连接后输入至3D分割神经网络模型,获取前景概率预测体素模型,前景概率预测体素模型中的各个网格点对应一个前景概率预测值,前景概率预测值反映网格点为前景部分的概率;基于前景概率预测体素模型输出3D场景中的前景部分以实现辐射场分割。本发明可以实现场景可泛化的辐射场分割。
-
公开(公告)号:CN117541512A
公开(公告)日:2024-02-09
申请号:CN202311664982.X
申请日:2023-12-05
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T5/77 , G06N3/0464 , G06N3/08
Abstract: 本发明提供基于持续学习的图像恢复模型生成方法及图像恢复方法,涉及图像处理技术领域,方法包括:获取目标退化类型对应的基线模型和训练集,训练集包括第一训练集和第二训练集,第一训练集中的训练数据组少于第二训练集中的训练数据组,每个训练数据组中包括样本待恢复图像以及样本待恢复图像对应的恢复图像;基于第一训练集对目标退化类型对应的基线模型进行训练,得到目标退化类型对应的目标模型;基于目标退化类型对应的目标模型和基线模型确定关键卷积核;基于第二训练集对基线模型进行训练,更新关键卷积核的参数,得到目标退化类型对应的图像恢复模型。本发明可以提高多种图像恢复任务的图像恢复模型的生成效率。
-
公开(公告)号:CN116563840B
公开(公告)日:2023-09-05
申请号:CN202310828211.3
申请日:2023-07-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V20/62 , G06V20/70 , G06V30/14 , G06V30/18 , G06V10/82 , G06V30/19 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/0895
Abstract: 本发明提供基于弱监督跨模态对比学习的场景文本检测与识别方法,涉及图像处理技术领域。方法包括:将待识别图像输入至文本识别模型中的第一图像编码器得到第一图像特征图;基于第一图像特征图获取概率特征图、字符位置特征图以及字符语义特征图;基于概率特征图、字符位置特征图和字符语义特征图中确定待识别图像中的文本识别结果;文本识别模型是基于多组包括样本待识别图像以及样本待识别图像对应的第一文本内容标签和文本区域位置标签的第一训练数据训练得到的;文本区域位置标签是基于标签生成模型生成的,标签生成模型基于多组包括样本待标注图像以及样本待标注图像中的第二文本内容标签的第二训练数据训练得到。本发明可以降低标注成本。
-
公开(公告)号:CN118015287A
公开(公告)日:2024-05-10
申请号:CN202410419473.9
申请日:2024-04-09
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/26 , G06V10/776
Abstract: 本发明提供一种基于域纠正适应器的跨域小样本分割方法,涉及图像处理技术领域。方法包括:获取待分割图像,将待分割图像输入至已训练的特征提取层,得到待处理特征图;将待处理特征图输入至已训练的域纠正器,获取域纠正器输出的纠正特征图,域纠正器用于纠正待处理特征图的域与基准域的域差异;将纠正特征图输入至已训练的分割模块,获取分割模块输出的图像分割结果;其中,域纠正器与域扰乱器共同基于多组训练数据训练得到,每组训练数据包括样本待分割图像以及样本待分割图像对应的分割结果标签,样本待分割图像的域为基准域,域扰乱器用于对图像添加域扰动以实现对不同域的模拟。本发明可以提高对跨域的图像的分割准确度。
-
公开(公告)号:CN118015287B
公开(公告)日:2024-06-21
申请号:CN202410419473.9
申请日:2024-04-09
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/26 , G06V10/776
Abstract: 本发明提供一种基于域纠正适应器的跨域小样本分割方法,涉及图像处理技术领域。方法包括:获取待分割图像,将待分割图像输入至已训练的特征提取层,得到待处理特征图;将待处理特征图输入至已训练的域纠正器,获取域纠正器输出的纠正特征图,域纠正器用于纠正待处理特征图的域与基准域的域差异;将纠正特征图输入至已训练的分割模块,获取分割模块输出的图像分割结果;其中,域纠正器与域扰乱器共同基于多组训练数据训练得到,每组训练数据包括样本待分割图像以及样本待分割图像对应的分割结果标签,样本待分割图像的域为基准域,域扰乱器用于对图像添加域扰动以实现对不同域的模拟。本发明可以提高对跨域的图像的分割准确度。
-
公开(公告)号:CN118014048A
公开(公告)日:2024-05-10
申请号:CN202410167554.4
申请日:2024-02-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种低照度人脸检测模型构建方法、装置及终端。方法包括:获取源域和目标域;获取初始模型,所述初始模型包括学生模型和教师模型;基于所述源域对所述学生模型进行监督训练,得到初始模型参数和第一监督损失;基于所述初始模型参数和所述第一监督损失对所述学生模型和所述教师模型进行交互监督学习,得到目标检测模型。本发明提供的低照度人脸检测模型构建方法能更好的识别低照度环境下的人脸,提高人脸检测模型的检测性能。
-
-
-
-
-
-
-
-
-