-
公开(公告)号:CN119539003A
公开(公告)日:2025-02-28
申请号:CN202311113896.X
申请日:2023-08-30
Applicant: 富士通株式会社
IPC: G06N3/08 , G06N3/0455 , G06N3/0464 , G06N5/04 , G06T15/00 , G06V10/82
Abstract: 公开了神经网络训练装置、推理装置和介质。神经网络包括文本编码器、时间编码器、第一至第四Unet编码器、Unet解码器、第一至第三加法器。训练装置包括:获得单元,其通过对原始图像添加不同的噪声来获得噪声图像;输入单元,其将噪声图像输入第一Unet编码器,将对应于原始图像的线稿图像和噪声图像在分别通过第一和第二加法器相加后分别输入第二和第三Unet编码器,和将噪声图像和对应于原始图像的部分掩盖的图像在通过第三加法器相加后输入第四Unet编码器;和训练单元,其调整第三和第四Unet编码器的参数、并且保持文本编码器、时间编码器、第一和第二Unet编码器各自的参数不变,使得神经网络收敛,其中,Unet解码器的参数在训练期间可以被调整或者保持不变。
-
公开(公告)号:CN119294441A
公开(公告)日:2025-01-10
申请号:CN202310841075.1
申请日:2023-07-10
Applicant: 富士通株式会社
IPC: G06N3/0455 , G06N3/0464 , G06N3/08 , G06F40/126
Abstract: 公开了训练神经网络的方法和装置以及神经网络。神经网络包括文本编码器、时间编码器、第一至第三Unet编码器、Unet解码器、第一和第二加法器。方法包括:通过对原始图像添加噪声来获得输入图像;将输入图像输入第一Unet编码器,并且将对应于原始图像的线稿图像和输入图像在通过第一加法器相加后输入第二Unet编码器;将输入图像和线稿图像在通过第二加法器相加后输入第三Unet编码器;和,通过如下方式来训练神经网络:调整第三Unet编码器的参数、并且保持Unet解码器、文本编码器、时间编码器、第一和第二Unet编码器各自的参数不变,或者调整Unet解码器和第三Unet编码器各自的参数、并且保持文本编码器、时间编码器、第一和第二Unet编码器各自的参数不变。
-
公开(公告)号:CN116664902A
公开(公告)日:2023-08-29
申请号:CN202210147076.1
申请日:2022-02-17
Applicant: 富士通株式会社
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本公开涉及一种图像处理装置、图像处理方法和机器可读存储介质。图像处理装置包括:采样单元,对具有已知标签的基类图像数据集进行采样,得到伪基类支持集、伪新类支持集、伪基类查询集和伪新类查询集;第一训练单元,使用伪基类支持集和伪新类支持集通过预定约束来训练神经网络中的类代码生成模块,预定约束用于拉近相同类的类代码并且拉远不同类的类代码;以及第二训练单元,将伪基类查询集和伪新类查询集输入神经网络的特征提取模块,以训练神经网络的经训练的类代码生成模块和预测模块。该图像处理装置可以减少新增类的误分类并且提升目标检测性能。
-
公开(公告)号:CN118196441A
公开(公告)日:2024-06-14
申请号:CN202211548103.2
申请日:2022-12-05
Applicant: 富士通株式会社
Abstract: 公开了训练领域自适应神经网络的方法和装置、以及存储介质。该领域自适应神经网络包括对图像执行语义分割的第一分割单元和第二分割单元,以及辨别单元。该训练方法包括:使用已标注的源域图像对第一分割单元执行有监督训练,其中已标注的源域图像包括源域白天图像和源域夜晚图像;使用已标注的源域图像和未标注的目标域夜晚图像,对训练后的第一分割单元和辨别单元执行对抗训练,其中,辨别单元接收由训练后的第一分割单元生成的分割结果,并且确定分割结果是基于源域图像而生成的概率;利用对抗训练后的第一分割单元的参数对第二分割单元进行初始化;使用已标注的源域图像和未标注的目标域夜晚图像对初始化后的第二分割单元执行有监督训练。
-
公开(公告)号:CN116958614A
公开(公告)日:2023-10-27
申请号:CN202210338659.2
申请日:2022-04-01
Applicant: 富士通株式会社
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G10L25/30
Abstract: 本申请公开一种信息处理装置、信息处理方法和计算机可读记录介质。该信息处理状包括:第一训练单元,被配置成基于经训练的第二模型和经训练的第三模型,利用第一训练图像集对第一模型进行训练,以获得用于对待预测图像进行预测的经训练的第一模型。所述经训练的第三模型是利用第三训练图像集进行训练而得到的。所述第三训练图像集包括不能够利用所述经训练的第二模型正确预测的图像。
-
公开(公告)号:CN114519375A
公开(公告)日:2022-05-20
申请号:CN202011193915.0
申请日:2020-10-30
Applicant: 富士通株式会社
Abstract: 公开了用于神经网络的领域自适应的方法、设备和计算机可读存储介质。该方法包括:将来自源域的第一样本和第二样本与来自目标域的第三样本进行混合以得到混合样本,其中,第一样本、第二样本、第三样本和混合样本属于同一个类别;基于源域中的样本与混合样本之间的类内距离和类间距离之和构建第一损失函数,第一损失函数使得加权平均后的类内距离最小化并且使得加权平均后的类间距离最大化;基于第一损失函数和交叉熵损失函数之和,分别针对源域和由混合样本组成的混合域来构建第二损失函数;和利用源域的第二损失函数和混合域的第二损失函数两者来确定神经网络是否收敛,并且如果未收敛则重复进行以上步骤。
-
公开(公告)号:CN114118346A
公开(公告)日:2022-03-01
申请号:CN202010905766.X
申请日:2020-09-01
Applicant: 富士通株式会社
IPC: G06N3/04 , G06N3/08 , G06V10/764 , G06V10/82 , G06K9/62
Abstract: 本申请公开一种信息处理装置、信息处理方法和计算机可读存储介质。该信息处理装置包括:源数据集筛选单元,被配置成对真实类别已知的源数据集进行筛选,以去除属于非共享类别的源数据中的部分源数据;以及模型训练单元,被配置成利用目标数据集和经过筛选之后的剩余的源数据,对预先训练的分类模型进行进一步训练,以使综合损失符合预定条件,从而得到最终模型。目标数据集所包括的类别是源数据集所包括的类别的子集,并且共享类别是指所述子集中的类别。综合损失包括预先训练的分类模型的分类损失和修正损失。修正损失用于表征目标数据集中的被分类为非共享类别的目标数据的、通过预先训练的分类模型所得到的分类结果的误差。
-
公开(公告)号:CN117726827A
公开(公告)日:2024-03-19
申请号:CN202211089646.2
申请日:2022-09-07
Applicant: 富士通株式会社
IPC: G06V10/44 , G06V10/762 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开一种信息处理装置、信息处理方法和计算机可读记录介质。该信息处理装置包括:第一训练单元,利用第一训练图像集对第一模型进行训练,以获得经训练的第一模型;第二训练单元,利用第二训练图像集对经训练的第一模型进行训练,以获得再训练的第一模型作为第二模型;以及第三训练单元,利用第三训练图像集对所述第二模型进行训练,以获得再训练的第二模型作为第三模型。第一训练图像集包括涉及第一类别集合的带标签的训练图像。第二训练图像集包括涉及所述第一类别集合的带标签的训练图像和涉及第二类别集合的带标签的训练图像。第三训练图像集合包括涉及第一类别集合的带标签的训练图像和涉及第二类别集合的不带标签的训练图像。
-
公开(公告)号:CN116958561A
公开(公告)日:2023-10-27
申请号:CN202210332651.5
申请日:2022-03-31
Applicant: 富士通株式会社
IPC: G06V10/40 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048
Abstract: 公开了检测异常对象的方法、装置和存储介质。该方法包括:拍摄某一场景的图像;计算拍摄图像与参考图像之间的差图像,差图像指示拍摄图像与参考图像之间的像素级差异;由神经网络的第一编码器、第二编码器、第三编码器分别针对参考图像、拍摄图像、差图像提取具有多个尺寸的多个特征图;将编码器各自提取的具有相同尺寸的特征图进行融合,融合的特征图被输入神经网络的解码器;由解码器基于融合的特征图生成与拍摄图像尺寸相同的变化图,变化图中的每个像素的值指示拍摄图像中的像素相对于参考图像中的对应像素是否发生语义变化;以及基于变化图来识别场景中出现的异常对象。
-
公开(公告)号:CN115294418A
公开(公告)日:2022-11-04
申请号:CN202110412568.4
申请日:2021-04-16
Applicant: 富士通株式会社
IPC: G06V10/774 , G06V10/771 , G06V10/82 , G06N3/02 , G06T7/11
Abstract: 公开了应用于图像分割的领域自适应的方法和装置以及存储介质。该方法包括:将编码器针对源域图像提取的特征划分为第一源域特征和第二源域特征,将编码器针对目标域图像提取的特征划分为第一目标域特征和第二目标域特征;第一解码器基于第一源域特征执行图像分割并设置第一分割损失函数;第二解码器基于第一和第二目标域特征重建目标域图像并设置重建损失函数;第二解码器基于第一源域特征和第二目标域特征生成转换图像;第一解码器基于对转换图像提取的特征针对转换图像执行图像分割并设置第二分割损失函数;基于上述损失函数来训练编码器以及第一和第二解码器;利用经训练的编码器和第一解码器针对待处理的目标域图像执行图像分割。
-
-
-
-
-
-
-
-
-