-
公开(公告)号:CN111488757B
公开(公告)日:2023-06-23
申请号:CN201910073144.2
申请日:2019-01-25
Applicant: 富士通株式会社
IPC: G06V30/413 , G06V30/148
Abstract: 本申请公开了一种用于对图像的识别结果进行分割的方法和设备以及存储介质。该方法包括:识别图像中的文本以获得关于该文本的候选矩阵,其中,该候选矩阵中的每一行均代表所述文本的一个识别结果;将所述候选矩阵与文本库进行匹配以获得最佳匹配结果;计算所述最佳匹配结果与所述候选矩阵中的第1列至第j列的相似度,其中j是正整数并且小于或等于所述候选矩阵的总列数;和按照具有最大相似度的列数来分割所述图像的识别结果。
-
公开(公告)号:CN118820504A
公开(公告)日:2024-10-22
申请号:CN202310437395.0
申请日:2023-04-21
Applicant: 富士通株式会社
IPC: G06F16/583 , G06F16/538 , G06T9/00 , G06N3/0895
Abstract: 本公开涉及一种信息处理装置、信息处理方法和机器可读存储介质。信息处理装置可以包括:第一选择单元,其从第一图像‑文本对数据集中选择与第一图像‑文本对数据集中的第一文本最相似的第二文本,第二文本不同于第一文本;第一图像编码单元,其针对与第一文本对应的第一图像得到第一图像特征,并且针对与第二文本对应的第二图像得到第二图像特征;第一构建单元,其基于第一图像特征和第二图像特征构建第一损失函数;以及第一训练单元,其基于第一损失函数来训练第一图像编码单元。该信息处理装置可以学习跨模态表示,从而提高图像编码单元的特征提取性能。
-
公开(公告)号:CN117078950A
公开(公告)日:2023-11-17
申请号:CN202210501419.X
申请日:2022-05-10
Applicant: 富士通株式会社
Abstract: 本公开涉及一种图像处理装置、图像处理方法和机器可读存储介质。图像处理装置包括:全局特征提取模块,其针对特定场景的RGB图像提取RGB图像的全局特征信息,全局特征信息表示RGB图像的空间特征;局部特征提取模块,其针对特定场景的高光谱图像提取高光谱图像的局部特征信息,局部特征信息表示高光谱图像的光谱特征;融合单元,其融合RGB图像的全局特征信息和高光谱图像的局部特征信息;以及聚合模块,其使用融合的特征来检测特定场景中的特定对象,其中,全局特征提取模块、局部特征提取模块和聚合模块分别通过神经网络来实现。该图像处理装置可以通过结合基于RGB图像和高光谱图像提取的特征来实现输入图像中的特定成分检索。
-
公开(公告)号:CN111814781B
公开(公告)日:2024-08-27
申请号:CN201910288895.6
申请日:2019-04-11
Applicant: 富士通株式会社
IPC: G06V30/146 , G06V30/148
Abstract: 本申请公开了一种用于对图像块的识别结果进行校正的方法和设备以及存储介质。该方法包括:获得识别结果的候选矩阵,该候选矩阵的每一列代表相对应的图像块的识别结果的多个候选;确定树中的要搜索的节点的范围,该树是基于所述树中的每对节点所包含的内容之间的差异的度量来被构建的;以及通过将在所确定的范围内的所有节点所包含的内容与候选矩阵进行匹配,来校正识别结果。
-
公开(公告)号:CN111488757A
公开(公告)日:2020-08-04
申请号:CN201910073144.2
申请日:2019-01-25
Applicant: 富士通株式会社
Abstract: 本申请公开了一种用于对图像的识别结果进行分割的方法和设备以及存储介质。该方法包括:识别图像中的文本以获得关于该文本的候选矩阵,其中,该候选矩阵中的每一行均代表所述文本的一个识别结果;将所述候选矩阵与文本库进行匹配以获得最佳匹配结果;计算所述最佳匹配结果与所述候选矩阵中的第1列至第j列的相似度,其中j是正整数并且小于或等于所述候选矩阵的总列数;和按照具有最大相似度的列数来分割所述图像的识别结果。
-
公开(公告)号:CN114998917A
公开(公告)日:2022-09-02
申请号:CN202110192493.3
申请日:2021-02-20
Applicant: 富士通株式会社
IPC: G06V30/413 , G06V30/18 , G06V30/19 , G06V10/82 , G06F40/263
Abstract: 本申请公开一种图像处理装置、图像处理方法和计算机可读存储介质。该图像处理装置包括:特征提取单元,被配置成提取输入图像的特征;文本检测单元,被配置成基于通过所述特征提取单元所提取的所述特征检测所述输入图像中的文本;语种识别单元,被配置成识别所述文本检测单元所检测到的文本的语种;文本识别单元,被配置成基于所述语种识别单元的识别结果来识别所检测到的所述文本,以获得至少一个字符串集合;以及第一分类单元,被配置成通过将所述至少一个字符串集合和预定字符串集合进行匹配,来对所述输入图像进行分类,以获得表示所述输入图像所涉及的对象的类别的第一分类结果,以供获取所述对象的类别的最终分类结果。
-
公开(公告)号:CN113269181A
公开(公告)日:2021-08-17
申请号:CN202010093279.8
申请日:2020-02-14
Applicant: 富士通株式会社
Abstract: 公开了一种信息处理装置、信息处理方法及计算机可读记录介质。信息处理装置包括:检测单元,被配置成检测图像中包括的至少一个文本行中的每个文本行的起始点和末尾点;预测单元,被配置成针对每个文本行,根据基于该文本行的起始点从图像提取出的与起始点对应的图像块来预测该文本行的第一基线点,并且根据基于第N基线点从图像提取出的与第N基线点对应的图像块来预测该文本行的第N+1基线点,从而预测出用于表示该文本行的路径轨迹的多个基线点,其中,N=1,2,…,M,M为大于等于2的正整数;以及获得单元,被配置成基于每个文本行的起始点、多个基线点以及末尾点,获得该文本行的修正图像。
-
公开(公告)号:CN111814781A
公开(公告)日:2020-10-23
申请号:CN201910288895.6
申请日:2019-04-11
Applicant: 富士通株式会社
Abstract: 本申请公开了一种用于对图像块的识别结果进行校正的方法和设备以及存储介质。该方法包括:获得识别结果的候选矩阵,该候选矩阵的每一列代表相对应的图像块的识别结果的多个候选;确定树中的要搜索的节点的范围,该树是基于所述树中的每对节点所包含的内容之间的差异的度量来被构建的;以及通过将在所确定的范围内的所有节点所包含的内容与候选矩阵进行匹配,来校正识别结果。
-
-
-
-
-
-
-