用于视觉任务预测的方法、设备和计算机可读存储介质

    公开(公告)号:CN114078086A

    公开(公告)日:2022-02-22

    申请号:CN202010806369.7

    申请日:2020-08-12

    Abstract: 公开了用于视觉任务预测的方法、设备和计算机可读存储介质。该方法包括:合成第一图像和第二图像以获得多个合成图像,每个合成图像基于第二图像所覆盖的所有频带之一得到,第一图像具有高于第二图像的空间分辨率和低于第二图像的光谱分辨率;在与所有频带中的任意N个频带组合相对应的合成图像组合之中,确定在已经针对第一图像训练的代理模型上性能最好的一个或更多个合成图像组合,其中,N是大于或等于2的整数,以及其中,N个频带分别对应于第一图像的N个通道;以及使用基于第一图像训练的视觉任务预测模型来从所确定的一个或更多个合成图像组合之中选择在目标视觉任务上表现最优的合成图像组合用于执行视觉任务。

    更新双路多模态模型的方法和装置及计算机可读存储介质

    公开(公告)号:CN118940791A

    公开(公告)日:2024-11-12

    申请号:CN202310524691.4

    申请日:2023-05-10

    Abstract: 公开了更新双路多模态模型的方法和装置及介质。方法包括:获得包括唯一标识符和待更新类别的名称的第一文本集合、仅包括待更新类别的名称的第二文本集合和包括非更新类别的名称的第三文本集合;通过使基于第一文本集合获得的、属于待更新类别的更新文本特征均值与属于该待更新类别的训练样本特征之间的距离最小,构建第一损失函数;通过使基于第二文本集合获得的原始文本特征与更新文本特征之间的距离最小,构建第二损失函数;通过使基于第三文本集合获得的、属于非更新类别的原始文本特征均值与上述更新文本特征均值之间的距离最大,构建第三损失函数;通过使由第一、第二和第三损失函数的加权之和构成的总损失函数最小,更新双路多模态模型。

    信息处理装置、信息处理方法和预测设备

    公开(公告)号:CN115222010A

    公开(公告)日:2022-10-21

    申请号:CN202110411394.X

    申请日:2021-04-16

    Abstract: 本申请公开一种信息处理装置、信息处理方法和预测设备。该信息处理装置包括:模型选择单元,被配置成基于多个深度神经网络模型的稳定性和精度指标变化趋势一致性中至少之一以及综合预测精度从多个深度神经网络模型中选择至少两个深度神经网络模型,以用于对待预测对象进行预测。综合预测精度通过至少两个精度指标表征。稳定性是指相应的深度神经网络模型在所述至少两个精度指标中的每个精度指标方面的稳定性。精度指标变化趋势一致性是指相应的深度神经网络模型的所述至少两个精度指标的变化趋势的一致性。

    用于处理多模态媒体片段的信息处理装置和方法

    公开(公告)号:CN118644798A

    公开(公告)日:2024-09-13

    申请号:CN202310244394.4

    申请日:2023-03-13

    Abstract: 公开了一种用于处理多模态媒体片段的信息处理装置、信息处理方法和计算机可读存储介质。该信息处理装置包括:匹配程度计算单元,被配置成针对多模态媒体片段包括的多个单元信号中的每一单元信号,计算该单元信号与关于关注目标的多个类别中的每个类别之间的匹配程度;类别确定单元,被配置成针对多个单元信号中的每一单元信号,基于匹配程度计算单元计算出的该单元信号与多个类别中的每个类别之间的匹配程度来确定该单元信号所涉及的类别;以及变化趋势确定单元,被配置成基于类别确定单元所确定的多个单元信号所涉及的类别或者多个单元信号所涉及的类别和相应的匹配程度,确定关注目标随时间的变化趋势。

    定位已识别文本行中的每个字符的方法、设备和存储介质

    公开(公告)号:CN113627420B

    公开(公告)日:2025-01-03

    申请号:CN202010386382.1

    申请日:2020-05-09

    Abstract: 本申请公开了一种用于定位已识别的文本行中的每个字符的方法和设备以及计算机可读存储介质。该方法包括:步骤S1:给所述文本行中的每个字符标记核心笔画,所述标记指示笔画属于所述文本行中的哪个字符;步骤S2:基于已标记的笔画,对与该已标记的笔画粘连的未标记的粘连笔画和未标记的孤立笔画进行标记,其中,所述孤立笔画是指在两个已标记笔画之间仅有的一个未标记笔画;和步骤S3:将前N对或前M%对彼此相隔最近的两个相邻笔画合并在一起,其中,所述两个相邻笔画没有被标记至不同的字符,以及其中,N是大于或等于1的整数,并且M是0至100之间的任意数值,重复进行步骤S2和S3,直到所有笔画都被标记到所述文本行中的字符为止。

    图像分割方法、装置和存储介质
    6.
    发明公开

    公开(公告)号:CN116664472A

    公开(公告)日:2023-08-29

    申请号:CN202210153314.X

    申请日:2022-02-18

    Abstract: 公开了图像分割方法、装置和存储介质。一种利用神经网络对多模态病理图像执行图像分割的方法,该多模态病理图像至少包括第一和第二模态图像,该神经网络至少包括第一模态图像处理部分、第二模态图像处理部分和特征融合部分,该方法包括:由第一和第二模态图像处理部分分别针对第一和第二模态图像提取第一和第二特征;由特征融合部分通过融合第一特征和第二特征而生成第一融合特征和第二融合特征;第一和第二模态图像处理部分分别基于第一和第二融合特征对相应模态图像执行图像分割,分割预测结果被合并作为最终分割结果;分别基于第一和第二损失函数训练第一和第二模态图像处理部分;利用经训练的神经网络对待分割的多模态图像执行图像分割。

    选择波段的方法和装置及生成光谱图像处理模型的方法

    公开(公告)号:CN116263939A

    公开(公告)日:2023-06-16

    申请号:CN202111507978.3

    申请日:2021-12-10

    Abstract: 本公开内容涉及选择波段的方法和装置及生成光谱图像处理模型的方法。根据本公开内容的一个实施例,该选择波段的方法包括:基于使用包含与N个波段的第一波段集对应的光谱响应的作为训练样本的第一类对象训练的第一光谱图像处理模型的第一个二维卷积层,生成表征N个波段中的各波段之间的相似性的第一波段集相似性矩阵;以及至少基于第一波段集相似性矩阵从N个波段中选择n个波段作为与第二光谱图像处理模型相关联的第二波段集;其中,N>n。本公开内容的方法和装置的有益效果包括以下中的至少一个:减少计算成本,改善模型的准确度性能,减少测试数据的采集时间,以及降低测试数据采集成本。

    用于图像处理的方法、设备和存储介质

    公开(公告)号:CN115294417A

    公开(公告)日:2022-11-04

    申请号:CN202110411425.1

    申请日:2021-04-16

    Abstract: 公开了用于图像处理的方法、设备和存储介质。该方法包括:通过预处理获得图像的概率图;对概率图进行降采样,然后基于不同的降采样方法、阈值和分辨率的组合对概率图进行多维度特征提取;将提取的特征输入全图分类模型,并且获得不同的阈值和分辨率的所有参数组合中的前N个分类精度最高的组合;基于前N个组合,利用全图分类模型从提取的特征中选择前M维重要性分数最高的特征;基于M维特征,利用全图分类模型从所有参数组合中选择前N’个分类精度最高的组合;和基于在前N’个组合中的一种组合下的前M维重要性分数最高的特征,利用全图分类模型对图像进行分类,其中N、N’和M是大于零的整数。

    定位已识别文本行中的每个字符的方法、设备和存储介质

    公开(公告)号:CN113627420A

    公开(公告)日:2021-11-09

    申请号:CN202010386382.1

    申请日:2020-05-09

    Abstract: 本申请公开了一种用于定位已识别的文本行中的每个字符的方法和设备以及计算机可读存储介质。该方法包括:步骤S1:给所述文本行中的每个字符标记核心笔画,所述标记指示笔画属于所述文本行中的哪个字符;步骤S2:基于已标记的笔画,对与该已标记的笔画粘连的未标记的粘连笔画和未标记的孤立笔画进行标记,其中,所述孤立笔画是指在两个已标记笔画之间仅有的一个未标记笔画;和步骤S3:将前N对或前M%对彼此相隔最近的两个相邻笔画合并在一起,其中,所述两个相邻笔画没有被标记至不同的字符,以及其中,N是大于或等于1的整数,并且M是0至100之间的任意数值,重复进行步骤S2和S3,直到所有笔画都被标记到所述文本行中的字符为止。

Patent Agency Ranking