图像的半监督分割方法、装置、终端设备、介质以及产品

    公开(公告)号:CN117576384A

    公开(公告)日:2024-02-20

    申请号:CN202311385658.4

    申请日:2023-10-23

    Abstract: 本申请公开了一种图像的半监督分割方法、装置、终端设备、介质以及产品,属于图像语义分割技术领域,该方法包括:包括:根据半监督分割模型对无标签图像的预测结果确定模糊正类和模糊负类;根据所述模糊正类和所述模糊负类对所述半监督分割模型的优化目标进行调整,以得到优化后的半监督分割模型;基于所述优化后的半监督分割模型对无标签图像进行语义分割。采用本申请技术方案能够令半监督分割模型具备对模型自身错误进行调整的能力,从而解决现有基于半监督学习思想的语义分割模型会在模型训练过程中引入错误的梯度信息,从而使得训练得到的语义分割模型难以对无标签数据做出准确的测预测结果的技术问题。

    层自适应位置编码设计方法、装置、设备及存储介质

    公开(公告)号:CN117422107A

    公开(公告)日:2024-01-19

    申请号:CN202311281543.0

    申请日:2023-09-28

    Abstract: 本申请提供一种层自适应位置编码设计方法、装置、设备及存储介质,涉及机器学习技术领域,层自适应位置编码设计方法包括:将token表征作为视觉模型的第零层编码器的输入,并基于第零层的自适应仿射变换系数对初始位置编码进行层归一化处理,得到中间位置编码,将中间位置编码添加至第零层编码器中得到输出;将第零层编码器的输出作为第零层的下一层编码器的输入,以执行下一层编码器基于自适应位置编码的编码操作,得到下一层编码器的输出;再将下一层编码器的输出作为新的输入以循环执行各层级编码器基于自适应位置编码的编码操作,直至循环至最后一层时,将最后一层级编码器的输出作为视觉模型的输出,以构建包含层自适应位置编码的视觉模型。

    细胞核实例分割方法、装置、终端设备及存储介质

    公开(公告)号:CN117372692A

    公开(公告)日:2024-01-09

    申请号:CN202311287467.4

    申请日:2023-09-27

    Inventor: 陈杰 王珺 李剑霞

    Abstract: 本申请公开了一种细胞核实例分割方法、装置、终端设备以及计算机可读存储介质,属于图像处理技术领域,该方法通过将包含细胞核实例的原始图像输入至预设分割模型得到原始图像的预测图;基于预测图和原始图像的模型训练标签,计算预设分割模型的像素级损失和拓扑感知损失,其中,拓扑感知损失表征预测图中拓扑结构的正确性;基于像素级损失和拓扑感知损失对预设分割模型进行优化。本申请提供一种细胞核实例分割策略,提高了细胞核实例弱边界识别的准确性。

    基于路径规划和信息融合的多无人机协同搜索方法及系统

    公开(公告)号:CN107844129B

    公开(公告)日:2021-03-23

    申请号:CN201711238255.1

    申请日:2017-11-30

    Abstract: 本发明提供一种基于路径规划和信息融合的多无人机协同搜索方法及系统,所述多无人机协同搜索方法包括以下步骤:实时路径规划步骤,无人机根据当前的地图信息,根据算法决定下一时刻的运动以及观察对象;搜索地图更新步骤,根据观察结果更新概率地图和确定度地图;信息融合步骤,每架无人机广播自己的地图信息并接受其他无人机的地图信息,计算实时的搜索地图信息;决策制定步骤,利用更新后的地图信息判断目标是否存在无人机当前位置,进而根据所述确定度地图辅助决策的制定。本发明能够显著改善搜索时间,减小任务执行的飞行代价,提高搜索准确性,并且还创新性地融合了实时路径规划和信息融合机制,使得搜索机制更完善、更高效且更可靠。

    三维动态场景渲染方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN119048662A

    公开(公告)日:2024-11-29

    申请号:CN202411499103.7

    申请日:2024-10-25

    Abstract: 本申请公开了一种三维动态场景渲染方法、装置、设备、存储介质及程序产品,涉及三维重建技术领域,所述方法包括:接收目标初始场景的多点视频流,所述多点视频流通过若干个相机对所述目标初始场景进行多视角连续拍摄得到;根据所述多点视频流进行三维场景重建,得到初始场景表示;基于所述初始场景表示进行场景运动变化学习,得到场景运动变化参数;将所述场景运动变化参数以数据流的形式发送至客户端,由所述客户端根据所述场景运动变化参数渲染生成场景视图。实现了自由视点视频可流式传输的三维动态场景重建,解决了现有技术自由视点视频无法实现可流式传输的三维动态场景重建,渲染速度慢的问题,提高了自由视点视频的渲染速度。

    视频人群计数方法、装置、终端设备及存储介质

    公开(公告)号:CN116665117A

    公开(公告)日:2023-08-29

    申请号:CN202310284619.9

    申请日:2023-03-10

    Abstract: 本发明公开了一种视频人群计数方法、装置、设备及存储介质,该方法通过将待计数图像序列对应的待计数图像特征输入至目标深度神经网络模型的解码器;通过局部空间自注意力模块提取待计数图像特征中的第一空间特征;通过全局时间自注意力模块提取待计数图像特征中的第一时间特征;通过目标深度神经网络模型基于第一空间特征和第一时间特征生成第一人群密度图,并基于第一人群密度图确定待计数图像序列对应的目标人群密度图;通过目标深度神经网络模型对待计数图像序列对应的目标人群密度图进行逐像素相加,得到待计数图像序列对应的人群计数结果。本发明实现了在人群计数算法中体现图像序列间的时空相关性,并提升算法计数精度。

    基于路径规划和信息融合的多无人机协同搜索方法及系统

    公开(公告)号:CN107844129A

    公开(公告)日:2018-03-27

    申请号:CN201711238255.1

    申请日:2017-11-30

    CPC classification number: G05D1/12

    Abstract: 本发明提供一种基于路径规划和信息融合的多无人机协同搜索方法及系统,所述多无人机协同搜索方法包括以下步骤:实时路径规划步骤,无人机根据当前的地图信息,根据算法决定下一时刻的运动以及观察对象;搜索地图更新步骤,根据观察结果更新概率地图和确定度地图;信息融合步骤,每架无人机广播自己的地图信息并接受其他无人机的地图信息,计算实时的搜索地图信息;决策制定步骤,利用更新后的地图信息判断目标是否存在无人机当前位置,进而根据所述确定度地图辅助决策的制定。本发明能够显著改善搜索时间,减小任务执行的飞行代价,提高搜索准确性,并且还创新性地融合了实时路径规划和信息融合机制,使得搜索机制更完善、更高效且更可靠。

    基于位置预测的无人机自组网地理信息路由方法及系统

    公开(公告)号:CN107819686A

    公开(公告)日:2018-03-20

    申请号:CN201710958935.4

    申请日:2017-10-16

    Abstract: 本发明提供一种基于位置预测的无人机自组网地理信息路由方法及系统,属于无人机自组网通讯领域。本发明方法包括如下步骤:建立邻居节点表,其中,所述邻居节点表包括邻居节点ID号、及与所述邻居节点ID号对应的位置信息容器,所述位置信息容器中能够存储window个接收该邻居节点信标的时间及位置信息;根据邻居节点的位置信息容器中的信息预测邻居节点位置;根据预测的各个邻居节点位置进行路由决策。本发明的有益效果为:位置预测机制解决了由于位置信息滞后带来的路由决策错误,能够减少20%以上的无人机自组织网络通信过程中的丢包率。

    三维动态场景渲染方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN119048662B

    公开(公告)日:2025-02-18

    申请号:CN202411499103.7

    申请日:2024-10-25

    Abstract: 本申请公开了一种三维动态场景渲染方法、装置、设备、存储介质及程序产品,涉及三维重建技术领域,所述方法包括:接收目标初始场景的多点视频流,所述多点视频流通过若干个相机对所述目标初始场景进行多视角连续拍摄得到;根据所述多点视频流进行三维场景重建,得到初始场景表示;基于所述初始场景表示进行场景运动变化学习,得到场景运动变化参数;将所述场景运动变化参数以数据流的形式发送至客户端,由所述客户端根据所述场景运动变化参数渲染生成场景视图。实现了自由视点视频可流式传输的三维动态场景重建,解决了现有技术自由视点视频无法实现可流式传输的三维动态场景重建,渲染速度慢的问题,提高了自由视点视频的渲染速度。

    图像处理方法、装置、终端设备、存储介质以及程序产品

    公开(公告)号:CN117576382A

    公开(公告)日:2024-02-20

    申请号:CN202311376053.9

    申请日:2023-10-23

    Abstract: 本申请公开了一种图像处理方法、装置、终端设备、存储介质以及程序产品,属于图像处理技术领域,该方法包括:在基于弱监督语义分割的图像中确定集合外像素;将所述集合外像素划分为集合内类组和集合外类组;调制所述集合内类组和所述集合外类组的类中心与所述集合外像素之间的距离,以对所述集合外像素进行类别校正。采用本申请技术方案能够对集合外像素进行处理以将错误的集合外像素转移到集合内中,进而避免弱监督语义分割中伪标签存在的噪声对于分割网络训练的影响,提升语义分割模型针对图像像素分类预测的正确概率。

Patent Agency Ranking