-
公开(公告)号:CN117521071A
公开(公告)日:2024-02-06
申请号:CN202311326860.X
申请日:2023-10-13
Applicant: 北京大学深圳研究生院
IPC: G06F21/57 , G06F21/71 , G06V10/764
Abstract: 本发明提出一种多目标对抗样本生成方法、系统、设备及计算机存储介质,应用于图像数据处理技术领域,所述方法包括:获取待检测图像,并在所述待检测图像中确定与多个目标各自对应的目标区域;基于多个所述目标各自对应的实际值和多个所述目标各自对应的预测值,得到多个所述目标各自对应的损失度;基于多个所述损失度对多个所述目标区域中的像素进行更新,并基于更新后的待检测图像生成对抗样本。本发明技术方案能够平衡的攻击待检测图像中的各个目标,因此,本方案能够解决旨传统的对抗样本攻击检测器效果欠佳的技术问题。
-
公开(公告)号:CN116665117A
公开(公告)日:2023-08-29
申请号:CN202310284619.9
申请日:2023-03-10
Applicant: 北京大学深圳研究生院
Abstract: 本发明公开了一种视频人群计数方法、装置、设备及存储介质,该方法通过将待计数图像序列对应的待计数图像特征输入至目标深度神经网络模型的解码器;通过局部空间自注意力模块提取待计数图像特征中的第一空间特征;通过全局时间自注意力模块提取待计数图像特征中的第一时间特征;通过目标深度神经网络模型基于第一空间特征和第一时间特征生成第一人群密度图,并基于第一人群密度图确定待计数图像序列对应的目标人群密度图;通过目标深度神经网络模型对待计数图像序列对应的目标人群密度图进行逐像素相加,得到待计数图像序列对应的人群计数结果。本发明实现了在人群计数算法中体现图像序列间的时空相关性,并提升算法计数精度。
-
公开(公告)号:CN118535066A
公开(公告)日:2024-08-23
申请号:CN202410515382.5
申请日:2024-04-26
Applicant: 北京大学深圳研究生院
IPC: G06F3/04845 , G06N20/00 , G06V10/26
Abstract: 本申请公开了一种交互式分割方法、装置、设备及存储介质,涉及图像分割技术领域,所述的方法包括:监测用户在预设区域内的区域选取位置和区域选取粒度信息;根据位置和粒度信息通过目标交互式分割模型进行区域分割,目标交互式分割模型可以基于多种粒度的掩码粒度对对模型进行粒度可控训练获得。本申请中通过多种粒度的掩码粒度对为指导模型学习粒度控制能力提供了数据基础;使得模型能够快速掌握粒度控制能力,通过监测用户在预设区域内的区域选取位置和区域选取粒度,根据可控训练后的交互式分割模型能够根据用户点击的位置和量化分割粒度输出单一的分割掩码,从而使得用户精准控制模型的分割粒度,并且更好的解决了空间歧义问题。
-
公开(公告)号:CN117576382A
公开(公告)日:2024-02-20
申请号:CN202311376053.9
申请日:2023-10-23
Applicant: 北京大学深圳研究生院
IPC: G06V10/26 , G06N3/0895 , G06V10/82 , G06V10/764 , G06V10/30
Abstract: 本申请公开了一种图像处理方法、装置、终端设备、存储介质以及程序产品,属于图像处理技术领域,该方法包括:在基于弱监督语义分割的图像中确定集合外像素;将所述集合外像素划分为集合内类组和集合外类组;调制所述集合内类组和所述集合外类组的类中心与所述集合外像素之间的距离,以对所述集合外像素进行类别校正。采用本申请技术方案能够对集合外像素进行处理以将错误的集合外像素转移到集合内中,进而避免弱监督语义分割中伪标签存在的噪声对于分割网络训练的影响,提升语义分割模型针对图像像素分类预测的正确概率。
-
公开(公告)号:CN117437444A
公开(公告)日:2024-01-23
申请号:CN202311259137.4
申请日:2023-09-26
Applicant: 北京大学深圳研究生院
IPC: G06V10/75 , G06V10/24 , G06V10/40 , G06V30/19 , G06V10/774
Abstract: 本申请公开了一种视频问题回复模型的构建方法、终端设备及计算机介质,涉及人工智能技术领域,包括:提取视频内容包含的各视频特征,和文本内容包含的各文本特征;对各视频特征进行处理以得到各稀疏视频特征,并对各问题文本特征进行处理以得到各稀疏问题文本特征;基于稀疏视频特征、各稀疏问题文本特征及答案文本特征计算得到各收益函数值和各对齐预测值,并基于各收益函数值和各对齐预测值得到第一损失函数;基于各稀疏视频特征和各稀疏问题文本特征得到预测答案向量,并根据预设的标准答案向量和预测答案向量得到第二损失函数;根据第一损失函数和第二损失函数构建得到目标视频问题回复模型。
-
公开(公告)号:CN116935041A
公开(公告)日:2023-10-24
申请号:CN202310261009.7
申请日:2023-03-10
Applicant: 北京大学深圳研究生院
IPC: G06V10/26 , G06V10/40 , G06T7/194 , G06V10/764 , G06N3/08 , G06V10/82 , G06V10/774 , G06N3/0464
Abstract: 本发明涉及图像处理的技术领域,尤其涉及一种小样本语义分割方法、装置、设备及存储介质,该小样本语义分割方法包括:获取待分割图片,并获取基于编码‑解码结构构建的目标分割模型;通过所述目标分割模型的编码器对所述待分割图片进行特征提取得到目标特征;通过所述目标分割模型对所述待分割图片进行前景分割和背景分割得到背景分割图,并融合所述目标特征和所述背景分割图得到分割特征;通过所述目标分割模型的解码器对所述分割特征进行解码得到特征图像,并将所述特征图像输入所述目标分割模型中的分类器得到标注类别的分割结果。本发明实现了提高小样本语义分割的准确性。
-
公开(公告)号:CN116258860A
公开(公告)日:2023-06-13
申请号:CN202310262703.0
申请日:2023-03-10
Applicant: 北京大学深圳研究生院
IPC: G06V10/26 , G06V10/764 , G06V10/82 , G06N3/084
Abstract: 本发明公开了一种图像实例分割方法、设备及介质,利用对齐查询学习模块基于地面真值掩码和像素嵌入特征图生成对齐查询,通过自注意力变换解码器基于对齐查询得到预测分割掩码和预测分类,基于第一预设学习损失函数计算预测分割掩码与预设标准分割掩码之间的第一误差和基于第二预设学习损失函数计算预测分类与预设标准分类之间的第二误差,根据第一误差和第二误差进行反向传播,对对齐查询的分类分割任务关联参数进行调整得到调整后的对齐查询,根据调整后的对齐查询和像素嵌入特征图得到实例分割结果中的分类置信度能够准确反映分割质量,使得用户能够直观形象地确定分割实例的质量好坏,避免额外的质量分析确定劳动。
-
公开(公告)号:CN117576384A
公开(公告)日:2024-02-20
申请号:CN202311385658.4
申请日:2023-10-23
Applicant: 北京大学深圳研究生院
IPC: G06V10/26 , G06V10/774
Abstract: 本申请公开了一种图像的半监督分割方法、装置、终端设备、介质以及产品,属于图像语义分割技术领域,该方法包括:包括:根据半监督分割模型对无标签图像的预测结果确定模糊正类和模糊负类;根据所述模糊正类和所述模糊负类对所述半监督分割模型的优化目标进行调整,以得到优化后的半监督分割模型;基于所述优化后的半监督分割模型对无标签图像进行语义分割。采用本申请技术方案能够令半监督分割模型具备对模型自身错误进行调整的能力,从而解决现有基于半监督学习思想的语义分割模型会在模型训练过程中引入错误的梯度信息,从而使得训练得到的语义分割模型难以对无标签数据做出准确的测预测结果的技术问题。
-
公开(公告)号:CN117422107A
公开(公告)日:2024-01-19
申请号:CN202311281543.0
申请日:2023-09-28
Applicant: 北京大学深圳研究生院
IPC: G06N3/0455
Abstract: 本申请提供一种层自适应位置编码设计方法、装置、设备及存储介质,涉及机器学习技术领域,层自适应位置编码设计方法包括:将token表征作为视觉模型的第零层编码器的输入,并基于第零层的自适应仿射变换系数对初始位置编码进行层归一化处理,得到中间位置编码,将中间位置编码添加至第零层编码器中得到输出;将第零层编码器的输出作为第零层的下一层编码器的输入,以执行下一层编码器基于自适应位置编码的编码操作,得到下一层编码器的输出;再将下一层编码器的输出作为新的输入以循环执行各层级编码器基于自适应位置编码的编码操作,直至循环至最后一层时,将最后一层级编码器的输出作为视觉模型的输出,以构建包含层自适应位置编码的视觉模型。
-
公开(公告)号:CN117372692A
公开(公告)日:2024-01-09
申请号:CN202311287467.4
申请日:2023-09-27
Applicant: 北京大学深圳研究生院
IPC: G06V10/26 , G06V10/774
Abstract: 本申请公开了一种细胞核实例分割方法、装置、终端设备以及计算机可读存储介质,属于图像处理技术领域,该方法通过将包含细胞核实例的原始图像输入至预设分割模型得到原始图像的预测图;基于预测图和原始图像的模型训练标签,计算预设分割模型的像素级损失和拓扑感知损失,其中,拓扑感知损失表征预测图中拓扑结构的正确性;基于像素级损失和拓扑感知损失对预设分割模型进行优化。本申请提供一种细胞核实例分割策略,提高了细胞核实例弱边界识别的准确性。
-
-
-
-
-
-
-
-
-