基于分割大模型的高精度弱监督目标检测分割方法

    公开(公告)号:CN117635944A

    公开(公告)日:2024-03-01

    申请号:CN202311658529.8

    申请日:2023-12-04

    Abstract: 本发明公开了一种基于分割大模型的高精度弱监督目标检测分割方法。该方法先利用分类线索提示分割大模型用以生成高召回的图片建议框,再基于该建议框训练弱监督目标检测网络。同时本发明还提出了动态伪标签生成策略用以提升弱监督网络产生的伪标签质量,以及感兴趣区域/查询丢弃方法用以降低伪标签中的噪声影响。此外,本方法可以进一步扩展到弱监督物体分割任务,即通过弱监督检测的伪标签提示分割大模型,用以生成高质量实例伪标签。该实例伪标签能够为物体分割网络提供相比以往弱监督物体分割方法更精细的监督信息。该方法准确而高效,在多个弱监督实例识别基准上取得了远超其他方法的精度与速度。

    一种基于注意力机制的论文引用量预测方法与系统

    公开(公告)号:CN112668305B

    公开(公告)日:2024-02-09

    申请号:CN202011393595.3

    申请日:2020-12-03

    Abstract: 本发明公开了一种基于注意力机制的论文引用量预测方法与系统。对于待预测的论文,首先使用深度神经网络来提取特征,然后通过注意模块过滤掉那些不重要的句子,从而将较长的论文简化为较短的文本,再将这个精简的版本输入预测模型,即可在硬件资源有限的情况下充分利用论文信息,来更准确地预测论文引用量。该方法的预测过程分为两步:第一步,并列输入文章中的所有句子,得到每个句子的注意力权重,即为每个句子的重要性;第二步,根据每个句子的重要性,只选择一些关键的句子拼接成精简的文章,最后根据精简的文章来预测论文的引用量。本发明还提供了相应的基于注意力机制的论文引用量预测系统。

    基于Query机制的半监督视频物体分割方法与装置

    公开(公告)号:CN115797390A

    公开(公告)日:2023-03-14

    申请号:CN202211484285.1

    申请日:2022-11-24

    Abstract: 本发明公开了一种基于Query机制的半监督视频物体分割方法:将参考帧与当前帧分别输入同一个主干网络提取图像特征;将参考帧的分割掩膜通过一层卷积层提取掩膜特征,然后与相应的图像特征相加进行融合得到参考特征;用参考帧的参考特征作为参考,构建键值对输入Transformer,同时前景Query和背景Query作为探针输入Transformer;将前景Query和背景Query作为参考,当前帧的图像特征作为探针,输入另一个Transformer;将当前帧图像特征输入特征金字塔网络进行解码;将前景Query和背景Query与解码后的当前帧特征做矩阵乘进行融合;同组内的Query对每个像素取最大,前景和背景两个掩膜再进行逐像素Softmax操作,根据值的大小判断是前景还是背景。本发明还提供了相应的基于Query机制的半监督视频物体分割装置。

    一种带有内膜瓣注意力模块的主动脉夹层分割方法

    公开(公告)号:CN115272389A

    公开(公告)日:2022-11-01

    申请号:CN202210859274.0

    申请日:2022-07-20

    Abstract: 本发明公开了一种带有内膜瓣注意力模块的主动脉夹层分割方法,包括如下步骤:对主动脉体积上下采样形成3D的CT图像,提取CT图像中的体素并进行立方形态学开运算;在CT图像中的主动脉夹层上标注真腔MTL和假腔MFL,使用形态扩张操作生成内膜瓣标注Mflap:利用生成的内膜瓣标注Mflap作为监督,训练第一U‑Net神经网络来预测生成内膜瓣掩码及内膜瓣置信度图,将主动脉夹层待分割的体素输入第一U‑Net神经网络中进行训练得到预测结果,计算出第一U‑Net神经网络输出的预测内膜瓣和内膜瓣标注之间的dice损失函数并进行反向传播,得到第一U‑Net神经网络的模型;将经过第一U‑Net神经网络预测生成的内膜瓣掩码输入至第二U‑Net神经网络进行更加平滑有效地训练,得到最终网络模型进行分割。

    一种基于实例查询的端到端实例分割方法

    公开(公告)号:CN112927245B

    公开(公告)日:2022-06-21

    申请号:CN202110388605.2

    申请日:2021-04-12

    Abstract: 本发明公开了一种基于实例查询的端到端实例分割方法:(1)训练基于实例查询和多层级并行掩码监督的端到端实例分割算法模型,包括以下子步骤:(1.1)对原始数据集中所有图片的感兴趣类别的物体进行实例级别的标注,标签为实例级别的包围框的左上及右下顶点和实例对应的前景掩码,得到带标注的标准训练数据集;(1.2)定义基于实例查询向量以及多层级并行掩码监督的端到端实例分割算法模型,利用反向传播和梯度下降算法训练该基于实例查询向量以及多层级并行掩码监督的端到端实例分割算法模型;(2)利用上述训练好的模型对待识别图片进行实例分割。

    一种基于批次中心相似度的行人重识别方法

    公开(公告)号:CN110309810B

    公开(公告)日:2021-08-17

    申请号:CN201910617855.1

    申请日:2019-07-10

    Abstract: 本发明公开了一种基于批次中心相似度的行人重识别方法,包括:(1)基于经典基础网络结构,去掉网络最后的全连接层,并添加额外卷积层从而建立全卷积神经网络模型;(2)从原始训练数据集中随机选取P个行人,每个行人随机选取K个图像;(3)利用(2)得到的P*K个图像送进网络进行训练得到P*K个特征向量;(4)对每个行人的K个特征向量求一个中心向量,得到P个中心向量;(5)将P*K个特征向量中的每一个与其对应的中心向量和非同类的中心向量构成一个三元组进行回归优化。本发明方法简单易行,应用范围广,能够有效的解决行人重识别任务中错位、遮挡等问题。

    一种基于注意力机制的论文引用量预测方法与系统

    公开(公告)号:CN112668305A

    公开(公告)日:2021-04-16

    申请号:CN202011393595.3

    申请日:2020-12-03

    Abstract: 本发明公开了一种基于注意力机制的论文引用量预测方法与系统。对于待预测的论文,首先使用深度神经网络来提取特征,然后通过注意模块过滤掉那些不重要的句子,从而将较长的论文简化为较短的文本,再将这个精简的版本输入预测模型,即可在硬件资源有限的情况下充分利用论文信息,来更准确地预测论文引用量。该方法的预测过程分为两步:第一步,并列输入文章中的所有句子,得到每个句子的注意力权重,即为每个句子的重要性;第二步,根据每个句子的重要性,只选择一些关键的句子拼接成精简的文章,最后根据精简的文章来预测论文的引用量。本发明还提供了相应的基于注意力机制的论文引用量预测系统。

    一种基于卷积神经网络的端到端物体检测方法

    公开(公告)号:CN106682697B

    公开(公告)日:2020-04-14

    申请号:CN201611241694.3

    申请日:2016-12-29

    Abstract: 本发明公开了一种基于卷积神经网络的端到端目标检测方法,包括:(1)基于经典基础网络结构,去掉经典基础网络最后的全连接层,并添加额外层从而建立卷积神经网络模型;(2)从原始训练数据集中随机选取一张原始图像进行数据扩增得到扩增图像,并获得在原始图像中随机选取的目标图像块在扩增图像中的位置和边框;(3)利用步骤(2)得到的目标图像块在扩增图像中的位置和边界,回归步骤(2)中的卷积神经网络模型得到模型参数,从而得到训练后的卷积神经网络模型;(4)利用训练后的卷积神经网络模型,检测待检测图像中的目标的边界框和类别。本方法采用直接回归目标中心点坐标、宽高和类别,与同类方法相比,在速度上有很大的优势。

    基于在线示例分类器精化的多示例检测网络及其训练方法

    公开(公告)号:CN106682696B

    公开(公告)日:2019-10-08

    申请号:CN201611241532.X

    申请日:2016-12-29

    Abstract: 本发明公开了一种基于在线示例分类器精化的多示例检测网络及其训练方法,包括:确定训练图片集,并选择每张训练图片中的多个候选区域;获得所述训练图片集中训练图片的卷积特征图,并得到各候选区域的卷积特征;将各候选区域的卷积特征输入到全连接层中,得到各候选区域的特征向量;构建一个基准示例分类器,并构建多个精化示例分类器,通过更新每个候选区域得分的权重进行在线示例分类器精化;合并整个网络中的损失函数,训练端到端的多示例检测网络。本发明将多示例分类器训练和分类器精化整合到一起,训练速度快识别准确率高,仅依赖图像标签的数据集,不需要人工对目标示例的位置和标签进行标注,适用于弱监督的目标检测问题。

    一种提取行人特征的方法和装置
    20.
    发明公开

    公开(公告)号:CN118799917A

    公开(公告)日:2024-10-18

    申请号:CN202410928443.0

    申请日:2024-07-11

    Abstract: 本发明涉及行人重识别技术领域,提供了一种提取行人特征的方法和装置。将无标签行人图像输入初始预训练模型,将其转换为原始图片块序列;使用初始预训练模型的教师网络提取原始图片块序列中的行人特征,得到教师目标向量;对原始图片块序列中的原始词元进行随机遮掩,得到掩码图片块序列;使用初始预训练模型的学生网络提取其中的行人特征,得到学生目标向量;根据教师目标向量和学生目标向量优化所述初始预训练模型的网络参数,迭代训练最终得到目标预训练模型,以使用目标预训练模型提取行人特征。本发明解决了现有技术中由于有标注的训练数据不足,导致难以有效提取行人图像的局部细节特征、精度受限的问题。

Patent Agency Ranking