-
公开(公告)号:CN119579655A
公开(公告)日:2025-03-07
申请号:CN202510135346.0
申请日:2025-02-07
Applicant: 常熟理工学院
IPC: G06T7/246 , G06V10/80 , G06N3/0464 , G06N3/08 , G06N3/0455
Abstract: 本发明公开了一种视频目标的跟踪方法,包括视频数据采集、视频数据预处理、跟踪模型训练、跟踪模型测试验证、待处理视频输入验证后跟踪模型得到跟踪结果。其中跟踪模型通过Transformer的编码器来增强外观模板特征和搜索域特征的显著性,并计算相似度权重得到记忆特征;之后由Transformer解码器融合增强后的搜索域特征和记忆特征得到最终特征,并由无锚框的回归机制输出目标边界框。此外,跟踪模型通过轨迹预测模型来估计目标的位置,避免附近的相似物体干扰,纠正了跟踪结果。本发明还公开了视频目标的跟踪系统,本发明解决了目标外观变化而导致误差积累以及相似目标干扰问题,跟踪精度和成功率高。
-
公开(公告)号:CN114818920B
公开(公告)日:2024-08-20
申请号:CN202210444165.2
申请日:2022-04-26
Applicant: 常熟理工学院
IPC: G06V10/25 , G06V10/764 , G06V10/774 , G06V10/82 , G06V10/42 , G06V10/44 , G06V10/46 , G06N3/045 , G06N3/0464 , G06N3/0895
Abstract: 本发明公开了一种基于双注意力擦除和注意力信息聚合的弱监督目标检测方法,首先提取图像特征,同时采用选择性搜索算法对原始图像提取目标候选区域;将获取的特征送入到注意力信息聚合网络中,提取目标特征通道的全局和局部信息,并为不同的目标构建空间信息以增强特征图送入到双注意力擦除网络中,擦除其显著性局部前景注意力区域并同时擦除背景注意力区域,同时进行Sigmoid函数操作来生成增强图;将最终的特征图的卷积特征和候选区域输入到空间金字塔池化层,再输入两层串联的全连接层,输出得到每个候选框的特征向量,然后将其送入到多示例分支、优化分支和蒸馏分支中优化检测结果。本发明可解决弱监督场景下目标显著性区域突出问题,提高检测精度。
-
公开(公告)号:CN117576403B
公开(公告)日:2024-04-26
申请号:CN202410050858.2
申请日:2024-01-15
Applicant: 常熟理工学院
IPC: G06V10/26 , G06V20/10 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提供一种SAR图像建成区语义分割方法及装置、存储介质与终端,其中方法包括利用CNN主编码器对SAR图像进行语义提取,以获取多阶段的局部语义特征图,利用transformer辅编码器对SAR图像进行语义提取,以获取多阶段的全局语义特征图;将每阶段的全局语义特征图分别嵌入到同阶段的局部语义特征图中,以获取对应阶段的聚合结果;以递归融合方式对所有聚合结果进行融合以获取最终融合结果,并将最终融合结果输入分类器进行分类,以获取SAR图像的语义分割结果。本发明可以有效提高对SAR图像中多尺度建筑物的分割效果。
-
公开(公告)号:CN111507215B
公开(公告)日:2022-01-28
申请号:CN202010268501.3
申请日:2020-04-08
Applicant: 常熟理工学院
Abstract: 本发明公开了一种基于时空卷积循环神经网络与空洞卷积的视频目标分割方法,包括步骤一、建立编码器‑解码器网络结构,编码器的最顶层利用多个空洞率不同的卷积核,从多个尺寸对目标进行捕捉,以获得更精确的外观信息。在解码器阶段,每一个卷积循环神经网络单元将接收不同尺寸的特征图,并将上一帧该目标的分割结果、上一个卷积循环神经网络单元得到的特征图作为输入;步骤二、利用数据集对编码器‑解码器网络结构进行训练;步骤三、将待分割视频输入训练好的编码器‑解码器网络结构输出分割结果。本发明具有可靠的时空相关性,能提高目标分割准确性和分割速度。
-
公开(公告)号:CN110163286A
公开(公告)日:2019-08-23
申请号:CN201910439494.6
申请日:2019-05-24
Applicant: 常熟理工学院
IPC: G06K9/62
Abstract: 本发明公开了一种基于混合池化的领域自适应图像分类方法,将待分类的目标域图像送入训练后的图像分类预测模型中输出n×1维的特征向量,然后利用one-hot编码得到目标域图像的所属类别,图像分类预测模型包括依次连接的若干卷积层,卷积层连接最大池化层,再级联一层平均池化层,平均池化层连接带有softmax激励函数的全连接层,目标域图像经过若干卷积层提取图像特征,然后经过最大池化层进行下采样得到第一描述子特征再经过平均池化层提取图像特征中的局部信息得到第二描述子特征,最后由全连接层得到特征向量。本发明方法能容忍输入的微小变化,减小过拟合,提高模型的容错性,优化迁移效果。
-
公开(公告)号:CN117689932A
公开(公告)日:2024-03-12
申请号:CN202311563074.1
申请日:2023-11-22
Applicant: 常熟理工学院
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于改进YOLOv7的InSAR大气相位和地表形变的检测方法,包括构造地表形变样本数据集图片,对构造的地表形变样本数据集图片进行标注并划分训练集、验证集和测试集;将数据集输入集成Swin Transformer V2的YOLOv7的骨干网络中进行特征提取;将特征提取得到的特征层输入EfficientDet‑BiFPN网络中进行特征融合;将特征融合后的特征输入YOLOv7的预测网络中得到地表形变的类别信息和位置信息。本发明实现了高速的精确检测出大气相位影响的地表形变和实际地表形变。
-
公开(公告)号:CN117409375A
公开(公告)日:2024-01-16
申请号:CN202311724170.X
申请日:2023-12-15
Applicant: 常熟理工学院
IPC: G06V20/52 , G06V20/70 , G06V10/26 , G06V10/28 , G06V10/36 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/766 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/084 , G06N3/048
Abstract: 本发明公开了一种双重注意力引导的人群计数方法,包括步骤对获取的人群图像预处理,并利用标注信息产生对应的真值分割图、向量化二值图,构建双重注意力引导的人群计数网络并初始化;将预处理后的人群图像、真值分割图和向量化二值图输入双重注意力引导的人群计数网络,完成前向传播;由注意力图与真值分割图计算损失,预估人群密度图与向量化二值图计算损失,并迭代更新网络的参数;基于人群图像通过迭代更新后的双重注意力引导的人群计数网络获取人群密度图,根据所述人群密度图得到预估人数。本发明还公开了基于该方法的装置。本发明使用注意力引导特征聚合恢复细粒度信息,采用分割注意力图过滤背景噪声,提高准确率。
-
公开(公告)号:CN114567908A
公开(公告)日:2022-05-31
申请号:CN202210351008.7
申请日:2022-04-02
Applicant: 常熟理工学院
Abstract: 本发明公开了一种移动机会网络节点拥塞避免方法及系统,涉及网络节点拥塞检测及避免领域。所述方法,包括:根据目标节点在上一时隙流入的消息包的字节数和流出的消息包的字节数预测目标节点在当前时隙的缓存增量,以及在当前时隙开始时目标节点的剩余缓存空间,检测目标节点在当前时隙是否拥塞;若拥塞,则首先确定托管节点集合;然后根据拥塞节点的各个消息包的转发概率确定拥塞节点的卸载集合;再将拥塞节点的卸载集合中的待卸载消息包卸载至托管节点集合中的托管节点。本发明利用流量感知策略检测具有高拥塞风险的节点,并采用消息卸载策略来降低节点的拥塞风险。
-
公开(公告)号:CN108762249B
公开(公告)日:2019-11-08
申请号:CN201810385471.7
申请日:2018-04-26
Applicant: 常熟理工学院
IPC: G05D1/02
Abstract: 本发明公开了一种基于近似模型多步优化的清洁机器人最优路径规划方法,包括初始化模型、超参数、环境,选择探索策略并以当前样本更新模型,更新值函数、策略和当前状态,判断当前情节是否结束进而利用当前采样轨迹更新轨迹池,利用重构采样轨迹更新轨迹池,然后由轨迹池中所有轨迹来更新模型,采用模型进行规划,判断是否达到最大情节数,最后根据学习到最优策略来来获取清洁机器人规划的最优路径。本发明通过采用采样轨迹和单个样本同时对模型进行更新,提高模型学习的精度,同时利用该模型进行规划,提高值函数、策略和整个算法的学习速度,同时提高样本的利用效率,实现在更短的时间内采用更少的样本来获得清洁机器人进行规划的最优路径。
-
公开(公告)号:CN110197517A
公开(公告)日:2019-09-03
申请号:CN201910500919.X
申请日:2019-06-11
Applicant: 常熟理工学院
Abstract: 本发明公开了一种基于多域循环一致性对抗生成网络的SAR图像上色方法,包括步骤:从数据集中随机抽取一对非成对的SAR图像和光学图像并转化为特征向量,网络采用双生成器和双判别器结构,SAR图像特征向量连接掩模向量经过生成器的常规卷积、残差卷积、上采样操作,生成伪光学图像,相同步骤从光学图像得到伪SAR图像,由伪光学图像和光学图像以及伪SAR图像和SAR图像通过判别器输出,由对抗损失、循环一致损失和多域分类损失对生成器和判别器进行对抗训练,由训练后的生成器根据SAR图像生成上色的光学图像。本发明方法可使用非成对数据集进行训练,并减少区域上色错误。
-
-
-
-
-
-
-
-
-