-
公开(公告)号:CN118691812B
公开(公告)日:2025-04-01
申请号:CN202410716521.0
申请日:2024-06-04
Applicant: 天津大学 , 上海人工智能创新中心
Abstract: 本发明涉及一种基于迭代优化的无训练通用高效语义分割方法,对预训练的扩散模型进行改进,在提取和选择交叉注意力图和自注意力图之后,获得同样尺度的交叉注意力图Aca和自注意力图Asa,将自注意力图Asa送入熵减自注意力模块中,用于去除不相关的全局信息,方法为:计算自注意力图的熵梯度,通过将自注意力图分布视为离散随机变量的概率质量函数计算自注意力熵,进而计算熵梯度;更新自注意力:通过沿着负梯度方向更新所选择的自注意力图计算熵降低后的自注意力图Aceant;将熵降低后的自注意力图Aseant和交叉注意力图Aca进行矩阵乘法,迭代优化交叉注意力图,将得到的最终交叉注意力Aca尺寸恢复到原图像大小。
-
公开(公告)号:CN118379660A
公开(公告)日:2024-07-23
申请号:CN202410402526.6
申请日:2024-04-03
Applicant: 天津大学 , 上海人工智能创新中心
IPC: G06V20/40 , G06V10/82 , G06V10/774
Abstract: 本发明涉及一种运动表达引导视频分割的方法,基于语言引导运动感知和匹配MLPM建立有效运动信息挖掘框架;采用分层运动聚合模块,用于分别从局部和全局视野中捕获运动信息,其中,局部运动聚合采用基于滑动窗口的自注意力操作,全局运动聚合使用全选择性状态空间模型SSM捕获。对局部运动聚集的输出特征和全局运动聚合的输出特征求和,并将求和后的特征馈送到前馈网络(FFN)以生成输出具有全局和局部运动信息的特征。
-
公开(公告)号:CN118116030A
公开(公告)日:2024-05-31
申请号:CN202410183770.8
申请日:2024-02-19
Applicant: 天津大学 , 上海人工智能创新中心
IPC: G06V40/10 , G06V10/764 , G06V10/80 , G06V10/52 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种针对密集遮挡场景下的行人检测方法、设备、介质及产品,涉及自动驾驶技术领域,方法包括:将交通场景图像输入至训练后的YOLOv8目标检测模型,得到交通场景图像中行人的类别信息和位置信息;模型的训练过程为:基于行人数据集,对改进后的YOLOv8目标检测算法进行训练;其中,改进后的算法为在原始算法的基础上,将Backbone中的Conv模块里的传统卷积替换为深度可分离卷积、将DANet引入到Backbone结构中的c2f模块末端以及将Neck采用的PANet结构替换为BiFPN结构后得到的算法。本发明基于改进后的YOLOv8目标检测算法,能够在密集遮挡场景下实现高效准确的行人检测。
-
公开(公告)号:CN116701681B
公开(公告)日:2024-04-12
申请号:CN202310841079.X
申请日:2023-07-10
Applicant: 天津大学
IPC: G06F16/53 , G06V10/764 , G06V10/74 , G06V10/80 , G06V10/82 , G06V10/26 , G06N3/0464 , G06N3/0499 , G06N3/084
Abstract: 本发明涉及一种用于语义分割的多查询网络,其基础架构包括骨干网和解码器组成,包括下列步骤:对于给定的图像,利用骨干网提取多层深度特征,骨干网由多层Transformer块堆叠形成,在每一层均能得到输入图像的特征表示,选择不同层次的深度特征作为骨干网输出的特征图,随后将这些特征同时输入到解码器中进行掩码的生成和分类;根据骨干网的网络参数L,以及预先设定的阶段数S,随机初始化为由L×S个ATM模块组成的解码器;每个ATM模块依次堆叠多个自注意力层、跨注意力层和前馈神经网络层,用于获取性能更好的特征嵌入,并将最后一个跨注意力层得到的掩码M作为输出。
-
公开(公告)号:CN117854005A
公开(公告)日:2024-04-09
申请号:CN202410039070.1
申请日:2024-01-10
Applicant: 天津大学
IPC: G06V20/52 , G06V10/25 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明提供一种基于两分支交互的行人搜索方法,所采用的行人搜索网络包括主干网络、连接网络、检测预测网络和重识别预测网络,包含下列步骤:准备行人图像数据集;训练行人搜索网络,分为以下子步骤:采用ImageNet预训练模型的参数初始化主干网络的权重;将训练集图像输入行人搜索网络,经过主干网络输出特征图;将特征图输入到连接网络中输出候选框,对候选框进行RoI特征提取,输出RoI特征;将RoI特征输入预测网络,经过检测预测网络生成行人检测特征以及检测结果;将RoI特征和行人检测特征输入重识别预测网络;将静态重识别特征和动态重识别特征输入交叉注意力模块计算两个重识别特征之间的注意力权重,输出最终的行人重识别特征以及重识别结果。
-
公开(公告)号:CN115455505B
公开(公告)日:2023-11-24
申请号:CN202211031315.3
申请日:2022-08-26
Applicant: 天津大学
Abstract: 本发明涉及一种全自由度永磁体主动构建方法,包括以下步骤:步骤1、选取永磁材料并制作磁块;步骤2、构建全自由度磁体几何模型;步骤3、确定由少量磁块组成的磁体初始状态;步骤4、构建磁场评价环境;步骤5、构建基于深度神经网络的磁块动作决策网络;步骤6、进行磁块动作决策网络与磁场评价环境的交互,将交互产生的经验保存到回放单元;步骤7、依据收敛的永磁体模型制造永磁体。本发明能够在同等重量条件下提升永磁体的磁场场强并优化磁场的均匀性。
-
公开(公告)号:CN117008620A
公开(公告)日:2023-11-07
申请号:CN202311034085.0
申请日:2023-08-16
Applicant: 天津大学
IPC: G05D1/02
Abstract: 本发明公开一种无人驾驶自适应路径规划方法、系统、设备及介质,涉及路径规划领域;该方法包括:获取无人车在目标环境内实时的环境信息;环境信息包括:障碍物位置、无人车初始位置和无人车目标位置;将环境信息输入至路径规划模型中,得到规划路径;规划路径用于表征无人车的行动路径;路径规划模型是基于自适应机制的循环脉冲神经网络,采用深度学习方法构建的;其中,循环脉冲神经网络包括:相互连接的输入神经元群体、处理神经元群体和输出神经元群体;处理神经元群体包括并联的兴奋性神经元群体、抑制性神经元群体和自适应神经元群体;本发明能够应用于复杂环境且提高鲁棒性。
-
公开(公告)号:CN110738113B
公开(公告)日:2023-07-28
申请号:CN201910861981.1
申请日:2019-09-12
Applicant: 天津大学
IPC: G06V20/58 , G06V10/774 , G06V10/80 , G06V10/52 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明涉及一种基于邻近尺度特征滤除与转移的物体检测方法,包含下列步骤:收集包含各种不同类别物体的图像,并标注每张图像中的所有感兴趣物体,标注内容为每一个物体的坐标位置,每一个物体的类别,每一张图像的语义分割结果,以其作为图像标签信息。设计物体检测主干卷积神经网络,基于该主干卷积神经网络,提取多层级的物体特征。得到尺度敏感的物体多层级特征。基于尺度敏感的多层级特征,建立尺度敏感的物体检测子,回归和分类对应尺度的物体。输入数据,前向计算预测结果和损失代价,通过反向传播算法计算参数的梯度并更新参数。迭代的更新参数,待代价函数曲线收敛时,模型训练完毕。
-
公开(公告)号:CN109543502B
公开(公告)日:2023-06-06
申请号:CN201811146434.7
申请日:2018-09-27
Applicant: 天津大学
Abstract: 本发明涉及一种基于深度多尺度神经网络的语义分割方法,包括下列步骤:收集包含各种不同类别物体的图像,并标注每张图像中的所有感兴趣物体,标注内容每个像素点的所属物体类别,以其作为图像标签信息;图像集划分;将收集的图像划分为训练集,验证集和测试集,训练集用于训练卷积神经网络,验证集用于选择最佳的训练模型,测试集为后续测试模型效果或者实际应用时使用;设计基于深度多尺度神经网络结构,用以有效实现物体检测,输入数据,前向计算预测结果和损失代价,通过反向传播算法计算参数的梯度并更新参数;迭代的更新参数,待代价函数曲线收敛时,模型训练完毕。
-
公开(公告)号:CN116052214A
公开(公告)日:2023-05-02
申请号:CN202310059406.6
申请日:2023-01-18
Applicant: 天津大学
Abstract: 本发明涉及一种基于动态RoI特征提取的行人搜索方法,所采用的行人搜索网络采用基于候选框生成的一步法网络框架,包括干网络,颈网络和头网络,头网络由物体检测头网络和行人重识别头网络串接组成;头网络采用多级级联架构,即将上一级网络的输出结果作为下一级网络的输入;每一级头网络的输入包括颈网络对应的特征图,候选框位置信息、候选框特征向量,包含下列步骤:准备包含不同行人的图像集,标注图像集每张图像中行人的标注信息,包括行人的身份信息和标注框信息;将图像集划分为训练集,验证集和测试集;设置训练阶段的相关超参数;训练行人搜索网络。
-
-
-
-
-
-
-
-
-