-
公开(公告)号:CN119540835A
公开(公告)日:2025-02-28
申请号:CN202411693283.2
申请日:2024-11-25
Applicant: 重庆邮电大学
IPC: G06V20/40 , G06V10/764 , G06V10/774 , G06N3/0455 , G06N3/0499 , G06N3/08 , G06N5/04 , G06F17/16 , G06F17/18 , G06V10/80
Abstract: 本发明属于场景图生成子问题中的动态场景图生成领域,具体涉及一种基于视觉语义推理的动态场景图生成方法,包括:获取视频,将视频输入训练好的动态场景图生成模型,得到对象以及对象之间的关系类别,根据对象以及对象之间的关系类别构建视频的场景图结构;动态场景图生成模型包括:预训练好的对象检测器、时间关系编码模块、关系特征提取模块、空间知识编码器、时空关系解码模块以及分类模块;本发明计算相邻视频帧之间的视觉特征差异和语义特征差异并进行损失计算,为模型的正确预测提供方向;本发明利用空间编码器融合对象空间信息和时间依赖性,并利用先验知识筛选正确的关系标签,提高关系预测的准确性。
-
公开(公告)号:CN119296180A
公开(公告)日:2025-01-10
申请号:CN202411644294.1
申请日:2024-11-18
Applicant: 重庆邮电大学
Abstract: 本发明属于行为检测领域,涉及一种基于时空维度特征的行为检测方法及系统,包括:获取原始视频帧并进行预处理,得到全局特征;采用位置编码模块对全局特征添加位置信息,得到具有位置信息的全局特征;采用特征选择模块对具有位置信息的全局特征进行去冗处理,得到去冗的视觉特征;采用空间增强模块对经过特征选择模块处理后的特征进行处理,得到空间特征表示;将经过特征选择模块处理后的特征输入到时间增强模块中,得到时间特征表示;将去冗的视觉特征、空间特征向量以及时间特征向量表示进行融合,得到融合特征;将融合特征输入到行为检测模块中,得到检测结果;本发明通过对视频特征进行重要性的选择,提高了特征的利用,同时减少了冗余特征的影响。
-
公开(公告)号:CN117373119A
公开(公告)日:2024-01-09
申请号:CN202311318838.0
申请日:2023-10-12
Applicant: 重庆邮电大学
IPC: G06V40/20 , G06V20/40 , G06V20/52 , G06V10/774 , G06V10/80
Abstract: 本发明涉及一种基于语义推理的行为检测方法及系统,包括:获取待检测的视频数据,对视频数据进行抽帧操作得到第一视频数据样本,提取目标行为的运动特征和目标行为的空间特征;并利用非局部神经网络注意力机制进行特征增强融合得到目标行为的综合特征;获取原始视频数据训练集,根据各类别的行为标签在原始视频数据训练集中的共现关系构建非对称共现矩阵;利用语义关系推理模块SIM进行语义关系推理得到各类别行为标签的语义关系信息词向量表示;根据各类别行为标签的语义关系信息词向量表示和目标行为的综合特征计算目标在各类别行为标签的得分;基于预设的得分阈值输出目标在待检测的视频数据中的所有行为。
-
公开(公告)号:CN112365422B
公开(公告)日:2023-02-28
申请号:CN202011283720.5
申请日:2020-11-17
Applicant: 重庆邮电大学
Abstract: 本发明属于图像修复领域,具体涉及一种基于深层聚合网络的不规则缺失图像修复方法,该方法包括:输入图像,对其进行预处理;将图像传入深层聚合网络进行特征提取;采用权重分享策略对聚合结点特征图进行权重分享,并使用上下文注意力机制对权重分享后的特征图像进行修复,得到具有纹理特征的特征图;将具有纹理特征的特征图和原始图像中每个尺度的特征图转化为梯度图;根据每个尺度的梯度图和具有纹理特征的梯度图计算损失,根据损失对神经网络进行迭代训练,优化损失,得到修复后的图像;本发明在下采样的不同阶段使用不同个数的深度可分离的上下文门控卷积,提取图像更多的特征,以便解码时生成具有逼真的结构和纹理,提高了修复的精准度。
-
公开(公告)号:CN114662010A
公开(公告)日:2022-06-24
申请号:CN202210261079.8
申请日:2022-03-16
Applicant: 重庆邮电大学
IPC: G06F16/9536 , G06F16/958 , G06N3/04 , G06N3/08
Abstract: 本发明请求保护一种基于多任务学习的显隐式协同过滤推荐方法,具体涉及推荐系统领域。在现实的推荐场景中,显式反馈和隐式反馈都会被系统收集。现有的许多推荐算法都是使用单一的反馈构建推荐系统进行推荐,而显式反馈和隐式反馈存在着互补的关系。本发明使用显式反馈和隐式反馈进行建模,所述方法使用两个辅助任务分别处理显式反馈和隐式反馈,主任务用于融合显式反馈和隐式反馈。由于多任务学习模型的底层参数共享,底层参数将会由所有任务联合更新,这使得显式反馈和隐式反馈的知识共享,从而提高推荐的准确性。
-
公开(公告)号:CN111931630A
公开(公告)日:2020-11-13
申请号:CN202010776415.3
申请日:2020-08-05
Applicant: 重庆邮电大学
Abstract: 本发明属于人脸动态表情识别领域,尤其涉及了一种基于人脸特征点数据增强的动态表情识别方法,该方法包括:获取原始人脸数据集,对原始人脸数据集进行预处理,得到人脸数据训练集;所述人脸数据训练集包括原始人脸数据集、原始轨迹图和新的轨迹图;将训练集输入到构建好的3CNN模型中进行模型训练;实时获取人脸数据,将获取的人脸数据输入到训练好的3CNN模型中,得到该人脸动态表情识别结果;本发明通过对人脸特征数据进行增强处理,使得在训练卷积神经网络模型时有足够的数据对模型进行训练,最终得到的结果更精确。
-
公开(公告)号:CN119559697A
公开(公告)日:2025-03-04
申请号:CN202411641893.8
申请日:2024-11-18
Applicant: 重庆邮电大学
IPC: G06V40/20 , G06V10/25 , G06V10/44 , G06V10/77 , G06V10/82 , G06V10/764 , G06N3/0464 , G06N3/048 , G06N3/09
Abstract: 本发明属于3D人体姿态估计领域,具体涉及一种基于显式肢体表示的多人3D姿态估计方法及系统,包括:获取多人场景图像,将多人场景图像输入训练好的多人3D姿态估计模型,得到关键点热图、肢体方位向量场、肢体相对深度图和根关键点绝对深度图,对关键点热图、肢体方位向量场、肢体相对深度图和根关键点绝对深度图进行后处理,得到估计的多人3D姿态;本发明通过将人的肢体信息显示编码为二维肢体方位向量场以及肢体相对深度图的方式来确保候选关键点之间的匹配可以直接利用到最直观的肢体信息,以改善不同人体的候选关键点错误匹配的现象,提高了匹配出来的姿态质量。
-
公开(公告)号:CN117348415B
公开(公告)日:2024-06-04
申请号:CN202311485787.0
申请日:2023-11-08
Applicant: 重庆邮电大学
IPC: G05B13/04
Abstract: 本发明属于自动驾驶技术领域,具体涉及一种基于有限状态机的自动驾驶决策方法;该方法包括:将密集交通场景下的驾驶任务分解为三种驾驶子任务,包括变道、保持和姿态调整;对三种驾驶子任务分别进行马尔可夫建模;使用DQN算法求解马尔可夫决策过程,得到三种驾驶子任务的驾驶动作策略;根据驾驶过程中的任务切换过程构建有限状态机模型;根据有限状态机模型和驾驶动作策略得到驾驶决策并执行;本发明可解决DRL在自动驾驶决策任务中存在的稀疏回报问题,提高自动驾驶车在多样化驾驶环境中的适应能力,从而增强自动驾驶的可靠性和安全性。
-
公开(公告)号:CN117765429A
公开(公告)日:2024-03-26
申请号:CN202311439736.4
申请日:2023-11-01
IPC: G06V20/40 , G06V20/00 , G06V10/774 , G06T5/73 , G06V10/54 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/084 , G06N3/09
Abstract: 本发明属于目标检测技术领域,具体涉及一种基于深度学习的海上风电场船只入侵检测方法及系统,包括:获取海上船只的监控视频流;将视频流输入到图像抽帧模块进行抽帧,每秒抽取四帧作为待检测图像;对获取到的待检测图像输入到训练好的船只入侵检测模型,输出图像的船只目标预测结果;根据连续两帧待检测图像的预测结果判断当前时刻是否有船只入侵;本发明能够实现根据海上风电场上的监控视频实时检测船只入侵,同时保证了高精度的船只检测,具有良好的经济效益。
-
公开(公告)号:CN113935190A
公开(公告)日:2022-01-14
申请号:CN202111289450.3
申请日:2021-11-02
Applicant: 重庆邮电大学
IPC: G06F30/20 , G06F17/16 , G06F113/08
Abstract: 本发明属于空气污染监测技术领域,具体涉及一种基于张量表示的空气污染物浓度精准化监测方法及系统,该方法包括:实时获取待检测点的空气质量数据,将获取的空气质量数据输入到监测模型中,得到监测结果;根据监测结果对该监测点进行标记;本发明通过融合多源数据和时空空气污染物浓度数据进行张量补全,得到高精度张量数据。
-
-
-
-
-
-
-
-
-