-
公开(公告)号:CN118918506A
公开(公告)日:2024-11-08
申请号:CN202410943705.0
申请日:2024-07-15
Applicant: 重庆大学
IPC: G06V20/40 , G06V20/52 , G06V10/44 , G06V10/52 , G06V10/764 , G06V10/77 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0895 , G06N3/096
Abstract: 本发明涉及一种基于提示学习与多尺度时序融合的视频异常事件检测方法,属于视频处理领域。该方法主要包括视觉语言提示学习和多尺度时序特征融合的双分支结构。视觉语言提示学习分支利用CLIP模型强大的先验知识来识别数据集中潜在的异常行为并转化为伪标签,以此作为额外的监督信号指导异常事件检测模型的训练。多尺度时序融合分支通过多尺度时序关系建模模块,精细捕捉视频不同粒度的时序信息,提升模型在处理不同时间跨度异常事件时的识别效果。通过双分支的协同优化,能够进一步提高异常事件检测模型的鲁棒性和泛化性,并适用于多种复杂场景。
-
公开(公告)号:CN118314495A
公开(公告)日:2024-07-09
申请号:CN202410400546.X
申请日:2024-04-03
Applicant: 重庆大学
IPC: G06V20/40 , G06V40/20 , G06V10/82 , G06V10/762 , G06V10/80 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本发明涉及一种基于深度学习的小样本行为识别方法,该方法包含两个模块来解决多模态小样本行为识别中的问题:时序增强模块和特征聚合模块。其中时序增强模块将三帧连续灰度图像与原始RGB图像在通道上进行平均加权,在保持原有模型参数量不变的情况下,既减少了颜色信息对动作识别的干扰,又可以对时序信息进行增强。另外该方法还提出了一个特征聚合模块,在这个模块中通过聚类算法对帧级特征进行聚类,将其聚合成更高语义信息并用聚类中心代替原始特征,以排除离群点对匹配结果的影响,增强模型的鲁棒性。该方法在多个数据集上得到验证能有效解决多模态小样本行为识别中出现的各种问题。
-
公开(公告)号:CN118312641A
公开(公告)日:2024-07-09
申请号:CN202410406047.1
申请日:2024-04-07
Applicant: 重庆大学
IPC: G06F16/732 , G06F16/735 , G06F16/78 , G06F16/535 , G06V20/40 , G06V10/44 , G06V10/82
Abstract: 本发明设计一种基于重排序的两阶段图像到视频跨模态检索方法,促使模型能够在更大的检索范围内对检索错误和丢失的情况进行修正。该方法包括两个阶段,在第一阶段,提取两个模态特征,接着执行预测的相似性匹配,生成一个候选视频片段序列。第二阶段则设计了一种改进的重排序策略,通过计算查询图像与候选集的重排序距离,进一步挖掘查询目标和候选样本之间的相关性。最后融合两阶段检索结果,得到修正后的检索序列。在公开数据集上的一系列实验结果,验证了本文方法的有效性和可用性。
-
公开(公告)号:CN117058592A
公开(公告)日:2023-11-14
申请号:CN202311107012.X
申请日:2023-08-30
Applicant: 重庆大学
IPC: G06V20/40 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0499 , G06N3/0464 , G06N3/08 , G06V10/74
Abstract: 本发明涉及一种视频的场景边界检测方法,该方法通过生成的伪场景边界引导模型学习镜头间的上下文语义关系,在神经网络模型的训练中包含两个阶段,预训练阶段与微调阶段,预训练中通过学习类似场景边界预测的伪场景边界预测来对神经网络模型进行预训练,随后通过真实场景边界标注信息来微调预训练模型,从而在现实数据中取得好的场景边界预测结果。
-
公开(公告)号:CN111984820B
公开(公告)日:2023-10-27
申请号:CN201911313856.3
申请日:2019-12-19
Applicant: 重庆大学
IPC: G06F16/738 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于双自注意力胶囊网络的视频摘要方法,包括以下步骤:S1:将视频摘要问题视为一个视频帧序列的标记问题;S2:对于给定的视频,提取每个视频帧的初始特征向量;S3:利用双注意力模型对初始特征向量进行特征细化;S4:利用双流胶囊网络来对细化特征进行融合,并对视频的每个帧进行标记;S5:使用相应目标函数,以深度学习的方式来训练上述的模型;S6:根据S5训练好的模型,来生成最终的摘要。有益效果:能够有效地捕捉短期和长期依赖关系而不受视频时长的限制,且该方法能够并行处理,降低运行时长,最终得到的摘要视频是无冗余的、完整的。
-
公开(公告)号:CN116630884A
公开(公告)日:2023-08-22
申请号:CN202310569837.7
申请日:2023-05-19
Applicant: 重庆大学
IPC: G06V20/52 , G06V10/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明涉及一种基于跨模态融合和模态去相关的跨模态行人再识别方法,该方法利用两个部分充分挖掘两个模态样本图像和特征间的关联:跨模态通道融合和模态去相关五元组损失。跨模态通道融合作为数据增强,相当于在数据集中补充了同时具有RGB和红外图像信息的新样本,使得模型的输入空间更加连续。CCM不会引入额外的参数或模型,可以很容易地与其他方法结合。该方法同时考虑了两个模态的图像信息,促使模型学习模态间的关联。模态去相关五元组损失约束了正样本对和负样本对内部的距离关系,从而减小特征与其所属模态的相关性,消除特征中冗余的模态特定信息。该方法从图像和特征层面同时解决模态差异问题,能更好地提升跨模态检索的性能。
-
公开(公告)号:CN110109835B
公开(公告)日:2021-03-30
申请号:CN201910368699.X
申请日:2019-05-05
Applicant: 重庆大学
Abstract: 本申请公开了一种基于深度神经网络的软件缺陷定位方法(DMF‑BL),该方法主要从缺陷报告和代码文件等文本数据中提取了文本相似度、结构信息相似度、基于协同过滤算法的缺陷报告相似度、基于缺陷修复历史的相似度和类名相似度五个特征,并利用深度神经网络来整合这些特征,从而捕获特征之间的非线性关系。同时,该方法在六个项目中的23000个缺陷报告上评估了软件缺陷定位的能力,结果表明,不管是Top 1、5和10中成功定位缺陷的准确率还是平均精度均值(MAP),DMF‑BL的性能都要优于目前的缺陷定位技术。
-
公开(公告)号:CN110796080A
公开(公告)日:2020-02-14
申请号:CN201911036294.2
申请日:2019-10-29
Applicant: 重庆大学
Abstract: 本发明公开了一种基于生成对抗网络的多姿态行人图像合成算法,包括以下步骤:S1:通过行人重识别任务数据集Market-1501中获取训练数据集和测试数据集;S2:根据预设方法通过训练数据集构建生成对抗网络模型;S3:采用预设方法向生成对抗网络模型输入中加入姿态信息潜码;S4:基于姿态信息潜码构建生成对抗网络模型的目标函数,并利用带有目标函数的生成对抗网络模型合成多姿态的行人图像;S5:根据合成的多姿态行人图像进行实验结果分析。有益效果:本发明有效地缩小了生成器的解空间,使得生成对抗网络训练更加平稳,从而可以生成高质量的多姿态行人图片。
-
公开(公告)号:CN110188047A
公开(公告)日:2019-08-30
申请号:CN201910474540.6
申请日:2019-06-20
Applicant: 重庆大学
Abstract: 本发明涉及一种基于双通道卷积神经网络的重复缺陷报告检测方法,包括三个步骤,数据准备、建立CNN模型和待预测缺陷报告预测;在数据准备,对重复报告有用的字段,从缺陷报告中提取出来,对每一个报告,结构化信息和非结构化信息一起放入一个文本发明档中,经过预处理,每个由文本表示的报告被转化成一个单通道矩阵,把单通道矩阵组合成双通道矩阵,然后把一部分作为训练集,剩下的部分作为验证集。在CNN模型建立,以训练集为输入训练模型。在待预测缺陷报告预测阶段,训练好的模型加载预测一个未知缺陷报告与已知缺陷报告组成的缺陷报告对的相似度,这个相似度是一个表示缺陷报告对重复可能性的概率。本发明方法具有较高的预测准确性。
-
公开(公告)号:CN107067076A
公开(公告)日:2017-08-18
申请号:CN201710396207.9
申请日:2017-05-27
Applicant: 重庆大学
CPC classification number: G06N3/08 , G06N3/0481 , G06Q10/04 , G06Q50/30
Abstract: 本发明涉及一种基于时滞NARX神经网络的客流预测方法,主要解决现有技术中存在的预测精确度低的技术问题,本发明通过采用方法包括从自动售检票系统采集n个历史数据作为原始样本,预处理得到预处理样本;依据带有外部输入的非线性自回归网络,建立关于时间序列的NARX短时客流预测模型p(t),外部输入为外部印象因素u(t),带有外部输入的非线性自回归网络包括输入层、输入滞时、隐藏层、输出层及输出滞时,根据NARX短时客流预测模型,激励函数以及训练算法,进行实时客流预测,实时客流预测包括短时客流预测、高峰预测及代表性的客流分布站点预测的技术方案,解决了该问题,可用于轨道客流预测中。
-
-
-
-
-
-
-
-
-