-
公开(公告)号:CN103744934A
公开(公告)日:2014-04-23
申请号:CN201310746690.0
申请日:2013-12-30
Applicant: 南京大学
IPC: G06F17/30
CPC classification number: G06F17/3033 , G06F17/30412 , G06F17/30545
Abstract: 一种基于位置敏感哈希的分布式索引方法,首先利用聚类算法对海量数据集进行聚类,然后把聚类中心映射到不同计算节点上,再次将原始海量图片或视频特征数据映射到所属类对应的计算节点上,这样可以让每个节点处理一个类,最后利用基于p-稳定分布的位置敏感哈希方法建立不同节点上的数据索引。为了减少不同计算节点上搜索结果的合并时间和提高搜索结果的质量,本发明提供了两种方法来选择最近m个类以供后续详细搜索。本发明提供了一种自动将海量数据映射到不同计算节点的向导,此外,本发明还有效地减少了位置敏感哈希搜索阶段的详细比较次数,使得海量数据的搜索更加的准确高效。
-
公开(公告)号:CN103198514A
公开(公告)日:2013-07-10
申请号:CN201310097258.3
申请日:2013-03-25
Applicant: 南京大学
Abstract: 一种三维地震体数据的实时光线投射体绘制方法,使用CUDA并行技术进行体数据块是否可见的判断,再使用CUDA并行技术判断体数据块当前分辨率是否需要提高,以上两步从低分辨率开始循环,逐步提高分辨率,直到满足分辨率要求、显存不足无法提高分辨率或已经达到最高分辨率为止,以确定最终渲染时体数据块各自所使用的分辨率;在渲染处理中使用多线程技术对需要调度的体数据块进行I/O调度,同时使用CUDA并行技术对调度进来的数据进行光线投射体绘制。相对于现有的光线体绘制方法,本发明可适用于海量体数据实时体绘制、可以在一个场景下有多个分辨率等级的数据参与绘制,计算速度快、成像效果好。
-
公开(公告)号:CN101702244B
公开(公告)日:2012-04-25
申请号:CN200910213092.0
申请日:2009-11-10
Applicant: 南京大学
Abstract: 一种适用于绘制区域任意划分的并行绘制负载平衡方法,用于三维渲染,通过剖分屏幕空间在多个绘制节点间分配计算任务,绘制节点也称渲染节点,包括预处理、负载评估、负载平衡、调整屏幕空间上的子绘制区域、绘制下一帧五个步骤。本发明使用多维二叉搜索树KD树对场景空间进行划分,在此基础上进行快速的负载评估,得到各节点下一帧绘制的负载预测值,最后基于这些预测值,再利用本发明提出的负载矩形构造负载矩阵,完成负载平衡,有效地避免了过多的负载评估过程,从而进一步提高了系统的整体效率,能很好地处理场景变化剧烈的情况。
-
公开(公告)号:CN114494314B
公开(公告)日:2025-05-06
申请号:CN202111615241.3
申请日:2021-12-27
Applicant: 南京大学
IPC: G06T7/13 , G06F16/75 , G06N3/0455
Abstract: 时序边界检测方法及时序感知器,基于变换解码器结构和注意力机制,建立通用的无类别时序动作检测模型,检测模型的编码器中引入少量隐特征查询量,通过交叉注意力机制将输入特征压缩到固定维度,并使用变换解码器对特征进行解码,实现通用无类别时序边界的稀疏检测。本发明通过特征压缩,有效解决了长视频的时序冗余问题,并将二次模型的复杂度降低到线性级别;构建边界查询量和上下文查询量这两种隐特征查询量,以相应处理视频中语义不连贯的边界区域和连贯的上下文区域,充分利用视频的语义结构;提出基于交叉注意力计算的对齐损失函数,使网络快速稳定收敛;使用变换解码器稀疏编码边界位置,避免复杂后处理,提高模型泛化性能。
-
公开(公告)号:CN114972939B
公开(公告)日:2025-03-18
申请号:CN202210467937.4
申请日:2022-04-29
Applicant: 南京大学
IPC: G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 一种融合多层空洞卷积与注意力机制的三维断层识别方法,通过识别网络对输入的待预测图像输出断层识别结果,识别网络包括基于多层空洞卷积的H‑Unet网络和基于注意力机制的RA‑Unet网络,以三维合成地震数据体和其标签作为输入分别训练H‑Unet网络和RA‑Unet网络,将两个网络的预测结果相融合,对两个网络在每个像素点上的预测结果进行加权求平均,输出最后的预测图像作为识别结果。本发明针对三维地震断层识别特点,设计了基于多层空洞卷积的H‑Unet网络和基于注意力机制的RA‑Unet网络融合的识别网络,能够有效提取三维地震数据体的信息,识别断层及其宽度和局部细节。
-
公开(公告)号:CN119027693A
公开(公告)日:2024-11-26
申请号:CN202310590319.3
申请日:2023-05-24
Applicant: 南京大学
IPC: G06V10/74 , G06V10/774 , G06V10/764 , G06V10/75 , G06T7/20 , G06T7/70 , G06V20/40
Abstract: 一种结合孪生网络和快速目标优化的电视跟踪方法,构建一个电视跟踪模型用于跟踪拍摄,电视跟踪模型包括孪生跟踪网络和快速目标优化模块,由孪生跟踪网络根据跟踪模板和搜索区域得到初步跟踪结果,然后由快速目标优化模块自适应更新跟踪使用的跟踪模板,实现在线跟踪以及跟踪器的在线更新。本发明利用孪生网络具备的高效的特征提取能力,能够充分提取目标和搜索区域的特征,通过相似度计算得出初步的跟踪结果,同时采用快速目标优化模块,有效解决了电视跟踪中目标运动轨迹复杂导致的跟踪鲁棒性较低的问题。
-
公开(公告)号:CN118898728A
公开(公告)日:2024-11-05
申请号:CN202310496397.7
申请日:2023-05-05
Applicant: 南京大学
Abstract: 一种群体和谓词并行预测的群体视觉关系检测方法,首先从输入图像中提取物体,根据物体种类和物体视觉特征计算物体相似度,根据相似度将物体划分到多个候选群体中,并将候选群体一一配对组成候选群体对,接着提取物体层级、群体层级、群体对层级的视觉特征、语义特征和位置特征,之后通过交叉注意力编码群体中的物体特征预测物体是否在群体中,并用物体置信度加权物体特征,与群体特征和群体对特征拼接后预测谓词。最后根据物体构成群体的置信度和谓词可能性生成群体视觉关系。本发明基于群体范围与群体视觉关系谓词相互影响的发现,通过并行预测群体范围和谓词类别,找出谓词和群体范围准确匹配的群体视觉关系,具有良好的广泛性。
-
公开(公告)号:CN113569605B
公开(公告)日:2024-07-16
申请号:CN202110058983.4
申请日:2021-01-17
Applicant: 南京大学 , 腾讯科技(深圳)有限公司
IPC: G06V20/40 , G06V10/762 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种视频信息处理方法,包括:对目标视频进行采样处理以获取目标视频所对应的采样图像帧和中心图像帧;确定中心图像帧的物体特征向量、层次关系树结构、关系特征向量;确定采样图像帧的物体时序特征向量和关系时序特征向量;根据物体特征向量、关系特征向量、层次关系树结构、物体时序特征向量和采样图像帧的关系时序特征向量,通过视频信息处理模型进行特征向量聚合处理;对采样图像帧中的物体进行分类;确定与目标视频相对应的视频场景图。本公开还提供了信息处理装置、电子设备及存储介质。本公开不但有效压缩视频处理模型的模型结构,减少计算量,同时所生成的场景图的准确率较高,场景图生成速度较快,提升了用户的使用体验。
-
公开(公告)号:CN113761975B
公开(公告)日:2023-12-15
申请号:CN202010498569.0
申请日:2020-06-04
Applicant: 南京大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/80
Abstract: 一种基于多模态特征融合的人体骨架动作识别方法,在存储空间、计算资源受限的条件下,利用骨架序列和少量图片信息对视频中人体动作进行分类,实现动作识别。本发明通过对每个待分类视频只抽取一帧作为图片信息,为静态动作类别引入了环境信息,但是没有增加太大的存储、计算压力,将由视频得到骨架序列信息和图片信息这两种模态信息进行融合,实现对视频中人体动作识别,并进一步提出了特征替换训练过程和KL散度的约束方法,进一步提高识别的精度。与现有其他动作识别方法相比,本发明在不同数据集的测试精度指标上都取得了很好的效果。
-
公开(公告)号:CN116824234A
公开(公告)日:2023-09-29
申请号:CN202310702902.9
申请日:2023-06-14
Applicant: 南京大学
IPC: G06V10/764 , G06V10/82 , G06V10/52 , G06N3/0455 , G06N3/084 , G06N3/082
Abstract: 一种基于不动点建模的目标检测的方法、设备及存储介质,基于不动点建模的目标检测器训练策略,将原有的计算机视觉中的多层用于微调的解码器层进行压缩,仅使用一层进行不动点迭代来不断微调检测结果,同时在训练过程中采用微调感知梯度策略,以及微调感知扰动策略,通过增强检测器对于微调过程的感知,来提高目标检测器的性能。本发明能够和现有方法进行很好的融合,可以迁移到现有的多种目标检测器中,不改变模型结构的同时,通过不动点建模,将多层参数共享,降低参数量和节省训练显存的同时提升目标检测器的性能。
-
-
-
-
-
-
-
-
-