-
公开(公告)号:CN120071262A
公开(公告)日:2025-05-30
申请号:CN202510544521.1
申请日:2025-04-28
Applicant: 南京邮电大学
IPC: G06V20/52 , G06V20/54 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本申请属于行人意图预测技术领域,公开了一种面向复杂交通场景的行人意图预测方法,包括:步骤1从行人过马路视频中提取局部流特征和全局流特征,步骤2局部流模块提取局部流特征;步骤3全局流模块提取全局流特征;步骤4局部流模块和全局流模块通过跨注意力模块进行特征交互生成跨注意流特征;步骤5局部流特征、全局流特征和跨注意流特征通过特征融合模块进行特征融合;步骤6通过全连接层将融合后的特征映射到预测结果,完成行人意图预测。本申请解决了现有技术中的局部与全局特征融合不足、跨流信息交互不充分、多尺度特征捕获不足等问题,有效提高了行人意图预测的准确性,具有广泛的应用前景。
-
公开(公告)号:CN118098288B
公开(公告)日:2024-06-28
申请号:CN202410506018.2
申请日:2024-04-25
Applicant: 南京邮电大学
IPC: G10L25/66 , G10L25/30 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/0895
Abstract: 本发明公开了一种基于自学习标签校正的弱监督语音抑郁症检测方法,属于抑郁症检测技术领域;方法为:收集抑郁症检测数据;建抑郁症检测模型,得到每个样本的预测抑郁概率分布;制定标签校正策略,对训练集数据进行标签校正;采用损失函数对抑郁症检测模型进行训练,得到最终的抑郁症检测模型。本发明通过制定不同的标签校正策略,有效识别并校正训练集的错误标签,减轻数据集中不准确标记对自动抑郁检测模型性能的影响;同时,采用深度学习的方法构建抑郁症检测模型,获取语音信号中更深层次的时空信息,从全局角度更全面地检测音频中的抑郁信号,损失函数在优化网络参数的同时尽可能保留准确的标签,增强了对抑郁症检测的准确性。
-
公开(公告)号:CN118097517A
公开(公告)日:2024-05-28
申请号:CN202410465339.2
申请日:2024-04-18
Applicant: 南京邮电大学
IPC: G06V20/40 , G06V10/82 , G06N3/0464 , G06N3/088
Abstract: 本发明公开了一种基于双流时空编码器的自监督视频异常检测方法,属于视频异常检测技术领域。该方法包括预处理模块、视频流网络、光流网络以及横向链接。该方法引入光流来为模型提供额外的视觉线索,同时结合原始视频,从而设计了一个双流编码器来从视频中提取复杂的时空信息;其次,双流编码器采用针对不同模态数据的定制网络架构,分别为视频流网络和光流网络,实现了对视频中高级视觉特征更全面的提取;最后,通过设计横向连接来促进双流通道之间的信息交互,以弥补了深度网络中的信息遗漏问题。该方法通过以上几点提高了视频异常检测的性能。
-
公开(公告)号:CN118038561A
公开(公告)日:2024-05-14
申请号:CN202410449199.X
申请日:2024-04-15
Applicant: 南京邮电大学
Abstract: 一种基于时空循环架构的3D人体姿态估计方法,通过分别设计三个图卷积网络来处理这些图数据,最终得到一个融合的特征,充分学习关节之间的空间相关性,同时在一定程度上解决了关节的自遮挡问题;采用了一种全局局部的交替机制,通过结合在建模全局信息方面表现出色的自注意力机制和能够控制注意力机制关注范围的滑动窗口机制,以引导网络在较短的时间内关注局部细节,在较长的时间内关注全局信息,因此本方法成功避免了较长序列的干扰,使改进后的自注意力能够交替关注全局和局部信息,更加全面地捕捉时间特征,并在一定程度上解决关节的深度模糊问题。经过实验,与将自注意力机制引入3D人体姿态估计领域的方法PoseFormer比较,本方法更加准确。
-
公开(公告)号:CN116772820A
公开(公告)日:2023-09-19
申请号:CN202310323248.0
申请日:2023-03-29
Applicant: 南京邮电大学
IPC: G01C21/00 , G01C21/20 , G06V20/70 , G06V10/26 , G06V10/82 , G06V10/80 , G06V10/764 , G06V10/46 , G06T7/73
Abstract: 本发明属于计算机视觉领域,公开了一种基于SLAM和语义分割的局部细化建图系统及方法,其应用双目相机视频采集图像,语义分割模块由基于FCN网络框架的DANet模型搭建,在DANet模型中应用网络模型中的通道注意模块和空间注意模块对场景图像进行处理,实现目标识别和语义分割;通过前端视觉里程模块将从语义分割出的目标场景中提取的特征点与其他图像中的相同特征点进行位姿估计;后端优化模块从相机位姿的全局中选取关键帧,利用关键帧质检的关系建立全局约束,构建位姿图;闭环检测模块根据相机位姿及位姿图的误差对位姿图进行优化,得到全局一致的位姿估计,提升SLAM局部精细化建图的性能。
-
公开(公告)号:CN119167994B
公开(公告)日:2025-03-28
申请号:CN202411686885.5
申请日:2024-11-25
Applicant: 南京邮电大学
Abstract: 本发明属于信息技术领域,公开一种基于多层级自编码器的异构图节点表示学习方法,包括数据收集和预处理;构建异构图数据表示,基于多层级自编码器方法构建异构图节点表示学习模型,设计节点级别和关系级别的双重编码器,通过在不同级别捕捉节点和关系信息来生成更全面的节点表示,然后,通过全局解码器重构节点特征,捕捉节点与关系之间的交互信息,对构建的异构图节点表示学习模型进行训练与优化;将待测数据集输入训练后的异构图节点表示学习模型中,对异构图中的节点进行分类,以解决现有计算复杂度高且需要大量领域知识的问题,以解决现有过于依赖节点类型嵌入、忽略关系特征的问题。
-
公开(公告)号:CN118101000B
公开(公告)日:2024-07-02
申请号:CN202410502700.4
申请日:2024-04-25
Applicant: 南京邮电大学
Abstract: 本发明属于车联网无线通信技术领域,公开一种辅助6G车与车通信的混合智能反射面功率分配优化方法;所述方法包括混合智能反射面的配置;建立多车道高速公路车辆场景;混合智能反射面辅助车与车通信信道建模;混合智能反射面辅助车与车通信中继车辆的选择;建立混合智能反射面辅助车与车通信能耗模型;采用基于Dinkelbach的迭代算法优化有源元件放大功率和发射功率,完成功率分配优化;本发明使道路上行驶的每辆车都有成为辅助中继的可能,极大提高了车与车通信灵活性;解决了无源智能反射面的“乘性衰落”和有源智能反射面元件的能耗大的问题,显著提高接收信号的信噪比从而提高车与车通信的可靠性。
-
公开(公告)号:CN118036667B
公开(公告)日:2024-06-14
申请号:CN202410442022.7
申请日:2024-04-12
Applicant: 南京邮电大学 , 江苏拓邮信息智能技术研究院有限公司
IPC: G06N3/0455 , G06N3/0442 , G06N3/0985 , G06N3/048 , G06F18/25 , G06F18/10
Abstract: 本发明公开了一种多源异构流数据预测方法,属于多源异构流数据技术领域;方法为:获取各数据源的数据流;对获取到的数据流进行预处理,获得预处理后的数据流;将预处理后的数据流构建为异构图;构建多源异构数据预测模型,并进行训练;将异构图输入到预训练好的多源异构数据预测模型中进行预测,获得预测结果。本发明通过异构图结构对预处理过的数据进行建模,并使用改进后的Transformer模块作为基础输入进行异构数据流聚合,Transformer模块捕获数据流之间的复杂关系,使用LSTM捕获数据流的时间依赖性,提高多源异构数据流的预测准确率和效率。
-
公开(公告)号:CN118101000A
公开(公告)日:2024-05-28
申请号:CN202410502700.4
申请日:2024-04-25
Applicant: 南京邮电大学
Abstract: 本发明属于车联网无线通信技术领域,公开一种辅助6G车与车通信的混合智能反射面功率分配优化方法;所述方法包括混合智能反射面的配置;建立多车道高速公路车辆场景;混合智能反射面辅助车与车通信信道建模;混合智能反射面辅助车与车通信中继车辆的选择;建立混合智能反射面辅助车与车通信能耗模型;采用基于Dinkelbach的迭代算法优化有源元件放大功率和发射功率,完成功率分配优化;本发明使道路上行驶的每辆车都有成为辅助中继的可能,极大提高了车与车通信灵活性;解决了无源智能反射面的“乘性衰落”和有源智能反射面元件的能耗大的问题,显著提高接收信号的信噪比从而提高车与车通信的可靠性。
-
公开(公告)号:CN118034608A
公开(公告)日:2024-05-14
申请号:CN202410329930.5
申请日:2024-03-21
Applicant: 南京邮电大学
IPC: G06F3/06 , G06F16/901 , G06F16/906 , G06F16/903
Abstract: 本发明提供一种基于B+树和WAL的图形数据库读写性能优化方法,用于基于键值对即KV对构建的图形数据库,判定顶点是否为超级顶点;根据超级顶点同一边类型的出度,确定采用一级存储或多级存储;对采用以B+树进行多级存储的超级顶点,将同一边类型的多个KV对组成一个B+树,保存一个超级顶点的相同边类型的所有边;将顶点id和边类型、B+树的根结点作为一个kv对存储,即通过顶点id和边类型得到B+树的根结点信息;基于顶点的读取请求,对多级存储的超级顶点,根据顶点id和边类型,查询B+树叶子结点信息合并;对顶点的边写入请求,对多级存储的超级顶点,根据顶点id和边类型、边数据信息,查询B+树边所在叶子结点EdgePage的节点,先写WAL日志,同时更新该节点的内存值;在B+树拆分与合并过程中将内存值落盘;该方法基于B+树和WAL,通过同一边类型的多个kv对组成一个B+树实现保存一个超级顶点的相同边类型的所有边,能够提高查询或写入性能,能够实现读写性能的平衡性最好,实现读写性能最优。
-
-
-
-
-
-
-
-
-