-
公开(公告)号:CN109949176B
公开(公告)日:2022-07-15
申请号:CN201910245861.9
申请日:2019-03-28
Applicant: 南京邮电大学
IPC: G06Q50/00 , G06F16/901
Abstract: 本发明公开了一种基于图嵌入的社交网络中异常用户检测方法,根据社交网络图中的用户节点和社区的归属关系值构建初始的用户节点嵌入模型,然后根据某个用户节点和其他用户节点建立目标函数,进而得到最终的用户节点嵌入模型,选取某个用户节点最终嵌入模型和其他用户节点之间的连接关系得到嵌入加权向量公式,根据嵌入加权向量公式采用数据归一化方法得到用户节点的异常水平公式,当用户节点异常水平大于最大阈值或者小于最小阈值定义为异常用户节点。本发明方法能够有效提升社交网络中异常用户节点检测的有效性和准确性。
-
公开(公告)号:CN108399435B
公开(公告)日:2020-09-25
申请号:CN201810237226.1
申请日:2018-03-21
Applicant: 南京邮电大学
Abstract: 本发明公开一种基于动静特征的视频分类方法,解决视频分类准确度不够高的问题。本发明首先对视频中的动态特征和静态特征进行处理,利用Cholesky变换对这些信息融合后,使用GRU神经网络完成视频的分类;接着通过DT算法捕获每个视频帧的动态特征,再通过DBSCAN聚类算法将每个视频帧隔离,在每个视频片段的每个帧里构建运动框并连接每个视频片段相邻帧之间的运动框,完成动态特征的捕获和跟踪;然后通过HoG和BoW方法将动态特征生成动态信息直方图与通过CNN神经网络生成的静态信息直方图利用Cholesky变换相融合;最后利用GRU神经网络实现视频的分类。本发明通过对动态和静态信息的分开处理,能够提升视频分类的准确性,具有良好的实施性和鲁棒性。
-
公开(公告)号:CN110175575A
公开(公告)日:2019-08-27
申请号:CN201910454096.1
申请日:2019-05-29
Applicant: 南京邮电大学
Abstract: 本发明公开一种基于新型高分辨率网络架构进行单人姿态估计的方法。该发明首先用检测器对输入的包含单个行人的图像进行检测,去除不精确的检测框,其次通过数据增强来扩充数据集;然后在实例化网络结构中通过并行多分辨率子网保持高分辨率特征图,而不需要恢复分辨率,在并行子网中引入交换单元,使每个子网重复地从其他并行子网接收信息,提高对单人姿态估计的准确率;由于在大多数的复杂场景中,会出现关键点被遮挡的现象,所以提出使用一个关键点掩蔽的数据增强方案,通过这个方案可以很有效地微调训好的卷积神经网络,通过相邻的匹配强大地定位被遮挡的关键点,提升对遮挡问题的准确率,从而得到更优的模型。
-
公开(公告)号:CN109903339A
公开(公告)日:2019-06-18
申请号:CN201910235608.5
申请日:2019-03-26
Applicant: 南京邮电大学
Abstract: 本发明公开一种多维融合特征的视频群体人物定位检测方法。该发明首先抽取多层级视频特征图,建立自顶向下和自底向上的双向特征处理通道充分挖掘视频的语义信息,接着融合多层级视频特征图获取多维融合特征,抓取视频候选目标,最后并行处理候选目标位置回归和类别分类,完成视频群体人物定位检测。本发明通过融合多层级特征获得丰富的视频语义信息,同时进行多任务预测操作,有效提升群体人物定位检测的速度,具有良好的准确率和实施性。
-
公开(公告)号:CN115019173B
公开(公告)日:2024-11-22
申请号:CN202210661728.3
申请日:2022-06-13
Applicant: 南京邮电大学
IPC: G06V20/10 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本发明属于图像识别技术领域,具体地说,是一种基于ResNet50的垃圾识别与分类方法,包括:选取涵盖有实际生活中常见的多种垃圾图片的公开数据集,创建成适合垃圾分类研究所需要的数据集,然后将数据集分为训练集与测试集,对训练集中的图像进行预处理操作;搭建网络模型,选取ResNet50卷积神经网络模型作为基准模型,引入深度可分离卷积,添加CBMA和SE两种注意力机制,从而创建出新型卷积神经网络模型;设置网络模型的超参数,选择损失函数和优化方法对创建出的网络模型进行训练,可得到训练好的模型;利用训练好的卷积神经网络模型去识别测试集中的图片,最后得到识别的精度。
-
公开(公告)号:CN109903339B
公开(公告)日:2021-03-05
申请号:CN201910235608.5
申请日:2019-03-26
Applicant: 南京邮电大学
Abstract: 本发明公开一种多维融合特征的视频群体人物定位检测方法。该发明首先抽取多层级视频特征图,建立自顶向下和自底向上的双向特征处理通道充分挖掘视频的语义信息,接着融合多层级视频特征图获取多维融合特征,抓取视频候选目标,最后并行处理候选目标位置回归和类别分类,完成视频群体人物定位检测。本发明通过融合多层级特征获得丰富的视频语义信息,同时进行多任务预测操作,有效提升群体人物定位检测的速度,具有良好的准确率和实施性。
-
公开(公告)号:CN111105443A
公开(公告)日:2020-05-05
申请号:CN201911362575.7
申请日:2019-12-26
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于特征关联的视频群体人物运动轨迹跟踪方法。该发明首先检测视频中出现的群体人物,获取群体人物的位置信息和特征掩码;接着检测新增人物,选定当前追踪人物,逐帧计算当前追踪人物与相邻视频帧中人物的关联相似度;最后结合关联相似度,确定当前追踪人物的帧间动态,更新当前追踪人物运动线索,并遍历视频序列完成视频群体人物的运动轨迹跟踪。本发明利用群体人物的运动特性,在帧间人物关联匹配过程中,综合考虑位置关系和动作形态的影响,能够有效提高群体人物运动轨迹跟踪的准确率,具有良好的实施性和鲁棒性。
-
公开(公告)号:CN115019173A
公开(公告)日:2022-09-06
申请号:CN202210661728.3
申请日:2022-06-13
Applicant: 南京邮电大学
IPC: G06V20/10 , G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明属于图像识别技术领域,具体地说,是一种基于ResNet50的垃圾识别与分类方法,包括:选取涵盖有实际生活中常见的多种垃圾图片的公开数据集,创建成适合垃圾分类研究所需要的数据集,然后将数据集分为训练集与测试集,对训练集中的图像进行预处理操作;搭建网络模型,选取ResNet50卷积神经网络模型作为基准模型,引入深度可分离卷积,添加CBMA和SE两种注意力机制,从而创建出新型卷积神经网络模型;设置网络模型的超参数,选择损失函数和优化方法对创建出的网络模型进行训练,可得到训练好的模型;利用训练好的卷积神经网络模型去识别测试集中的图片,最后得到识别的精度。
-
公开(公告)号:CN111753704B
公开(公告)日:2022-08-26
申请号:CN202010562822.4
申请日:2020-06-19
Applicant: 南京邮电大学
Abstract: 本发明公开一种基于视频人物唇读识别的时序集中预测方法,首先输入人物唇动视频帧序列并提取唇部的时空特征,采用嵌入了SENet模块的残差网络获取多通道下人物唇部的有用特征,将特征输入双向门控循环单元得到唇动轮廓所对应字符的概率分布,并引入连接主义者的时间分类算法对齐时间步长上的各文本标签和字符;接着针对前后时序关系,利用双向门控循环单元的隐藏状态,建立时序关联的注意力窗口以集中成上下文向量,对该上下文向量在注意力窗口长度下的概率分布向量再次细分规划;最后对每个当前时间的概率分布向量设置注意力单元并重新汇集为能够预测唇读对应字符的概率。本发明通过对时序信息的前后集中关联,能有效预测和识别视频中人物唇读内容。
-
公开(公告)号:CN108710836B
公开(公告)日:2020-10-09
申请号:CN201810422275.2
申请日:2018-05-04
Applicant: 南京邮电大学
Abstract: 本发明公开一种基于级联特征提取的唇部检测及读取方法。该发明首先对输入视频的唇部区域,通过基于哈尔分类器和自适应推进算法的维奥拉琼斯方法实现检测;然后根据唇区色彩特征对检测区域进行阈值二值化以实现唇区提取,通过离散余弦变换将图像信息集中于数据矩阵的角区域,采用阈值筛选法提取数据;然后通过主成分分析法对贡献值最高的多个特征做维度提取,使数据进一步降维;使用样本数据建立用于识别的序列字典树,使用莱文斯坦距离做序列相似度分析和模糊匹配;最后将每帧静态特征与视频动态特征结合,通过动态序列查询完成唇区读取。本发明通过对唇区图像特征的多级提取和降维,能够提升唇读的速度和准确性,具有良好的实施性和鲁棒性。
-
-
-
-
-
-
-
-
-