-
公开(公告)号:CN110909207A
公开(公告)日:2020-03-24
申请号:CN201910845200.X
申请日:2019-09-08
Applicant: 东南大学
IPC: G06F16/74 , G06F16/783 , G06T5/40 , G06T7/90
Abstract: 本发明公开了一种包含手语的新闻类视频描述数据集构建方法,该方法的主要特征在于把新闻类视频构建成包含音频、视频、手语、语言描述的数据集;该方法利用色差直方图算法进行视频的自动分割,并使用ffmpeg完成视频信息的自动提取,最后构建图形用户界面并根据用户输入信息自动生成视频描述与视频信息json文件。本发明通过利用新闻视频数据与手语信息构建数据集,为视频描述网络的研究以及视频描述技术在残疾人士服务中的应用提供了支持。
-
公开(公告)号:CN106934806B
公开(公告)日:2019-09-10
申请号:CN201710135456.2
申请日:2017-03-09
Applicant: 东南大学
Abstract: 本发明公开一种基于结构清晰度的无参考图失焦模糊区域分割方法,包括以下步骤:(1)缩放图像,将图像缩放为原图像面积的约1/4倍;(2)计算清晰度差值,分别计算原图和缩放后图像对应位置图像块的结构清晰度,并计算二者的差;(3)提取模糊区域,滤除差值图像的噪声,使用图像分割算法分割出模糊区域,并对分割后的结果进行上采样。针对无参考图像的失焦模糊区域分割,本发明使用原始图像构造缩放图像,分别计算缩放图像以及原始图像的清晰度,进而获得模糊度分布图像,最终快速有效地分割出图像失焦模糊区域。
-
公开(公告)号:CN108305279B
公开(公告)日:2019-07-05
申请号:CN201711445476.6
申请日:2017-12-27
Applicant: 东南大学
Abstract: 本发明公开了一种迭代空间模糊聚类的大脑磁共振图像超体素生成方法,包括以下步骤:首先,由于人类大脑具有相同的拓扑结构,从基于群体的大脑MRI模板获得一组种子模板;其次,为了排除部分容积效应的影响,提出了一种迭代空间模糊聚类算法,将体素分配给每个种子生成超体素。本发明能较好地应用于大脑磁共振图像,生成有效的大脑磁共振图像超体素。
-
公开(公告)号:CN104881682B
公开(公告)日:2019-03-05
申请号:CN201510274498.5
申请日:2015-05-26
Applicant: 东南大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于保局映射与主成分分析的图像分类方法,包括以下步骤:1、输入训练对象;2、建立一层或两层的流形学习网络,对于每一种具体的网络,学习得到每一层的滤波器;3、建立流形学习网络的输出层得到最终特征向量;4、将步骤3中最终得到的所有的特征向量输入支持向量机分类器进行训练;5、用校验图像集进行校验,调整到最佳网络参数;6、对测试图像进行测试,统计分类结果,计算识别率。本发明通过构造三种结构相似但不同网络层的网络,应用一种流形方法即保局映射获得图像更加本质的的局部结构,使得在各种分类任务中,构造的网络更加具有分辨力,获得更高的图像的分类准确率。
-
公开(公告)号:CN108305279A
公开(公告)日:2018-07-20
申请号:CN201711445476.6
申请日:2017-12-27
Applicant: 东南大学
CPC classification number: G06T7/344 , G06K9/6218 , G06T2207/10088 , G06T2207/30016
Abstract: 本发明公开了一种迭代空间模糊聚类的大脑磁共振图像超体素生成方法,包括以下步骤:首先,由于人类大脑具有相同的拓扑结构,从基于群体的大脑MRI模板获得一组种子模板;其次,为了排除部分容积效应的影响,提出了一种迭代空间模糊聚类算法,将体素分配给每个种子生成超体素。本发明能较好地应用于大脑磁共振图像,生成有效的大脑磁共振图像超体素。
-
公开(公告)号:CN105652264B
公开(公告)日:2018-07-10
申请号:CN201610006173.3
申请日:2016-01-05
Applicant: 东南大学
Abstract: 本发明公开了一种基于高阶累积量的多路径传播声信号分离方法。本发明将原有的基于二阶累积量的主动宽带信号分离方法拓展到四阶累计量,根据四阶累计量构造相应的副本矢量和噪声子空间,并假设声信号传播过程中的加性噪声为彩色噪声,最后根据与噪声子空间的正交性搜索出声线路径。本发明还公开了一种基于声线传播时间层析的海洋声层析方法以及一种声源定位方法。相比现有技术,本发明具有更高分离精度,能正确分离出间隔较小的声线路径,并能适用于传感器数目小于射线路径的情况,同时还可抑制高斯噪声和非高斯噪声的影响。
-
公开(公告)号:CN106991251A
公开(公告)日:2017-07-28
申请号:CN201710285324.8
申请日:2017-04-27
Applicant: 东南大学
IPC: G06F17/50
Abstract: 本发明公开了一种高速公路交通流元胞机仿真方法,是融合多路段车辆密度和车道个数变化的高速公路交通流元胞机仿真方法,建立一个基于真实的高速公路的流量情况,多路段不同道路特征、车辆情况建立的元胞机的仿真模型。将检测到的流量,映射到道路密度进行道路的状态仿真,做真实的测量数据和元胞机的车辆数的映射;并提出了元胞机的新的一种边界条件,考虑高速公路车道个数变化,多个路段的密度不一样,并且涉及到车道之间的车辆信息传递的一些工作,经过检验,交通流仿真结果更为精确,能够模拟实际的交通流的数据。
-
公开(公告)号:CN106485279A
公开(公告)日:2017-03-08
申请号:CN201610895130.5
申请日:2016-10-13
Applicant: 东南大学
CPC classification number: G06K9/4647 , G06K9/6256 , G06K9/6267
Abstract: 本发明公开了一种基于Zernike矩网络的图像分类方法,包括以下步骤:(1)输入并预处理训练图像和测试图像,得到输入图像的局部特征矩阵,建立一个两层的基于Zernike矩的网络,得到训练图像和测试图像的主特征向量;(2)用获得的训练图像的主特征向量训练分类器,将测试图像的主特征向量输入已经训练好的分类器中进行分类,计算出分类正确率。本发明通过构造一个两层的基于Zernike矩的网络,利用Zernike矩的旋转不变性,能够获得图像的旋转不变的特征和图像的非线性特征,使得对图像特征的描述更精准,分类也更为准确。对于图像分类问题,尤其是对于具有旋转特征的图像的分类问题有着更高的分类正确率。
-
公开(公告)号:CN105703841A
公开(公告)日:2016-06-22
申请号:CN201610132769.8
申请日:2016-03-09
Applicant: 东南大学
CPC classification number: H04B11/00 , G01S7/539 , H04B7/0617
Abstract: 本发明公开了一种多路径传播宽带主动声信号的分离方法。本发明分两步实现声线路径的分离,第一步首先对传感器阵列所接收信号进行空域平滑与TCT变换,计算频谱矩阵,构造相应的副本矢量与噪声子空间,根据信号子空间与噪声子空间的正交性,计算多项式的根,估算出声线路径在传感器间的时间延迟;第二步、对传感器接收信号进行空域-频域平滑,计算频谱矩阵,构造相应的副本矢量与噪声子空间,根据信号子空间与噪声子空间的正交性,并结合传感器间的时间延迟,计算多项式的根,估算出声线路径到达传感器的时间。本发明还公开了一种基于声线传播时间层析的海洋声层析方法及一种声源定位方法。本发明在允许的误差范围内可大幅提高声信号分离的效率。
-
公开(公告)号:CN102163976A
公开(公告)日:2011-08-24
申请号:CN201110022112.3
申请日:2011-01-20
Applicant: 东南大学
IPC: H03M7/40
Abstract: 本发明公开了一种基于GDFT-II变换的快速解码方法,属于数字信号处理技术领域。本发明将长度为N/2的信号序列{am}和{bm},m=0,1,…,N/2-1,的GDFT-II域系数{Ai}和{Bi},i=0,1,…,N/2-1,转换为长度为N的原始编码信号序列{xn},n=0,1,…,N-1,的GDFT-II域系数{Xk},k=0,1,…,N-1,其中{Xk}的计算分成偶数输出索引{X2i}和奇数输出索引{X2i+1}两个部分分别进行计算,从而减少了GDFT-II变换次数,从而降低了解码过程的计算复杂度。相比现有技术,本发明方法不仅具有较低的复杂度,解码实时性更好,而且具有更少的信号失真。
-
-
-
-
-
-
-
-
-