-
公开(公告)号:CN114972435A
公开(公告)日:2022-08-30
申请号:CN202210655087.0
申请日:2022-06-10
Applicant: 东南大学
Abstract: 本发明公开了一种基于长短时集成外观更新机制的目标跟踪方法。该方法首先利用数据预处理步骤处理数据集,构建孪生网络,利用数据训练网络参数。接着基于训练好的孪生网络,利用长短时集成外观更新机制在视频中进行目标跟踪,包括:将搜索区域和长短时模板池中选取的两组模板输入网络,得到两次预测结果;应用长短时集成外观更新机制,分析两次预测结果,得到目标在当前帧的位置;对长短时模板池进行更新。本发明所述的外观更新机制,能够有效更新目标外观,提升对相似干扰物体的分辨能力,从而提升目标跟踪的准确性,尤其适用复杂场景下的长时目标跟踪任务。
-
公开(公告)号:CN108765255B
公开(公告)日:2022-04-29
申请号:CN201810553288.3
申请日:2018-05-31
Applicant: 东南大学
IPC: G06T1/00
Abstract: 本发明公开了一种基于压缩感知技术的角度量化索引调制图像水印方法,采用混沌序列构建稀疏随机测量矩阵作为观测矩阵,利用压缩感知技术以及角度量化索引调制算法,将水印信息安全、隐蔽地嵌入到载体图像的压缩感知域中。本发明还提出一种基于压缩感知技术的角度量化索引调制图像水印系统,包括构建观测矩阵模块、水印嵌入模块,信息传输模块,水印提取模块。本发明在发送端通过角度量化索引调制算法将水印信息嵌入到载体图像的压缩感知域中,并将观测矩阵的相关信息以及水印的嵌入位置作为密钥发送到接收端,实现水印提取,具有隐蔽性好、安全性高等优点,并且在抵抗噪声、滤波、图像压缩、幅度缩放等常规水印攻击时表现出很强的鲁棒性。
-
公开(公告)号:CN111080730A
公开(公告)日:2020-04-28
申请号:CN201911051131.1
申请日:2019-10-31
Applicant: 东南大学
Abstract: 本发明公开了一种基于跨通道和空间加权卷积特征的脑图像解码方法,该方法以稀疏线性回归模型作为脑解码器的基础,通过输入大脑视觉皮层区域的核磁共振信号来预测受试者所看到图片的高级语义卷积特征。一旦解码器训练完成后,对于任意给定一组测得的fMRI信号,可以通过该解码器判别出受试者当时所看到图片的类别。本发明还提出了一种脑图像解码系统,与传统方法相比,本发明针对卷积网络特征缺乏几何不变性的缺点,对不同通道及空间位置上的卷积特征进行加权,得到了表征能力更强的特征,从而提高了识别的准确性;另一方面,本发明所利用的卷积特征,消除了随机性带来的干扰,更加稳定,且特征维数更低,大幅减少了计算量。
-
公开(公告)号:CN108876721A
公开(公告)日:2018-11-23
申请号:CN201810552826.7
申请日:2018-05-31
Applicant: 东南大学
Abstract: 本发明公开了一种基于课程学习的超分辨率图像重建方法,该方法设计了一种新的深度神经网络训练方法,通过为训练样本设置学习的先后顺序,促进神经网络的收敛。包括以下步骤:1)对输入图像进行预处理;2)按照训练样本的纹理复杂度将训练样本分成多个训练子集;3)基于改进的课程学习方法在已分类的训练子集上训练深度神经网络;4)训练多个神经网络来实现不同倍数的放大,从而依据实际情况恢复出丢失的纹理细节。本发明还公开了一种基于课程学习的超分辨率图像重建系统。本发明解决了深度神经网络训练时间较长的问题,同时,在超分辨率重建上的效果也明显优于传统方法训练的深度网络。
-
公开(公告)号:CN109348228A
公开(公告)日:2019-02-15
申请号:CN201811073734.7
申请日:2018-09-14
Applicant: 东南大学
IPC: H04N19/467 , H04N1/32
Abstract: 本发明公开了一种基于图像分割和图像空间相关性的图像加密域可逆信息隐藏方法及系统。在图像发送端,图像拥有者通过设计的图像分割算法将图像分割为三个部分:黑色部分、白色部分和灰色部分。采用预测误差扩展和多直方图平移相结合的方式利用灰色部分对黑色部分进行预测,通过自适应的可逆信息隐藏算法将白色部分的最低有效位嵌入到图像的黑色部分,再通过加密秘钥生成加密图像;信息隐藏者通过隐藏秘钥对图像进行秘密信息的嵌入。在图像接收端,接受者既可以先提取秘密信息再恢复原始图像也可以先恢复原始图像再提取秘密信息,实现秘密信息和原始图像的可逆性。本发明具有隐秘性好,嵌入容量大等优点。
-
公开(公告)号:CN108921024A
公开(公告)日:2018-11-30
申请号:CN201810553330.1
申请日:2018-05-31
Applicant: 东南大学
Abstract: 本发明公开了一种基于人脸特征点信息与双网络联合训练的表情识别方法,涉及到自动表情识别领域;设计了一种针对不定长图片序列的关键帧抽取方法,包括以下步骤:(1)人脸特征点定位;(2)累计各帧特征点位移,抽取使其最大化的图片子序列;(3)对子序列的特征点坐标进行归一化及加噪处理作为序列特征;(4)将输入特征分别送入双层双向长短期记忆网络和四层全连接网络,分别独立训练;(5)将两个子网络的特征层相加,基于来自两个子网络的验证信号,以及自身的损失函数,继续训练两个子网络,得到最终的判别结果。本发明解决了不定长图片序列的表情识别问题,以及常规深度学习方法的效率低下问题,达到了提高识别效率与准确率的效果。
-
公开(公告)号:CN108764287A
公开(公告)日:2018-11-06
申请号:CN201810374361.0
申请日:2018-04-24
Applicant: 东南大学
CPC classification number: G06K9/6268 , G06K9/46 , G06N3/0454
Abstract: 本发明公开了一种基于深度学习和分组卷积的目标检测方法,涉及到基于深度学习的目标检测领域;其方法设计了一种新的网络结构:双路结构,双路结构主要包括主路结构和支路结构。该目标检测方法包括以下步骤:1)、对输入图像进行预处理;2)、基于区域推荐网络在输入图像上生成大量候选区域;3)、利用基于双路结构的卷积神经网络提取各候选区域的特征;4)、将所提取的特征输入分类器,进行分类。本发明还提出一种目标检测系统,包括图像采集单元,图像分析单元,分类单元。本发明解决了数据量、计算量大所导致的检测效率低的问题,达到了降低人力成本、提高安保等工作效率的效果。
-
公开(公告)号:CN108711130A
公开(公告)日:2018-10-26
申请号:CN201810374330.5
申请日:2018-04-24
Applicant: 东南大学
IPC: G06T1/00
CPC classification number: G06T1/0021 , G06T2201/0052 , G06T2201/0065
Abstract: 本发明公开了一种基于压缩感知噪声重构的图像水印方法,利用压缩感知重构原理,对噪声攻击前后的水印载体图像进行观测得到噪声观测结果,利用正交匹配追踪算法迭代重构出噪声信息,在水印提取前先利用重构出的噪声信息对攻击后的水印载体图像作去噪处理,然后再进行水印提取。本发明还提出一种基于压缩感知噪声重构的图像水印系统,包括水印嵌入模块,信息传输模块,压缩感知噪声重构模块,水印提取模块。本发明利用噪声的稀疏特性,通过正交匹配追踪OMP算法对含噪声的载体图像进行噪声重构和去噪处理,从而实现基于压缩感知噪声重构的水印提取,具有隐蔽性好、安全性高的优点,在抵抗噪声、滤波、压缩等常规信号攻击时表现出较强的鲁棒性。
-
公开(公告)号:CN102737643A
公开(公告)日:2012-10-17
申请号:CN201110092780.3
申请日:2011-04-14
Applicant: 东南大学
IPC: G10L21/02
Abstract: 本发明提供一种基于Gabor时频分析的耳语增强方法,包括如下步骤:第1步:利用Gabor时频分析理论和方法提取耳语音对数谱幅度,第2步,基于无语音概率的耳语音噪声谱估计,第3步,获取纯净耳语音的功率谱,并求增强后的耳语音信号;本发明基于Gabor变换下的耳语音功率谱根据抽样率的不同有着多样的时频分析细腻度,从而可以根据不同的语音类型采用不同的抽样率,使算法普适性更强。
-
公开(公告)号:CN116385464A
公开(公告)日:2023-07-04
申请号:CN202310374236.0
申请日:2023-04-10
Applicant: 东南大学
IPC: G06T7/11 , G06V10/774 , G06V10/77 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于Transformer和UNet的多模态医学图像分割方法和系统。以编解码器结构UNet为框架,设计了两个Transformer模块取代了UNet中的跳跃连接。这两个模块分别为用于多尺度特征信息融合的通道级交叉融合Transformer模块以及用于编解码器信息融合的通道级交叉注意力机制模块,并将提出的方法称为CTransUNet。针对每个分割任务,首先用大量外部数据训练网络;然后将待分割图像经过预处理后送入训练好的网络进行预测;最后对预测结果进行后处理以消除过少的错误类别。本发明采用端到端的整体框架来分割医学图像,输入图像后便能直接得到分割结果。
-
-
-
-
-
-
-
-
-