-
公开(公告)号:CN108171009A
公开(公告)日:2018-06-15
申请号:CN201711392385.0
申请日:2017-12-21
Applicant: 东南大学
Abstract: 本发明公开了一种基于二维自回归模型参数估计的脑电信号间因果关系检测方法,包括以下步骤:(1)自回归模型进行阶数估计;(2)对原始信号进行加窗处理;(3)结合OPS算法对自回归模型进行参数估计;(4)所得自回归模型应用于Wiener‑Granger因果方法检测脑电信号间的因果关系。该方法最大限度地减少自回归模型参数估计中的干扰项,并提高参数估计结果的精度。
-
公开(公告)号:CN114699168B
公开(公告)日:2025-04-18
申请号:CN202210075799.5
申请日:2022-01-23
Applicant: 东南大学
Abstract: 本发明公开一种基于双平面超声探头的标定系统,包括正交双平面超声探头、磁场发生器、磁导航定位接收器、标定仿体、容器。其中,标定仿体为一长方体,固定于容器底部,被容器中的超声成像介质浸没;标定仿体分为上下两个部分,分别穿插有N形丝线组;双平面超声探头两个成像平面相互垂直,可分别与标定仿体的两组丝线组相交;磁导航定位接收器固定于双平面超声探头中部;磁导航定位探针用于点选仿体表面点,从而定位标定仿体;磁场发生器置于容器一侧,保证其磁场范围能够覆盖超声探头上的磁导航定位接收器以及磁导航定位探针。该方案有利于标准化标定数据采集、标注流程;有利于高精度地计算从磁导航定位接收器到超声图像之间的坐标转换矩阵。
-
公开(公告)号:CN113823308B
公开(公告)日:2023-11-28
申请号:CN202111100709.5
申请日:2021-09-18
Applicant: 东南大学
IPC: G10L21/0208 , G10L21/0232 , G10L21/0264 , G10L25/30 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/048 , G06N3/08
Abstract: 评估、短时客观可懂度等多个评估指标上均取得本发明提供了一种仅使用单个带噪语音样 了更好的结果。本进行语音去噪的方法。该方法包括以下步骤:真实世界的不同噪声类型生成带噪语音样本;(2)对于单个带噪语音样本,使用一个语音下采样器生成一对语音训练样本;(3)将训练的输入语音转化为频谱图,然后输入去噪网络进行训练,该去噪网络在十层深度复数Unet的编码器和解码器之间叠加了复数两级Transformer模块;(4)训练使用的损失函数由基础损失和正则化损失组成,基础损失由网络特点决定,正则化损失(1)对于干净的语音信号,分别叠加合成噪声和
-
公开(公告)号:CN110909207B
公开(公告)日:2023-06-02
申请号:CN201910845200.X
申请日:2019-09-08
Applicant: 东南大学
IPC: G06F16/74 , G06F16/783 , G06T5/40 , G06T7/90
Abstract: 本发明公开了一种包含手语的新闻类视频描述数据集构建方法,该方法把新闻类视频构建成包含音频、视频、手语、语言描述的数据集;该方法利用色差直方图算法进行视频的自动分割,并使用ffmpeg完成视频信息的自动提取,最后构建图形用户界面并根据用户输入信息自动生成视频描述与视频信息json文件。本发明通过利用新闻视频数据与手语信息构建数据集,为视频描述网络的研究以及视频描述技术在残疾人士服务中的应用提供了支持。
-
公开(公告)号:CN115205920A
公开(公告)日:2022-10-18
申请号:CN202210228919.0
申请日:2022-03-08
Applicant: 东南大学
IPC: G06V40/16 , G06V20/40 , G06V10/74 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G10L21/0272
Abstract: 本发明公开了一种利用新闻发布会视频制作包含戴口罩人脸的语音分离数据集的方法,该方法:把新闻发布会视频裁剪为图像、视频以及语音三个模态的数据集合,基于戴口罩检测预训练模型,获取到每一帧都戴口罩的画面,从而组成戴口罩的视频,以此为数据源,再基于感知哈希算法把视频关键帧与自定义人脸特征库进行比对,实现视频裁剪与分类的过程全自动。本发明通过利用自定义的人脸库裁剪新闻发布会视频中的多模态数据,提高构建包含戴口罩人脸的语音分离数据集的效率。
-
公开(公告)号:CN114973375A
公开(公告)日:2022-08-30
申请号:CN202210612348.0
申请日:2022-05-31
Applicant: 东南大学
Abstract: 本发明公开了一种基于面部微表情的可控人脸生成方法,包含以下步骤:(1)人脸图像的预处理;(2)构造面部微表情驱动的卷积神经网络;(3)基于面部微表情参数进行可控人脸生成。本发明通过构造卷积神经网络,能够利用面部微表情提取人物脸部的内在运动细节,使得构造的网络可以人为控制生成结果,同时保持了优异的图像质量。
-
公开(公告)号:CN110633663A
公开(公告)日:2019-12-31
申请号:CN201910835953.2
申请日:2019-09-05
Applicant: 东南大学
Abstract: 本发明公开了一种手语视频中自动裁剪多模态数据的方法,该方法:把手语视频裁剪为图像、视频、语音以及手语四个模态的数据集合,基于感知哈希算法把视频关键帧与自定义人脸特征库进行比对,实现视频裁剪过程全自动。本发明通过利用自定义的人脸库裁剪视频中的多模态数据,提高构建多模态数据集的效率。
-
公开(公告)号:CN103955904B
公开(公告)日:2017-05-24
申请号:CN201410196439.6
申请日:2014-05-12
Applicant: 东南大学
IPC: G06T5/00
Abstract: 本发明公开了一种仅仅通过离散分数阶傅里叶变换的相位信息来重建原始信号的方法,属于信号处理技术领域。本发明首先将信号重建问题转化为凸优化问题;然后,对原始信号进行离散分数阶傅里叶变换,并通过改变离散分数阶傅里叶变换的变换矩阵获得不同数目的相位信息;接着,将得到的相位信息进行存储或者传输;最后,利用块坐标下降法和内点法结合的幅度恢复算法,通过合适数目的相位信息将原始信号恢复出来,即重建原始信号。本发明方法利用相同数目下的相位信息包含的信息量大于幅度信息包含的信息量这一理论依据,实现了以较少数目的相位信息重建原始信号的目的。
-
公开(公告)号:CN105303537A
公开(公告)日:2016-02-03
申请号:CN201510844775.1
申请日:2015-11-26
Applicant: 东南大学
IPC: G06T5/00
Abstract: 本发明公开了一种医学图像三维血管显示增强方法,将血管增强看作一个滤波过程,以寻找符合人类血管管状特征的几何结构为主线。该方法首先是基于血管的形状特征,设计出一个类似管状的滤波器;然后是基于血管方向、直径的多样性,构造出一个方向和尺度均可调的滤波器组;最后是将滤波器组与待增强CTA/MRA图像进行空间卷积,经过一系列后处理得到最终增强图像。本发明公开的方法能够有效地改善血管的可视化效果,尤其是血管末梢的微小血管,以及对背景区域(比如相对平坦的面状区域、斑点状区域)与噪声的抑制,为构造一个性能优异的术中导航系统提供了坚实的基础。
-
公开(公告)号:CN103955904A
公开(公告)日:2014-07-30
申请号:CN201410196439.6
申请日:2014-05-12
Applicant: 东南大学
IPC: G06T5/00
Abstract: 本发明公开了一种仅仅通过离散分数阶傅里叶变换的相位信息来重建原始信号的方法,属于信号处理技术领域。本发明首先将信号重建问题转化为凸优化问题;然后,对原始信号进行离散分数阶傅里叶变换,并通过改变离散分数阶傅里叶变换的变换矩阵获得不同数目的相位信息;接着,将得到的相位信息进行存储或者传输;最后,利用块坐标下降法和内点法结合的幅度恢复算法,通过合适数目的相位信息将原始信号恢复出来,即重建原始信号。本发明方法利用相同数目下的相位信息包含的信息量大于幅度信息包含的信息量这一理论依据,实现了以较少数目的相位信息重建原始信号的目的。
-
-
-
-
-
-
-
-
-