-
公开(公告)号:CN104573729B
公开(公告)日:2017-10-31
申请号:CN201510037296.9
申请日:2015-01-23
Applicant: 东南大学
IPC: G06K9/62
Abstract: 本发明公开一种基于核主成分分析网络的图像分类方法,包括以下步骤:(1)输入并预处理训练图像,得到训练图像的局部特征矩阵,(2)建立一个两层的核主成分分析网络,获得训练图像的主特征向量,(3)并用获得的主特征向量训练分类器;为了验证分类的正确性,建立测试核主成分分析网络对测试图像进行测试。本发明通过构造一个两层的核主成分分析网络,能够获得图像的非线性特征,使得图像特征的描述更精确,分类也更为准确,对于图像分类问题有着更高的正确率。
-
公开(公告)号:CN106483193A
公开(公告)日:2017-03-08
申请号:CN201610853071.5
申请日:2016-09-26
Applicant: 东南大学
IPC: G01N29/024 , G01S5/22 , G01S15/88
CPC classification number: G01N29/024 , G01N2291/011 , G01N2291/022 , G01S5/22 , G01S15/88
Abstract: 本发明公开了一种基于高阶累计量的波达快速估计方法,属于信号处理技术领域。本发明针对现有基于高阶累积量的阵列信号处理方法所存在的计算复杂度过高的问题,利用线性时间的奇异值分解方法进行信号子空间的近似,从而大幅缩短算法的执行时间并大幅节约算法的占用内存。本发明还公开了一种基于声线传播时间层析的海洋声层析方法以及一种定位方法。本发明在保证较高分辨能力的同时,可大幅降低现有技术的时间复杂度与空间复杂度,减少硬件资源的消耗并提高信号处理的实时性。
-
公开(公告)号:CN105652264A
公开(公告)日:2016-06-08
申请号:CN201610006173.3
申请日:2016-01-05
Applicant: 东南大学
Abstract: 本发明公开了一种基于高阶累积量的多路径传播声信号分离方法。本发明将原有的基于二阶累积量的主动宽带信号分离方法拓展到四阶累计量,根据四阶累计量构造相应的副本矢量和噪声子空间,并假设声信号传播过程中的加性噪声为彩色噪声,最后根据与噪声子空间的正交性搜索出声线路径。本发明还公开了一种基于声线传播时间层析的海洋声层析方法以及一种声源定位方法。相比现有技术,本发明具有更高分离精度,能正确分离出间隔较小的声线路径,并能适用于传感器数目小于射线路径的情况,同时还可抑制高斯噪声和非高斯噪声的影响。
-
公开(公告)号:CN103150709A
公开(公告)日:2013-06-12
申请号:CN201310057984.2
申请日:2013-02-22
Applicant: 东南大学
Abstract: 本发明公开了一种基于伪牛顿法的四元数域彩色图像压缩感知恢复方法,将彩色图像二维矩阵转化到四元数域的二维矩阵,对四元数域的二维矩阵只进行一次压缩感知就能恢复原始的彩色图像,比传统的对彩色图像的RGB三个分量分别进行压缩感知要节约运算时间。本发明将四元数矩阵信号写成四元数的欧拉形式,用幅度和相位作为压缩感知优化问题新的约束项,比传统将彩色图像RGB三个通道的数据转化为三个实数二维矩阵分别处理的恢复结果更好。本发明的结果图像是按行进行压缩传感解码得到的图像与按列进行压缩传感解码得到的图像的均值,这样比单独按行处理或单独按列处理恢复的图像更为平滑。
-
公开(公告)号:CN102163976B
公开(公告)日:2013-02-27
申请号:CN201110022112.3
申请日:2011-01-20
Applicant: 东南大学
IPC: H03M7/40
Abstract: 本发明公开了一种基于GDFT-II变换的快速解码方法,属于数字信号处理技术领域。本发明将长度为N/2的信号序列{am}和{bm},m=0,1,…,N/2-1,的GDFT-II域系数{Ai}和{Bi},i=0,1,…,N/2-1,转换为长度为N的原始编码信号序列{xn},n=0,1,…,N-1,的GDFT-II域系数{Xk},k=0,1,…,N-1,其中{Xk}的计算分成偶数输出索引{X2i}和奇数输出索引{X2i+1}两个部分分别进行计算,从而减少了GDFT-II变换次数,从而降低了解码过程的计算复杂度。相比现有技术,本发明方法不仅具有较低的复杂度,解码实时性更好,而且具有更少的信号失真。
-
公开(公告)号:CN119478958A
公开(公告)日:2025-02-18
申请号:CN202411335299.6
申请日:2024-09-24
Applicant: 东南大学
IPC: G06V30/148 , G06V10/82 , G06N3/0455 , G06F16/353 , G06N3/0464
Abstract: 本发明公开了一种基于OCR的医学文本结构化识别处理方法,该方法收集病人医学文本图像,标识出图像的文本框位置信息和文字信息作为数据集,利用图像矫正模块优化现实场景图像质量;通过OCR技术识别图像中的文本框位置和文字信息,并根据文本内容进行分类;针对化验单、入院小结和影像报告等特定医学文档,建立了相应的结构化后处理模块,以提取关键信息。本方法利用OCR,能够有效地从医学文本图像中抽取结构化数据,为后续医生疾病的诊断提供重要参考依据,提高了患者就医的效率。
-
公开(公告)号:CN119252483A
公开(公告)日:2025-01-03
申请号:CN202411335302.4
申请日:2024-09-24
Applicant: 东南大学
IPC: G16H50/30 , G16H50/20 , G06N5/01 , G06N7/01 , G06F18/243
Abstract: 本发明公开了一种基于预训练语言模型及机器学习的肝病预警方法,具体包括以下步骤:1、患者信息数据收集,筛选出患者入院记录的原始文本作为原始数据;2、患者原始数据预处理,使用大语言模型对患者原始数据进行数据格式化处理,得到格式化后的患者病史信息、检验检查信息以及影像报告信息;3、对患者的病史信息和检验检查信息使用梯度提升决策树算法进行训练,学习病史信息及检验检查信息与肝病之间的关系;4、对患者的影像报告信息使用预训练语言模型,学习影像报告与肝病之间的关系;5、使用贝叶斯优化对模型参数进行调优,调整到最佳模型参数,得到病史模型、检验检查模型以及影像报告模型。本发明为肝病的提前发现、预警提供了支撑。
-
公开(公告)号:CN117273134A
公开(公告)日:2023-12-22
申请号:CN202311275705.X
申请日:2023-09-28
Applicant: 东南大学
IPC: G06N5/022 , G06F16/36 , G06F16/33 , G06F16/332 , G06F40/289 , G06F40/30 , G06F18/22 , G06F18/214 , G06N3/0455 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种基于预训练语言模型的零样本知识图谱补全方法,具体包括以下步骤:1、知识图谱数据预处理,从知识图谱中采样零样本知识图谱补全数据集,进一步获取关系的描述语句以及关系的所有三元组中实体和关系文本信息组成的三元组文本语句;2、利用预训练语言模型Sentence‑BERT进行微调,学习关系描述语句的向量表示以及三元组文本语句的向量表示;3、利用零样本知识图谱验证集进行验证,调整到最佳网络参数;4、利用零样本知识图谱测试集进行测试,统计模型效果;该方案充分发挥预训练语言模型的能力,能够达到需要额外利用邻居实体信息的方法相同的效果。
-
公开(公告)号:CN110148145B
公开(公告)日:2023-10-10
申请号:CN201910226802.7
申请日:2019-03-25
Applicant: 东南大学
IPC: G06T7/12 , G06T7/136 , G06T7/11 , G06V10/82 , G06N3/0464
Abstract: 本发明涉及一种融合边界信息的图像目标区提取方法及应用,引入双神经网络先后应用,即采用神经网络RCF模型,以及改进型语义分割网络SegNet,针对目标类型灰度图像中的目标区域图像实现高效提取,其中能够结合局部特征和全局特征,有效克服网络下采样过程中细节特征丢失的问题,因此将设计方案应用于脑组织提取过程中,对于比较难分割的脑组织边界区域,能得到更好的脑组织区域图像提取效果。
-
公开(公告)号:CN116403559A
公开(公告)日:2023-07-07
申请号:CN202310330246.4
申请日:2023-03-30
Applicant: 东南大学
IPC: G10L13/02 , H04N21/4627 , H04N21/439 , H04N21/44
Abstract: 本发明公开了一种文本驱动视频生成系统的实现方法,该方法把语音合成系统、视频生成系统集成到了一个系统。语音合成系统采用动态Web技术的JSP页面,通过执行后端服务器训练完成的语音合成模型,完成语音的生成,再通过框架把语音传送到前端,其中还增加了新增、删除、查询、批量删除、合成语音下载、合成语音变速等模块。视频生成系统以语音合成系统为基石,既可以采用语音合成系统生成的语音,也可以采用任意用户上传的语音,以及任意一张人脸图片,通过JSP页面将语音和图片传送到后端服务器,后端加载训练完成的视频生成模型,完成视频的生成,再通过框架把视频传送到前端,从而实现了完整的文本驱动视频生成系统。
-
-
-
-
-
-
-
-
-