-
公开(公告)号:CN114238636B
公开(公告)日:2024-12-06
申请号:CN202111529633.8
申请日:2021-12-14
Applicant: 东南大学
IPC: G06F16/35 , G06F40/211 , G06F40/263 , G06F40/58 , G06N3/0455 , G06N3/0475 , G06N3/094 , G06N3/096
Abstract: 本发明公开了一种基于翻译匹配的跨语言属性级情感分类方法,该方法能够利用语料资源丰富的源语言提升语料资源稀缺的目标语言属性级情感分类的性能,包括领域分类和属性情感分类两部分,在模型构建过程中基于模型特征设置了模型的超参,包括多头自注意力层数量、梯度反转超参值等。领域分类利用领域判别器与语言编码器的对抗训练减小机器翻译导致真实语言与翻译语言的领域偏差问题,属性情感分类对属性序列表示和句子序列表示细粒度交互获得属性级句子表示,然后通过全连接层和softmax层获得最终情感预测结果。本发明提出的属性级情感分类模型构建代价小,并且对比试验验证结果表明,相较于其他模型,本发明提出的属性级情感分类模型结果最优。
-
公开(公告)号:CN113313731B
公开(公告)日:2024-11-19
申请号:CN202110648734.0
申请日:2021-06-10
Applicant: 东南大学
IPC: G06T7/207 , G06T5/70 , G06N3/0464 , G06N3/09
Abstract: 本发明公开一种针对单目视频的三维人体姿态估计方法。首先对输入的单目人体运动视频,采用级联金字塔结构的二维姿态检测器进行二维关节坐标提取,并输出为二维关节序列;根据二维关节序列极值点与前后帧差异构建噪声阈值约束,通过阈值滤波器对二维关节序列进行平滑降噪;然后对输入若干帧二维关节序列进行升维卷积;构建时序扩张卷积模型;再采用切片方法在每层卷积结构中进行残差连接并构建联合损失函数;最后利用时序卷积模型输出的三维关节坐标序列重建与单目人体运动视频相对应的三维姿态结果。本发明能够应对单目视频场景下的三维人体姿态估计需求,并能有效提升序列图像下的姿态估计效果,生成一段高精度的三维人体关节点运动视频。
-
公开(公告)号:CN118262028A
公开(公告)日:2024-06-28
申请号:CN202410445699.6
申请日:2024-04-15
Applicant: 东南大学
IPC: G06T15/20 , G06T15/08 , G06T5/77 , G06T5/60 , G06T7/73 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明提出了一种基于时域滤波神经辐射场的稀疏图像视图合成方法,本方法创新性引入一种时域滤波的神经辐射场模型,旨在解决由于多层感知机表示的神经辐射场渲染开销大,无法通过超采样的方式降低合成图像的锯齿噪声等问题,通过在时域内应用滤波技术,有效分摊超采样所需的计算负担到连续的帧上,从而在不增加额外的网络推理次数的前提下,显著提升了合成图像的质量,并有效减少了噪声与锯齿现象。此外为了提高神经辐射场的几何提取能力,方法引入了深度先验网络,并设计了帧间几何一致性损失,增强神经辐射场在多视图上的表达能力,提高网络的泛化性能。
-
公开(公告)号:CN118229920A
公开(公告)日:2024-06-21
申请号:CN202410438152.3
申请日:2024-04-12
Applicant: 东南大学
IPC: G06T17/20 , G06N3/0499 , G06N3/08
Abstract: 本发明提出了一种基于自适应法向先验的室内场景三维重建方法,结合神经辐射场和符号距离函数生成对场景的隐式表达,并通过Marching Cubes算法得到显式三维模型。本方法引入法向先验指导神经网络去学习场景更准确的几何结构,解决传统三维重建方法表面细节和无纹理区域重建效果差的问题。并通过几何检查自适应的使用法向先验,避免部分区域法向先验估计错误带来的不准确性。同时,本方法加入了一个新的正则化项来解决重建结果空中存在漂浮物的问题。通过输入场景的多视角的图像,我们可以获取到该场景的三维网格。
-
公开(公告)号:CN113284230B
公开(公告)日:2023-12-19
申请号:CN202110638233.4
申请日:2021-06-08
Applicant: 东南大学
Abstract: 本发明提供了一种针对图像序列的三维重建方法,针对未知排列的图像序列对,利用局部优化的思想和面片模型方案来改善稀疏重建和稠密重建中存在的问题。稀疏重建时,提出一种局部区域划分的匹配策略,并结合匹配策略使用基于最大生成树思想的增量式稀疏重建方案得出稀疏点云;稠密重建中,提出一种基于立体匹配的面片扩散优化方案进行面片扩散,通过立体匹配中的传播和随机搜索过程寻找到待扩散面片,最终得到高精度的稠密重建模型。本发明能够应对多图像序列下的重建需求,并能有效地提升图像序列的稀疏重建效果和稠密重建效果,生成一个高质量的三维重建模型。
-
公开(公告)号:CN112543317A
公开(公告)日:2021-03-23
申请号:CN202011395559.0
申请日:2020-12-03
Applicant: 东南大学
IPC: H04N13/261 , H04N13/268 , G06N3/04 , G06K9/62 , G06T3/40 , G06T7/593
Abstract: 本发明公开一种高分辨率单目2D视频到双目3D视频的转制方法,在深度信息提取阶段,使用现有的3D电影作为源数据集训练一个U型结构的卷积网络,得到性能优越的网络模型对2D视频进行逐帧的深度估计,利用小型的神经网络对深度图进行保边平滑的优化处理。在视点合成阶段,提出无相机参数的基于深度图的视点合成算法,采用对称式的由中间向两边渲染的策略进行左右虚拟视点合成。最后,在图像修复阶段,提出了结合时域信息的基于块匹配的图像修复算法,对左右视点中的裂痕空洞进行填充修复。本发明能够在原2D视频无任何相关参数信息的前提下,对其进行2D到3D的视频转制,不仅可以有效地处理高分辨率画面,且转制效果好、速度快。
-
公开(公告)号:CN111899295A
公开(公告)日:2020-11-06
申请号:CN202010508803.3
申请日:2020-06-06
Applicant: 东南大学
Abstract: 一种基于深度学习的单目场景深度预测方法,适用于单目图片或视频,利用已校准的双目彩色图像对训练深度预测模型,在网络架构中使用了DenseNet卷积模块提取特征空间,使用其中的稠密块和过渡层,使网络中的每一层都直接与其前面层相连,实现特征的重复利用;改进了双目匹配损失,将深度预测问题视为图像重建问题,对输入的左视点彩色图和视差图采样生成虚拟彩色图和视差图,利用双目图像对的立体匹配算法,在RGB层面和视差层面,约束生成的虚拟视图和对应输入的右视点图像的一致性,从而获得更好的深度;改进了深度平滑损失,本发明能够生成高质量的密集深度图,有效改善单目场景深度预测中遮挡产生的伪影问题,可满足室内外多个现实场景的2D转3D需求。
-
公开(公告)号:CN111695569A
公开(公告)日:2020-09-22
申请号:CN202010397565.3
申请日:2020-05-12
Applicant: 东南大学
Abstract: 本发明公开了一种基于多分割图融合的图像像素级分类方法。该方法有三个主要步骤,首先在多个分割图间引入指导机制,使用较高精度分割图指导较低精度分割图提高精度。接着引入一种共识机制,在各个图中可能产生分类冲突的边缘区域像素点间,通过协商策略达成分类共识。最后使用一种基于全卷积神经网络的融合策略,有效结合前述两种机制,得到最终输出。本发明能够有效地解决边缘区域的像素分类冲突问题,将多个分割图进行融合得到粒度更细的像素级分类结果。可与多种技术结合使用,包括但不限于深度神经网络、随机森林与支持向量机等有监督学习方法。该方法的使用,可以有效弥补现有方法对冲突像素点重视的不足,得到质量更高的融合分割结果。
-
公开(公告)号:CN110009567A
公开(公告)日:2019-07-12
申请号:CN201910281197.3
申请日:2019-04-09
Applicant: 三星电子(中国)研发中心 , 三星电子株式会社 , 东南大学
Abstract: 本申请实施例公开了用于鱼眼镜头的图像拼接方法和装置。该方法的一具体实施方式包括:获取第一鱼眼镜头拍摄的第一图像和第二鱼眼镜头拍摄的第二图像,第二鱼眼镜头的拍摄区域与第一鱼眼镜头的拍摄区域存在部分重叠;根据针对第一鱼眼镜头和第二鱼眼镜头预先建立的映射矩阵展开第一图像和第二图像,得到第一展开图像和第二展开图像;根据针对第一鱼眼镜头和第二鱼眼镜头预先建立的旋转矩阵对第二展开图像进行旋转;拼接第一展开图像和旋转后的第二展开图像。该实施方式提高了拼接鱼眼镜头拍摄到的图像的效率。
-
公开(公告)号:CN109492796A
公开(公告)日:2019-03-19
申请号:CN201811188233.3
申请日:2018-10-12
Applicant: 东南大学
Abstract: 本发明公开了一种城市空间形态自动分区方法与系统,方法包括:获取给定范围内的城市空间形态基础数据,得到多个空间单元;针对每个空间单元,按照设定的多个城市空间形态指标自动计算,生成城市空间形态特征汇总表;将城市空间形态特征汇总表所对应的矩阵采用无监督聚类算法进行聚类,聚类过程中,设置不同的聚类参数进行多次聚类运算,并对各聚类结果进行评分,确定最佳聚类结果;根据最佳聚类结果,得到城市空间形态自动分区的结果;并进一步可分析指标之间的相关性,得到关键影响指标。本发明可以客观而全面地洞悉城市空间形态的特征,进而形成自动分区的结果及关键影响指标,避免了传统方法中容易出现的主观判断或考察维度单一等问题。
-
-
-
-
-
-
-
-
-