虚拟家装室内场景设计中的阴影渲染方法

    公开(公告)号:CN103903296A

    公开(公告)日:2014-07-02

    申请号:CN201410166236.2

    申请日:2014-04-23

    Applicant: 东南大学

    Abstract: 本发明公开了一种虚拟家装室内场景设计中的阴影渲染方法。包括阴影映射图生成步骤,半影估计步骤,基于泊松碟采样的百分比渐近滤波步骤,最后通过加入漫反射环境光,生成具有真实感的虚拟家装室内场景阴影效果图。本发明方法能够高效且能改善阴影映射图锯齿走样的问题。

    应用四元数分割与图论优化的外周血白细胞边缘提取方法

    公开(公告)号:CN103150722A

    公开(公告)日:2013-06-12

    申请号:CN201310017929.0

    申请日:2013-01-17

    Applicant: 东南大学

    Inventor: 章品正

    Abstract: 本发明公开了一种应用四元数边缘检测与图论优化的外周血白细胞边缘提取方法,包括用于提高图像信噪比的图像预处理步骤、用于获取仅包含一个白细胞正方形区域的细胞窗定位步骤、应用正交小波包多尺度分析与链码方法实现白细胞胞核轮廓提取与链接的步骤、应用四元数边缘检测获取胞浆轮廓片段的步骤、应用图论优化方法实现胞浆轮廓链接的步骤。通过综合白细胞胞核及胞浆边缘提取与链接结果实现外周血白细胞边缘的分割提取。

    一种粤语新闻视频中自动裁剪含主播的视听数据集的方法

    公开(公告)号:CN115460462B

    公开(公告)日:2024-10-01

    申请号:CN202211132338.3

    申请日:2022-09-17

    Applicant: 东南大学

    Abstract: 本发明公开了一种粤语新闻视频中自动裁剪含主播的视听数据集的方法,该方法把粤语新闻视频裁剪为视频、语音两个模态的数据集合,其中每一段数据都只包含主持人进行新闻播报的场景。该方法基于HSV图像信息检测算法进行整个新闻场景的分割,基于FaceRecognition人脸检测库和人脸特征提取工具进行包含目标主播人脸的视频识别,基于语音活动检测算法对音频进行切分,再根据切分停顿点对视频进行切分,实现自动完成粤语新闻中裁剪含主播的视听数据集的制作。通过设计的合理的流程和使用高效的算法,提高了构建粤语高质量视听数据集的效率,并能够方便地推广到其他语言的视听数据集制作中,最终能应用于如粤语场景下语音去噪、音视频驱动的人脸生成模型的训练中。

    一种军事新闻视频中自动裁剪的语音合成数据集制作方法

    公开(公告)号:CN116208801A

    公开(公告)日:2023-06-02

    申请号:CN202310242449.8

    申请日:2023-03-14

    Applicant: 东南大学

    Abstract: 本发明公开了一种军事新闻视频中自动裁剪的语音合成数据集制作方法,该方法采用FFmpeg对视频的原始语音模态、视频模态进行提取,基于语音的pcm文件判断是否存在静默段,对静默段语音进行删除,基于科大讯飞的语音转文字功能,对每个语音文件进行文字转换,为了适应语音合成模型,还需要每段文字对应的拼音以及对齐的音素,基于python的pypinyin库,完成文字到拼音的转换,基于MFA模型、普通话模型、普通话词典完成音素对齐任务,实现军事新闻视频中自动裁剪出语音合成数据集的工作。通过设计的合理的流程和使用高效的算法,提高了构建高质量用于军事语音合成任务的数据集的效率,并能够方便地推广到其他任意场景下的语音合成数据集制作中。

    一种基于深度压缩的复数卷积神经网络压缩方法

    公开(公告)号:CN109886406A

    公开(公告)日:2019-06-14

    申请号:CN201910136000.7

    申请日:2019-02-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于深度压缩算法的复数卷积神经网络压缩的方法,首先通过正常的网络训练学习网络的连通性;然后,对训练过的网络参数进行修剪,将复数参数的模低于一个阈值的连接修剪掉;接着,将修剪过后的稀疏网络进行量化,进一步压缩网络;最后,利用哈夫曼编码对复数参数的实部和虚部进行编码,得到最终的压缩网络。本发明方法利用卷积神经网络中过多的冗余参数,删减掉不重要的连接,并进一步通过量化和哈夫曼编码压缩网络,在很大程度上减少了网络的参数,并且只有很小的精度损失,达到了压缩复数卷积神经网络的目的,解决了复数卷积神经网络由于巨大的参数量无法部署在嵌入式设备上的问题。

    虚拟家装室内场景设计中的阴影渲染方法

    公开(公告)号:CN103903296B

    公开(公告)日:2016-08-24

    申请号:CN201410166236.2

    申请日:2014-04-23

    Applicant: 东南大学

    Abstract: 本发明公开了一种虚拟家装室内场景设计中的阴影渲染方法。包括阴影映射图生成步骤,半影估计步骤,基于泊松碟采样的百分比渐近滤波步骤,最后通过加入漫反射环境光,生成具有真实感的虚拟家装室内场景阴影效果图。本发明方法能够高效且能改善阴影映射图锯齿走样的问题。

    一种文本驱动视频生成系统的实现方法

    公开(公告)号:CN116403559B

    公开(公告)日:2025-01-24

    申请号:CN202310330246.4

    申请日:2023-03-30

    Applicant: 东南大学

    Abstract: 本发明公开了一种文本驱动视频生成系统的实现方法,该方法把语音合成系统、视频生成系统集成到了一个系统。语音合成系统采用动态Web技术的JSP页面,通过执行后端服务器训练完成的语音合成模型,完成语音的生成,再通过框架把语音传送到前端,其中还增加了新增、删除、查询、批量删除、合成语音下载、合成语音变速等模块。视频生成系统以语音合成系统为基石,既可以采用语音合成系统生成的语音,也可以采用任意用户上传的语音,以及任意一张人脸图片,通过JSP页面将语音和图片传送到后端服务器,后端加载训练完成的视频生成模型,完成视频的生成,再通过框架把视频传送到前端,从而实现了完整的文本驱动视频生成系统。

    一种粤语新闻视频中自动裁剪含主播的视听数据集的方法

    公开(公告)号:CN115460462A

    公开(公告)日:2022-12-09

    申请号:CN202211132338.3

    申请日:2022-09-17

    Applicant: 东南大学

    Abstract: 本发明公开了一种粤语新闻视频中自动裁剪含主播的视听数据集的方法,该方法把粤语新闻视频裁剪为视频、语音两个模态的数据集合,其中每一段数据都只包含主持人进行新闻播报的场景。该方法基于HSV图像信息检测算法进行整个新闻场景的分割,基于FaceRecognition人脸检测库和人脸特征提取工具进行包含目标主播人脸的视频识别,基于语音活动检测算法对音频进行切分,再根据切分停顿点对视频进行切分,实现自动完成粤语新闻中裁剪含主播的视听数据集的制作。通过设计的合理的流程和使用高效的算法,提高了构建粤语高质量视听数据集的效率,并能够方便地推广到其他语言的视听数据集制作中,最终能应用于如粤语场景下语音去噪、音视频驱动的人脸生成模型的训练中。

Patent Agency Ranking