Patent search ap:("东南大学") AND inv:"章品正" Page 2

11.

发明公开
虚拟家装室内场景设计中的阴影渲染方法失效

公开(公告)号：CN103903296A

公开(公告)日：2014-07-02

申请号：CN201410166236.2

申请日：2014-04-23

Applicant: 东南大学

Inventor： 章品正 , 姜晓彤 , 盛玲 , 尤肖虎

IPC: G06T15/60

Abstract: 本发明公开了一种虚拟家装室内场景设计中的阴影渲染方法。包括阴影映射图生成步骤，半影估计步骤，基于泊松碟采样的百分比渐近滤波步骤，最后通过加入漫反射环境光，生成具有真实感的虚拟家装室内场景阴影效果图。本发明方法能够高效且能改善阴影映射图锯齿走样的问题。

12.

发明公开
应用四元数分割与图论优化的外周血白细胞边缘提取方法失效

公开(公告)号：CN103150722A

公开(公告)日：2013-06-12

申请号：CN201310017929.0

申请日：2013-01-17

Applicant: 东南大学

Inventor： 章品正

IPC: G06T7/00

Abstract: 本发明公开了一种应用四元数边缘检测与图论优化的外周血白细胞边缘提取方法，包括用于提高图像信噪比的图像预处理步骤、用于获取仅包含一个白细胞正方形区域的细胞窗定位步骤、应用正交小波包多尺度分析与链码方法实现白细胞胞核轮廓提取与链接的步骤、应用四元数边缘检测获取胞浆轮廓片段的步骤、应用图论优化方法实现胞浆轮廓链接的步骤。通过综合白细胞胞核及胞浆边缘提取与链接结果实现外周血白细胞边缘的分割提取。

13.

发明授权
一种粤语新闻视频中自动裁剪含主播的视听数据集的方法有权

公开(公告)号：CN115460462B

公开(公告)日：2024-10-01

申请号：CN202211132338.3

申请日：2022-09-17

Applicant: 东南大学

Inventor： 伍家松 , 吴婷婷 , 孙威 , 杨淳沨 , 孔佑勇 , 章品正 , 陈阳 , 舒华忠

IPC: H04N21/4402 , H04N21/845 , H04N21/439 , G10L13/02 , G10L21/0208 , G06V20/40 , G06V40/16 , G06F16/483

Abstract: 本发明公开了一种粤语新闻视频中自动裁剪含主播的视听数据集的方法，该方法把粤语新闻视频裁剪为视频、语音两个模态的数据集合，其中每一段数据都只包含主持人进行新闻播报的场景。该方法基于HSV图像信息检测算法进行整个新闻场景的分割，基于FaceRecognition人脸检测库和人脸特征提取工具进行包含目标主播人脸的视频识别，基于语音活动检测算法对音频进行切分，再根据切分停顿点对视频进行切分，实现自动完成粤语新闻中裁剪含主播的视听数据集的制作。通过设计的合理的流程和使用高效的算法，提高了构建粤语高质量视听数据集的效率，并能够方便地推广到其他语言的视听数据集制作中，最终能应用于如粤语场景下语音去噪、音视频驱动的人脸生成模型的训练中。

14.

发明公开
一种军事新闻视频中自动裁剪的语音合成数据集制作方法审中-实审

公开(公告)号：CN116208801A

公开(公告)日：2023-06-02

申请号：CN202310242449.8

申请日：2023-03-14

Applicant: 东南大学

Inventor： 孟凡满 , 伍家松 , 杨淳沨 , 孔佑勇 , 章品正 , 陈阳 , 董志芳 , 舒华忠

IPC: H04N21/439 , H04N21/44 , G10L13/08 , G10L13/02 , H04N21/2187 , H04N21/478

Abstract: 本发明公开了一种军事新闻视频中自动裁剪的语音合成数据集制作方法，该方法采用FFmpeg对视频的原始语音模态、视频模态进行提取，基于语音的pcm文件判断是否存在静默段，对静默段语音进行删除，基于科大讯飞的语音转文字功能，对每个语音文件进行文字转换，为了适应语音合成模型，还需要每段文字对应的拼音以及对齐的音素，基于python的pypinyin库，完成文字到拼音的转换，基于MFA模型、普通话模型、普通话词典完成音素对齐任务，实现军事新闻视频中自动裁剪出语音合成数据集的工作。通过设计的合理的流程和使用高效的算法，提高了构建高质量用于军事语音合成任务的数据集的效率，并能够方便地推广到其他任意场景下的语音合成数据集制作中。

15.

发明公开
一种包含戴口罩人脸的语音分离数据集制作方法审中-实审

公开(公告)号：CN115205920A

公开(公告)日：2022-10-18

申请号：CN202210228919.0

申请日：2022-03-08

Applicant: 东南大学

Inventor： 伍家松 , 孟凡满 , 舒华忠 , 孔佑勇 , 杨冠羽 , 杨淳沨 , 姜龙玉 , 章品正

IPC: G06V40/16 , G06V20/40 , G06V10/74 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G10L21/0272

Abstract: 本发明公开了一种利用新闻发布会视频制作包含戴口罩人脸的语音分离数据集的方法，该方法：把新闻发布会视频裁剪为图像、视频以及语音三个模态的数据集合，基于戴口罩检测预训练模型，获取到每一帧都戴口罩的画面，从而组成戴口罩的视频，以此为数据源，再基于感知哈希算法把视频关键帧与自定义人脸特征库进行比对，实现视频裁剪与分类的过程全自动。本发明通过利用自定义的人脸库裁剪新闻发布会视频中的多模态数据，提高构建包含戴口罩人脸的语音分离数据集的效率。

16.

发明公开
一种手语视频中自动裁剪多模态数据的方法有权

公开(公告)号：CN110633663A

公开(公告)日：2019-12-31

申请号：CN201910835953.2

申请日：2019-09-05

Applicant: 东南大学

Inventor： 伍家松 , 李桃桃 , 舒华忠 , 孔佑勇 , 杨冠羽 , 杨淳沨 , 姜龙玉 , 章品正

IPC: G06K9/00 , G06K9/46 , G06F16/51 , G06N3/04

Abstract: 本发明公开了一种手语视频中自动裁剪多模态数据的方法，该方法：把手语视频裁剪为图像、视频、语音以及手语四个模态的数据集合，基于感知哈希算法把视频关键帧与自定义人脸特征库进行比对，实现视频裁剪过程全自动。本发明通过利用自定义的人脸库裁剪视频中的多模态数据，提高构建多模态数据集的效率。

17.

发明公开
一种基于深度压缩的复数卷积神经网络压缩方法无效

公开(公告)号：CN109886406A

公开(公告)日：2019-06-14

申请号：CN201910136000.7

申请日：2019-02-25

Applicant: 东南大学

Inventor： 伍家松 , 任虹珊 , 孔佑勇 , 杨淳沨 , 章品正 , 姜龙玉 , 陈阳 , 舒华忠

IPC: G06N3/08 , G06K9/62 , G06N3/04

Abstract: 本发明公开了一种基于深度压缩算法的复数卷积神经网络压缩的方法，首先通过正常的网络训练学习网络的连通性；然后，对训练过的网络参数进行修剪，将复数参数的模低于一个阈值的连接修剪掉；接着，将修剪过后的稀疏网络进行量化，进一步压缩网络；最后，利用哈夫曼编码对复数参数的实部和虚部进行编码，得到最终的压缩网络。本发明方法利用卷积神经网络中过多的冗余参数，删减掉不重要的连接，并进一步通过量化和哈夫曼编码压缩网络，在很大程度上减少了网络的参数，并且只有很小的精度损失，达到了压缩复数卷积神经网络的目的，解决了复数卷积神经网络由于巨大的参数量无法部署在嵌入式设备上的问题。

18.

发明授权
虚拟家装室内场景设计中的阴影渲染方法失效

公开(公告)号：CN103903296B

公开(公告)日：2016-08-24

申请号：CN201410166236.2

申请日：2014-04-23

Applicant: 东南大学

Inventor： 章品正 , 姜晓彤 , 盛玲 , 尤肖虎

IPC: G06T15/60

Abstract: 本发明公开了一种虚拟家装室内场景设计中的阴影渲染方法。包括阴影映射图生成步骤，半影估计步骤，基于泊松碟采样的百分比渐近滤波步骤，最后通过加入漫反射环境光，生成具有真实感的虚拟家装室内场景阴影效果图。本发明方法能够高效且能改善阴影映射图锯齿走样的问题。

19.

发明授权
一种文本驱动视频生成系统的实现方法有权

公开(公告)号：CN116403559B

公开(公告)日：2025-01-24

申请号：CN202310330246.4

申请日：2023-03-30

Applicant: 东南大学

Inventor： 孟凡满 , 伍家松 , 杨淳沨 , 孔佑勇 , 章品正 , 杨冠羽 , 陈阳 , 舒华忠

IPC: G10L13/02 , H04N21/4627 , H04N21/439 , H04N21/44

Abstract: 本发明公开了一种文本驱动视频生成系统的实现方法，该方法把语音合成系统、视频生成系统集成到了一个系统。语音合成系统采用动态Web技术的JSP页面，通过执行后端服务器训练完成的语音合成模型，完成语音的生成，再通过框架把语音传送到前端，其中还增加了新增、删除、查询、批量删除、合成语音下载、合成语音变速等模块。视频生成系统以语音合成系统为基石，既可以采用语音合成系统生成的语音，也可以采用任意用户上传的语音，以及任意一张人脸图片，通过JSP页面将语音和图片传送到后端服务器，后端加载训练完成的视频生成模型，完成视频的生成，再通过框架把视频传送到前端，从而实现了完整的文本驱动视频生成系统。

20.

发明公开
一种粤语新闻视频中自动裁剪含主播的视听数据集的方法有权

公开(公告)号：CN115460462A

公开(公告)日：2022-12-09

申请号：CN202211132338.3

申请日：2022-09-17

Applicant: 东南大学

Inventor： 伍家松 , 吴婷婷 , 孙威 , 杨淳沨 , 孔佑勇 , 章品正 , 陈阳 , 舒华忠

IPC: H04N21/4402 , H04N21/845 , H04N21/439 , G10L13/02 , G10L21/0208 , G06V20/40 , G06V40/16 , G06F16/483

Abstract: 本发明公开了一种粤语新闻视频中自动裁剪含主播的视听数据集的方法，该方法把粤语新闻视频裁剪为视频、语音两个模态的数据集合，其中每一段数据都只包含主持人进行新闻播报的场景。该方法基于HSV图像信息检测算法进行整个新闻场景的分割，基于FaceRecognition人脸检测库和人脸特征提取工具进行包含目标主播人脸的视频识别，基于语音活动检测算法对音频进行切分，再根据切分停顿点对视频进行切分，实现自动完成粤语新闻中裁剪含主播的视听数据集的制作。通过设计的合理的流程和使用高效的算法，提高了构建粤语高质量视听数据集的效率，并能够方便地推广到其他语言的视听数据集制作中，最终能应用于如粤语场景下语音去噪、音视频驱动的人脸生成模型的训练中。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification