基于深度学习的轻量级高精度时空视频超分辨率方法

    公开(公告)号:CN117176890A

    公开(公告)日:2023-12-05

    申请号:CN202311193395.7

    申请日:2023-09-15

    Abstract: 一种基于深度学习的轻量级高精度时空视频超分辨率方法,其特征在于,步骤:获取视频资源;通过ffmpeg软件将视频资料分解为帧序列;从帧序列的首部开始,依次取连续的两帧作为模型的输入帧;模型接收两帧图像信息,在这两帧中插值一帧;同时又将两帧和插值的一帧图像重建为指定倍数的高分辨率图像;将所得到的高分辨率图像存储在硬件中,按照视频播放的顺序排序;采用ffmpeg将高分辨率连续帧根据帧率要求编码为新的高分辨率高帧率视频;发布新的视频。本发明有效防止模型推理过程中过多的内存占用,降低对设备性能的要求,有效提升时空超分辨率的准确性;有效降低对内存的占用,有效提高处理效果。

    课堂教学语音摘要提取方法
    3.
    发明公开

    公开(公告)号:CN116978402A

    公开(公告)日:2023-10-31

    申请号:CN202310952345.6

    申请日:2023-07-31

    Inventor: 王崇文 严雪晴

    Abstract: 一种课堂教学语音摘要提取方法,该提取方法基于重音检测和长文本压缩,包括:长文本压缩,通过关键句子筛选算法进行长文本压缩,缩小句子规模,将长文本摘要问题转化为短文本问题;重音标记,训练通用的汉语语音重音检测模型,根据音频及其标注文件,对相应的文本序列进行汉语重音标记,得到每段音频对应的词级别的重音序列;摘要生成,使用生成式摘要模型生成摘要文本。本发明提高了摘要的适应性和灵活性,避免由于文本过长影响转录准确性的问题;充分利用了语音和文本信息的特点,提取了适合下游摘要模型输入的词级别的语义特征,使得生成的摘要更具语义连贯性和准确性;可广泛应用于教育领域。

Patent Agency Ranking