一种基于词频逆文档频率的视频字幕显示优化方法和系统

    公开(公告)号:CN118317160A

    公开(公告)日:2024-07-09

    申请号:CN202410428196.8

    申请日:2024-04-10

    Abstract: 本发明提供了一种基于词频逆文档频率的视频字幕显示优化方法和系统,所述方法包括:获取语料库;基于TF‑I DF算法计算语料库中的每个词的逆文档频率;获取音视频文件中的文本信息和时间戳集合;统计所述文本信息中每个分词的词频;基于所述语料库中的每个词的逆文档频率和文本信息中的词频计算所述音视频文件中每句话的理解成本;基于所述理解成本动态调整所述音视频文件中不同句子的显示时长。利用词频逆文档频率计算视频中每个语句的理解成本;根据理解成本大小顺序分段,根据不同的语句所处分段不同,动态调整语句的显示时间。由此降低听障用户在学习网络课程中的困难,减少听障用户因为字幕显示时间较短而导致频繁地拖动进度条回看的操作。

    一种基于背景文字增强的视频字幕生成方法和系统

    公开(公告)号:CN118317159A

    公开(公告)日:2024-07-09

    申请号:CN202410428195.3

    申请日:2024-04-10

    Abstract: 本发明提供了一种基于背景文字增强的视频字幕生成方法和系统,包括:基于人声检测模型确定视频信息中文字出现的时间戳集合;基于所述时间戳集合获取与之对应的视频画面;提取所述视频画面中的文字信息;对所述文字信息进行分词和词性标注;基于TextRank算法计算每个分词的得分;基于所述每个分词的得分以及与之对应的词性标注生成与之对应的词性标注列表;依据预设的分配比例选取不同的词性标注列表中的分词组成热词表;根据分词的得分排序等比例设置热词表中不同分词的生效权重;基于所述热词表和视频信息生成视频字幕。利用热词表和音频数据,通过语音识别软件获取视频字幕信息,通过以上流程从而达到减少人工干预且提高视频字幕识别准确率的效果。

Patent Agency Ranking