一种基于时间掩码的唇语数据增强方法

    公开(公告)号:CN117892063A

    公开(公告)日:2024-04-16

    申请号:CN202410120675.3

    申请日:2024-01-29

    Inventor: 胡宇 殷继彬

    Abstract: 本发明公开了一种基于时间掩码的唇语数据增强方法。该方法首先通过分块的策略将输入数据划分为多个子序列,在对子序列进行时间掩码操作,即利用各子序列平均帧替换子序列的随机长度的连续帧。相较于唇语识别中其余数据增强方法,该方法保留了唇语数据更多的时间维度特征、使得模型能学习到数据更多时间维度特征,从而能在不改变网络模型结构以及各参数不变的前提下增强网络模型的识别准确率。本发明可以广泛的应用于唇语识别领域和数据增强领域。

Patent Agency Ranking