唇部音节识别方法、装置、设备及介质

    公开(公告)号:CN114220177A

    公开(公告)日:2022-03-22

    申请号:CN202111597760.1

    申请日:2021-12-24

    Applicant: 湖南大学

    Abstract: 本公开实施例中提供了一种唇部音节识别方法、装置、设备及介质,属于图像处理技术领域,具体包括:得到每个初始特征点的坐标信息;形成距离时间序列;根据距离时间序列转换目标曲线;从距离时间序列中分割对应的发音序列;得到最优特征序列;计算最优特征序列与样本特征序列之间距离的相似度;判断相似度是否小于第二阈值;若是,则判定音节相同;若否,则判定音节不同,并计算最优特征序列与其他样本特征序列的相似度,直至相似度小于第二阈值。通过本公开的方案,计算基于音节的细粒度特征,然后利用交叉验证递归特征消除模型进行训练,选取最优特征序列与样本特征序列进行比对,从而识别对应的音节,提高了音节检测的效率、精准度和适应性。

    唇部音节识别方法、装置、设备及介质

    公开(公告)号:CN114220177B

    公开(公告)日:2024-06-25

    申请号:CN202111597760.1

    申请日:2021-12-24

    Applicant: 湖南大学

    Abstract: 本公开实施例中提供了一种唇部音节识别方法、装置、设备及介质,属于图像处理技术领域,具体包括:得到每个初始特征点的坐标信息;形成距离时间序列;根据距离时间序列转换目标曲线;从距离时间序列中分割对应的发音序列;得到最优特征序列;计算最优特征序列与样本特征序列之间距离的相似度;判断相似度是否小于第二阈值;若是,则判定音节相同;若否,则判定音节不同,并计算最优特征序列与其他样本特征序列的相似度,直至相似度小于第二阈值。通过本公开的方案,计算基于音节的细粒度特征,然后利用交叉验证递归特征消除模型进行训练,选取最优特征序列与样本特征序列进行比对,从而识别对应的音节,提高了音节检测的效率、精准度和适应性。

Patent Agency Ranking