-
公开(公告)号:CN119600391A
公开(公告)日:2025-03-11
申请号:CN202411551772.4
申请日:2024-11-01
Applicant: 中国信息通信研究院
IPC: G06V10/776 , G06V40/20 , G10L15/25 , G10L15/26
Abstract: 本申请涉及中文数字人技术领域,公开一种基于唇语识别的中文数字人口唇匹配度评估方法及装置、唇语识别设备,包括:获取原始视频中唇部区域的图像序列和与原始视频相对应的真实文本;根据AVSR模型和RNN语言模型对唇部区域的图像序列进行文本推理,获得与图像序列相对应的预测文本;滑动窗口内对真实文本和预测文本进行中文音节匹配度计算,获得口唇匹配度的评估结果。本申请能够对唇语识别的结果进行匹配度评估。不仅提高了评估的准确性,还解决了中文环境下多音字和同音字带来的复杂性问题。