-
公开(公告)号:CN111582195B
公开(公告)日:2024-01-26
申请号:CN202010395570.0
申请日:2020-05-12
Applicant: 中国矿业大学(北京)
IPC: G06V40/16 , G06V10/84 , G06V10/82 , G06N3/0442 , G06N3/09
Abstract: 本发明公开了一种汉语唇语单音节识别分类器构建方法,包括步骤:S1、采集待识别汉字单音节的发音视频;S2、构建唇部特征点标注图像样本集;S3、训练唇部特征点提取模型;S4、将所录制的每个汉语单音节发音视频均匀切分得到若干帧采样图像;S5、利用训练所得的唇部特征点提取模型对所得的每一帧采样图像分别进行特征点提取;S6、根据所得的唇部特征点集,分别构建每一帧图像的唇部几何特征;S7、将所得的属于同一发音视频的全部的新的几何特征序列按顺序保存,并标明所属类别;S8、利用所得每个发音视频的特征矩阵,训练得到唇语识别器。利用本发明可以实现汉语唇语识别,而且具有较高准确率。
-
公开(公告)号:CN111582195A
公开(公告)日:2020-08-25
申请号:CN202010395570.0
申请日:2020-05-12
Applicant: 中国矿业大学(北京)
Abstract: 本发明公开了一种汉语唇语单音节识别分类器构建方法,包括步骤:S1、采集待识别汉字单音节的发音视频;S2、构建唇部特征点标注图像样本集;S3、训练唇部特征点提取模型;S4、将所录制的每个汉语单音节发音视频均匀切分得到若干帧采样图像;S5、利用训练所得的唇部特征点提取模型对所得的每一帧采样图像分别进行特征点提取;S6、根据所得的唇部特征点集,分别构建每一帧图像的唇部几何特征;S7、将所得的属于同一发音视频的全部的新的几何特征序列按顺序保存,并标明所属类别;S8、利用所得每个发音视频的特征矩阵,训练得到唇语识别器。利用本发明可以实现汉语唇语识别,而且具有较高准确率。
-