-
公开(公告)号:CN120045940A
公开(公告)日:2025-05-27
申请号:CN202510124267.X
申请日:2025-01-26
Applicant: 华中科技大学
IPC: G06F18/214 , G06F18/211 , G06F18/2415 , G06F18/2431
Abstract: 本发明公开了一种基于模型预测置信度变化趋势的样本选择方法,包括以下步骤:1)获取所有的待选择的样本数据;2)对获取的样本数据,形成一个包含噪声标签的k分类数据集;3)对于训练集中的每个样本,收集以下置信度差距:4)在不同训练迭代中收集置信度差距后,得到以下置信度差异时间序列:5)判断置信度差异时间序列的置信度变化趋势,如果置信度差距时间序列具有上升趋势,则将此样本视为潜在的正确标注样本。使用本发明提出的方法能从高损失样本中识别正确标签,从而缓解了传统小损失策略在样本选择时忽略高损失样本中正确标签的问题。
-
公开(公告)号:CN114973412B
公开(公告)日:2024-09-10
申请号:CN202210614030.6
申请日:2022-05-31
Applicant: 华中科技大学
IPC: G06V40/20 , G06V40/16 , G06V10/82 , G06N3/0455 , G06N3/0464 , G10L15/25
Abstract: 本发明公开了一种唇语识别方法和系统,其中方法包括:获取视频帧中人脸图像及其真实唇部语言,提取人脸图像的唇部区域,组成ROI序列,将ROI序列以及差分后ROI序列分别输入前端特征提取网络的两个分支,输出拼接差分特征的唇部区域特征,将拼接差分特征的唇部区域特征输入后端分类网络,输出预测字符,以预测字符与真实唇部语言之间的误差最小为目标训练至收敛,得到唇语识别模型。提取连续帧人脸图像的唇部区域输入唇语识别模型进行唇语识别,得到各帧人脸图像对应的字符,组成语言文本。本发明唇语识别方法识别效率高,准确率高,泛化性能较好,可以很好的应用于听障人士的辅助设备中,适用于多种场景,如超市、车站、医院、学校。
-
公开(公告)号:CN114973412A
公开(公告)日:2022-08-30
申请号:CN202210614030.6
申请日:2022-05-31
Applicant: 华中科技大学
Abstract: 本发明公开了一种唇语识别方法和系统,其中方法包括:获取视频帧中人脸图像及其真实唇部语言,提取人脸图像的唇部区域,组成ROI序列,将ROI序列以及差分后ROI序列分别输入前端特征提取网络的两个分支,输出拼接差分特征的唇部区域特征,将拼接差分特征的唇部区域特征输入后端分类网络,输出预测字符,以预测字符与真实唇部语言之间的误差最小为目标训练至收敛,得到唇语识别模型。提取连续帧人脸图像的唇部区域输入唇语识别模型进行唇语识别,得到各帧人脸图像对应的字符,组成语言文本。本发明唇语识别方法识别效率高,准确率高,泛化性能较好,可以很好的应用于听障人士的辅助设备中,适用于多种场景,如超市、车站、医院、学校。
-
-