-
公开(公告)号:CN119600610A
公开(公告)日:2025-03-11
申请号:CN202411650733.X
申请日:2024-11-19
Applicant: 北京邮电大学
IPC: G06V30/12 , G06V30/226 , G06V30/262 , G06V30/19 , G06V10/82 , G06N3/0455 , G06N3/0895
Abstract: 本发明提供一种基于对比学习的多模态手写汉字纠错网络架构,包括:基于对比学习的预训练模块,表意文字描述序列生成模块以及汉字纠错模块;本发明充分利用汉字本身具有的图像特征和语义特征,发挥了多模态特征的互补优势,实现对手写汉字的准确识别,可以对从未见过的汉字进行识别,而无需预先知道该汉字可能属于的类别集合;本发明提出的方法基于生成,对汉字的结构和部首有着根本的理解,可以识别出一个从未见过的、甚至是写错的汉字的结构与部首;无需收集并标注错字数据集,降低了人工和成本,适合推广。