-
公开(公告)号:CN119580268A
公开(公告)日:2025-03-07
申请号:CN202510064855.9
申请日:2025-01-15
Applicant: 昆明理工大学
IPC: G06V30/148 , G06N3/0455 , G06N3/0464 , G06V10/82 , G06V30/19
Abstract: 本发明涉及基于多粒度解码约束的缅甸语图像文本识别方法及装置,属于自然语言处理领域。缅甸语文本具有独特的编码顺序以及字符组合规则,为了解决缅甸语图像中形似字符识别不佳的问题,提出一种基于多粒度解码约束的缅甸语文本图像识别方法,主要由缅甸语文本图像数据集构建及预处理、设计包括基于滑动窗口的Transformer、语言特性驱动的多粒度特征抽取模块、多粒度特征融合模块的基于多粒度解码约束的缅甸语文本图像识别模型以及缅甸语文本图像识别四个部分构成。根据这四个部分功能模块化制成基于多粒度解码约束的缅甸语图像文本识别装置,有效地解决了因图像质量不佳而导致的缅甸语形似字符识别困难问题。
-
公开(公告)号:CN119048632A
公开(公告)日:2024-11-29
申请号:CN202411535637.0
申请日:2024-10-31
Applicant: 昆明理工大学
IPC: G06T11/00 , G06F40/151 , G06F40/166 , G06F40/284 , G06N3/0455 , G06N3/0499 , G06N3/08 , G06T5/70
Abstract: 本发明涉及融入字符空间特征的缅甸语文本图像生成方法及装置,属自然语言处理领域。缅甸语属于低资源语言,现有的缅甸语文本图像生成方法难以解决缅甸语文本图像中字符在空间上分布不均匀的问题。针对现有缅甸语生成模型难以解决缅甸语文本图像中字符在空间上分布不均匀的问题,本发明提出了一种融入字符空间特征的缅甸语文本图像生成方法,主要包括缅甸语输入文本处理、构建字符空间特征生成模块、构建融入字符空间特征的缅甸语文本图像生成模型、缅甸语文本图像生成四部分。根据这四个功能模块化制成融入字符空间特征的缅甸语文本图像生成装置,通过输入的缅甸语文得到真实场景下的缅甸语文本图像,本发明有效提升了缅甸语文本图像的生成效果。
-
公开(公告)号:CN118799896A
公开(公告)日:2024-10-18
申请号:CN202410803820.8
申请日:2024-06-20
Applicant: 昆明理工大学
IPC: G06V30/41 , G06V30/244 , G06V30/186 , G06V30/19 , G06V10/82 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及融合预训练模型的端到端缅甸语文本图像检测识别方法及装置,属于自然语言处理领域。为了解决多行缅甸语文本识别准确率较低的问题,提出一种融合预训练模型的端到端缅甸语文本图像识别方法,主要由缅甸语文本图像数据集构建及预处理;融合滑动窗口的Transformer和特征金字塔的缅甸语文本图像特征提取模块;融合预训练模型的缅甸语检测识别模型;缅甸语图像检测识别装置四个部分构成。本发明提高了模型的泛化能力和收敛速度,相比通用的图像识别方法本发明有效地缓解了缅甸语文本图像中特征丢失、漏检或不完整导致识别准确率低的问题。
-
公开(公告)号:CN118395998A
公开(公告)日:2024-07-26
申请号:CN202410818685.4
申请日:2024-06-24
Applicant: 昆明理工大学
IPC: G06F40/58 , G06F40/211 , G06F40/284 , G06F40/51 , G06N3/0455 , G06N3/0499 , G06N3/082
Abstract: 本发明涉及基于分化适配器的汉老泰多语言神经机器翻译方法,属自然语言处理技术领域。汉‑老‑泰多语言机器翻译框架通过模型参数共享能有效共享相似语言知识提升老‑汉和泰‑汉翻译性能,但引入模型参数共享会导致不同语言间参数相互干扰问题。针对汉‑老‑泰多语言机器翻译框架中的参数干扰降低机器翻译质量问题,本发明包括数据处理和模型预训练、进行基于分化适配器的汉‑老‑泰多语言神经机器翻译模型微调、构建基于分化适配器的汉‑老‑泰多语言神经机器翻译装置三部分。本发明对输入的泰语或老挝语进行目标语言的翻译,本发明有效提升了汉‑老‑泰多语言机器翻译质量。
-
公开(公告)号:CN116597437B
公开(公告)日:2023-10-03
申请号:CN202310880842.X
申请日:2023-07-18
Applicant: 昆明理工大学
Abstract: 本发明涉及融合双层注意力网络的端到端老挝车牌照识别方法及装置,属于自然语言处理领域。本发明方法包括老挝车牌照图像数据构建及预处理、融合双层注意力网络的端到端老挝车牌照识别模型构建、融合双层注意力网络的端到端老挝车牌照模型训练、融合双层注意力网络的端到端老挝车牌照识别模型四部分构成。根据这四个部分功能模块化制成融合双层注意力网络的端到端老挝车牌照识别装置,对输入的老挝车牌照图像进行信息识别,本发明提高了老挝车牌照图像识别的正确率,有效地解决了老挝车牌照上行省份字符排列紧密、难以分割和下行辅音字符相似度高、难以识别的问题。
-
公开(公告)号:CN119048632B
公开(公告)日:2025-01-24
申请号:CN202411535637.0
申请日:2024-10-31
Applicant: 昆明理工大学
IPC: G06T11/00 , G06F40/151 , G06F40/166 , G06F40/284 , G06N3/0455 , G06N3/0499 , G06N3/08 , G06T5/70
Abstract: 本发明涉及融入字符空间特征的缅甸语文本图像生成方法及装置,属自然语言处理领域。缅甸语属于低资源语言,现有的缅甸语文本图像生成方法难以解决缅甸语文本图像中字符在空间上分布不均匀的问题。针对现有缅甸语生成模型难以解决缅甸语文本图像中字符在空间上分布不均匀的问题,本发明提出了一种融入字符空间特征的缅甸语文本图像生成方法,主要包括缅甸语输入文本处理、构建字符空间特征生成模块、构建融入字符空间特征的缅甸语文本图像生成模型、缅甸语文本图像生成四部分。根据这四个功能模块化制成融入字符空间特征的缅甸语文本图像生成装置,通过输入的缅甸语文得到真实场景下的缅甸语文本图像,本发明有效提升了缅甸语文本图像的生成效果。
-
公开(公告)号:CN116597437A
公开(公告)日:2023-08-15
申请号:CN202310880842.X
申请日:2023-07-18
Applicant: 昆明理工大学
Abstract: 本发明涉及融合双层注意力网络的端到端老挝车牌照识别方法及装置,属于自然语言处理领域。本发明方法包括老挝车牌照图像数据构建及预处理、融合双层注意力网络的端到端老挝车牌照识别模型构建、融合双层注意力网络的端到端老挝车牌照模型训练、融合双层注意力网络的端到端老挝车牌照识别模型四部分构成。根据这四个部分功能模块化制成融合双层注意力网络的端到端老挝车牌照识别装置,对输入的老挝车牌照图像进行信息识别,本发明提高了老挝车牌照图像识别的正确率,有效地解决了老挝车牌照上行省份字符排列紧密、难以分割和下行辅音字符相似度高、难以识别的问题。
-
公开(公告)号:CN118395998B
公开(公告)日:2024-08-16
申请号:CN202410818685.4
申请日:2024-06-24
Applicant: 昆明理工大学
IPC: G06F40/58 , G06F40/211 , G06F40/284 , G06F40/51 , G06N3/0455 , G06N3/0499 , G06N3/082
Abstract: 本发明涉及基于分化适配器的汉老泰多语言神经机器翻译方法,属自然语言处理技术领域。汉‑老‑泰多语言机器翻译框架通过模型参数共享能有效共享相似语言知识提升老‑汉和泰‑汉翻译性能,但引入模型参数共享会导致不同语言间参数相互干扰问题。针对汉‑老‑泰多语言机器翻译框架中的参数干扰降低机器翻译质量问题,本发明包括数据处理和模型预训练、进行基于分化适配器的汉‑老‑泰多语言神经机器翻译模型微调、构建基于分化适配器的汉‑老‑泰多语言神经机器翻译装置三部分。本发明对输入的泰语或老挝语进行目标语言的翻译,本发明有效提升了汉‑老‑泰多语言机器翻译质量。
-
-
-
-
-
-
-