-
公开(公告)号:CN113139904A
公开(公告)日:2021-07-20
申请号:CN202110471824.7
申请日:2021-04-29
Applicant: 厦门大学
Abstract: 本发明公开了一种图像盲超分辨率方法及系统。该方法包括:获取经训练的模糊核生成网络以及低分辨率图像的频谱图;将所述频谱图输入所述经训练的模糊核生成网络,得到所述低分辨率图像对应的模糊核;根据所述低分辨率图像对应的模糊核确定所述低分辨率图像对应的退化特征图;将所述低分辨率图像与其对应的退化特征图进行拼接,得到拼接图;将所述拼接图输入经训练的卷积神经网络,得到高分辨率图像。本发明具有运算简单快速、准确度高的优势。
-
公开(公告)号:CN114550158B
公开(公告)日:2024-09-06
申请号:CN202210164606.3
申请日:2022-02-23
Applicant: 厦门大学
IPC: G06V20/62 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种场景文字识别方法及系统。该方法包括:构建训练样本;训练样本包括公用数据集和非公用数据集;公用数据集和非公用数据集均包括场景图片和标签文件;通过训练样本训练Yolov5模型,得到字符检测模型;字符检测模型的输入为场景图片,输出为场景图片中包含的所有单个字符;通过训练样本和字符检测模型识别出的所有单个字符对Textformer模型进行训练;通过训练好的Textformer模型对待识别的场景图片中的文字区域和单个字符进行识别。本发明仅利用“Transoformer”就实现了一个端到端的文本定位器,相较于传统的使用卷积神经网络提取图片特征再输入到“Transformer”中的方法,有着更高的效率。并且,由于只用到了“Transformer”,所以本发明的模型框架更简单。
-
公开(公告)号:CN114550158A
公开(公告)日:2022-05-27
申请号:CN202210164606.3
申请日:2022-02-23
Applicant: 厦门大学
Abstract: 本发明公开了一种场景文字识别方法及系统。该方法包括:构建训练样本;训练样本包括公用数据集和非公用数据集;公用数据集和非公用数据集均包括场景图片和标签文件;通过训练样本训练Yolov5模型,得到字符检测模型;字符检测模型的输入为场景图片,输出为场景图片中包含的所有单个字符;通过训练样本和字符检测模型识别出的所有单个字符对Textformer模型进行训练;通过训练好的Textformer模型对待识别的场景图片中的文字区域和单个字符进行识别。本发明仅利用“Transoformer”就实现了一个端到端的文本定位器,相较于传统的使用卷积神经网络提取图片特征再输入到“Transformer”中的方法,有着更高的效率。并且,由于只用到了“Transformer”,所以本发明的模型框架更简单。
-
公开(公告)号:CN113139904B
公开(公告)日:2022-05-27
申请号:CN202110471824.7
申请日:2021-04-29
Applicant: 厦门大学
Abstract: 本发明公开了一种图像盲超分辨率方法及系统。该方法包括:获取经训练的模糊核生成网络以及低分辨率图像的频谱图;将所述频谱图输入所述经训练的模糊核生成网络,得到所述低分辨率图像对应的模糊核;根据所述低分辨率图像对应的模糊核确定所述低分辨率图像对应的退化特征图;将所述低分辨率图像与其对应的退化特征图进行拼接,得到拼接图;将所述拼接图输入经训练的卷积神经网络,得到高分辨率图像。本发明具有运算简单快速、准确度高的优势。
-
-
-