基于深度学习的计算题图像识别及自动判别方法

    公开(公告)号:CN119418348A

    公开(公告)日:2025-02-11

    申请号:CN202411458826.2

    申请日:2024-10-18

    Abstract: 基于深度学习的计算题图像识别及自动判别方法,涉及OCR中文字识别和深度学习技术领域,解决现有技术中针对小学生手写数学计算题的图像字符和二维结构识别困难,导致对计算题识别准确率较低的问题,本方法首先对含算式图像进行数据处理,将处理后的图像数据划分为训练集和测试集;构建具有计数模块的编码器和解码器结构的深度学习模型并利用训练集训练模型,然后调用训练好的学习模型对计算题算式进行识别,完成习题的自动批改。最终能够实现一种功能强大的小学生数学作业自动识别与批改。本方法针对注意力不准的问题,提出通过添加计数模块,来使注意力更加准确,同时,计数结果可以表示符号的数量,作为额外的全局信息提高识别的准确性。

    一种基于计数模块的手写数学公式多尺度识别方法

    公开(公告)号:CN118968528B

    公开(公告)日:2025-01-28

    申请号:CN202411455744.2

    申请日:2024-10-18

    Abstract: 一种基于计数模块的手写数学公式多尺度识别方法,涉及图像识别技术领域,解决现有技术针对手写体数字识别模型存在的识别准确性低的问题,本方法通过构建手写数学公式图像数据集,将手写数学公式图像输入构建基于计数模块的手写数学公式识别模型,采用ResNet对处理后的图像数据集中手写数学公式图像提取特征图,采用符号计数模块对特征图添加全局信息,通过LSTM输出预测的LaTeX序列。本方法将手写数学公式识别建模为一个图像至序列的任务。利用编码器被用于提取输入图像的特征,而解码器则逐步预测对应LaTeX序列。本方法有效地将手写数学公式识别问题转化为一个端到端的序列生成问题,简化了问题的复杂性。

    基于多尺度混合神经网络的肺癌病理图像分类方法

    公开(公告)号:CN116912253B

    公开(公告)日:2023-12-05

    申请号:CN202311181020.9

    申请日:2023-09-14

    Applicant: 吉林大学

    Abstract: 基于多尺度混合神经网络的肺癌病理图像分类方法,解决现有方法无法充分提取病理图像中的特征、模型复杂度高、计算量大以及消耗的存储资源大等问题,本发明方法中的基于多尺度混合神经网络的深度学习模型,用于肺癌病理图像自动检测。该方法采用多尺度输入方式,混合神经网络结合了MLP‑Mixer和Swin Transformer两种简单高效的模型,以充分提取补丁之间的语义信息和每个补丁内部的语义信息,同时有效控制计算复杂度和计算量。使用多层感知器模块对局部和全局特征进行融合,并进行分类。本发明实现了96.55%的准确率。实验结果表明,该框架展现出了在肺癌病理图像分类领域的有效性和

    基于多尺度混合神经网络的肺癌病理图像分类方法

    公开(公告)号:CN116912253A

    公开(公告)日:2023-10-20

    申请号:CN202311181020.9

    申请日:2023-09-14

    Applicant: 吉林大学

    Abstract: 基于多尺度混合神经网络的肺癌病理图像分类方法,解决现有方法无法充分提取病理图像中的特征、模型复杂度高、计算量大以及消耗的存储资源大等问题,本发明方法中的基于多尺度混合神经网络的深度学习模型,用于肺癌病理图像自动检测。该方法采用多尺度输入方式,混合神经网络结合了MLP‑Mixer和Swin Transformer两种简单高效的模型,以充分提取补丁之间的语义信息和每个补丁内部的语义信息,同时有效控制计算复杂度和计算量。使用多层感知器模块对局部和全局特征进行融合,并进行分类。本发明实现了96.55%的准确率。实验结果表明,该框架展现出了在肺癌病理图像分类领域的有效性和潜力。

    一种基于计数模块的手写数学公式多尺度识别方法

    公开(公告)号:CN118968528A

    公开(公告)日:2024-11-15

    申请号:CN202411455744.2

    申请日:2024-10-18

    Abstract: 一种基于计数模块的手写数学公式多尺度识别方法,涉及图像识别技术领域,解决现有技术针对手写体数字识别模型存在的识别准确性低的问题,本方法通过构建手写数学公式图像数据集,将手写数学公式图像输入构建基于计数模块的手写数学公式识别模型,采用ResNet对处理后的图像数据集中手写数学公式图像提取特征图,采用符号计数模块对特征图添加全局信息,通过LSTM输出预测的LaTeX序列。本方法将手写数学公式识别建模为一个图像至序列的任务。利用编码器被用于提取输入图像的特征,而解码器则逐步预测对应LaTeX序列。本方法有效地将手写数学公式识别问题转化为一个端到端的序列生成问题,简化了问题的复杂性。

    基于多层感知机的肺部组织病理图像类型辅助分类方法

    公开(公告)号:CN116030306A

    公开(公告)日:2023-04-28

    申请号:CN202310082953.6

    申请日:2023-02-08

    Applicant: 吉林大学

    Abstract: 基于多层感知机的肺部组织病理图像类型辅助分类方法,涉及病理数据图像处理技术领域,解决现有的卷积神经网络、VisionTransformer中的卷积操作和自注意力机制过于复杂,算法的训练时间较长导致分类方法复杂等问题,本发明通过获得混合数据集,建立多层感知机模型以及对模型进行性能评估等步骤实现病理图像类型的辅助分类。本发明中的多层感知机模型不使用任何复杂的卷积操作和自注意力机制,模型结构简单,计算量小,处理速度快。设计了双数据流输入方式,使模型在可以捕捉全局信息的基础上还可以捕捉到局部信息,充分提取图像中的语义信息,提高模型对肺部组织病理图像的分类性能。

Patent Agency Ranking