-
公开(公告)号:CN112070176B
公开(公告)日:2022-05-13
申请号:CN202010983942.1
申请日:2020-09-18
Applicant: 福州大学
IPC: G06K9/62 , G06V20/62 , G06V10/774 , G06V30/148 , G06N3/04
Abstract: 本发明提出一种免切割的端到端车牌识别方法,包括以下步骤;步骤S1:收集车牌识别数据集,构建用于训练所述识别网络的训练集和测试集;步骤S2:设计用于提取车牌字符特征的特征提取模块;同时提取车牌字符本身的特征和该字符在车牌中的分布特征;步骤S3:设计用于恢复模糊车牌的反卷积模块,进一步优化对车牌字符特征的表述;步骤S4:使用特征提取网络与反卷积模块设计识别网络的输出模块;步骤S5:使用训练集标签对识别网络进行训练;当识别网络输出对应的包含字符概率的概率向量时,通过使用贪心算法得到最终的车牌号码;本发明可以只使用卷积神经网络完成车牌号码的识别过程,同时具有免字符切割,端到端识别、免车牌矫正,快速轻量的特征。
-
公开(公告)号:CN110852255B
公开(公告)日:2022-05-13
申请号:CN201911086249.8
申请日:2019-11-08
Applicant: 福州大学
IPC: G06V20/58 , G06V10/774 , G06V10/764 , G06V10/80 , G06K9/62
Abstract: 本发明涉及一种基于U型特征金字塔的交通目标检测方法。提出了一种U型模块,并利用级联方式构建多级的图像特征金字塔,来解决多尺度的问题。为了证明U型模块的有效性,我们还设计了一种新的单目标检测器,U‑FPNDet,该模型首先利用基础网络提取出基础特征图,然后利用级联的U型模块将基础特征图构建出多级特征金字塔,最后在每一级金字塔上运行检测网络得出最后的结果。
-
公开(公告)号:CN114267069A
公开(公告)日:2022-04-01
申请号:CN202111604882.9
申请日:2021-12-25
Applicant: 福州大学
Abstract: 本发明涉及一种基于数据泛化与特征增强的人脸检测方法,包括以下步骤:步骤S1:获取人脸检测数据集,并预处理;步骤S2:构建人脸检测神经网络,并分别在神经网络中的残差结构中加入通道自注意力模块;在骨干网部分加入感受野匹配模块;在特征提取部分加入跨层特征融合模块;步骤S3:基于预处理后的人脸检测数据集训练人脸检测神经网络;步骤S4:使用训练后的人脸检测神经网络进行人脸检测,若可以直接检测到人脸则直接进行定位,如果无法直接定位,则使用检测到的关键点位置辅助定位人脸位置,最终输出人脸检测结果。本发明能够有效地对待检测的图像、视频帧中的人脸进行定位并输出结果。
-
公开(公告)号:CN109165697B
公开(公告)日:2021-11-30
申请号:CN201811187360.1
申请日:2018-10-12
Applicant: 福州大学
Abstract: 本发明涉及一种基于注意力机制卷积神经网络的自然场景文字检测方法,首先对自然场景下的带文本的图像数据进行标注,并将其分为训练集和测试集;然后使用数据增强的方法对文本图像进行处理作为训练数据;基于注意力机制模块和Inception网络构建了基于注意力机制特征提取网络,并采用多尺度特征融合的方法学习不同大小字体的特征;使用课程学习的策略预训练网络;利用自然场景的文本图像数据再次训练网络;使用融合后的特征进行回归得到图像中文本的坐标,得到文本检测的结果。最后在测试集以及其他公开数据集验证训练后的神经网络的有效性。本发明能够解决当前技术面对复杂自然环境下文字召回率不高、识别正确率较低的问题,并在运行速度上具有优势。
-
公开(公告)号:CN113485615A
公开(公告)日:2021-10-08
申请号:CN202110745694.1
申请日:2021-06-30
Applicant: 福州大学
IPC: G06F3/0484 , G06F3/0486 , G06K9/00 , G06K9/20 , G06K9/32 , G06T11/60 , G06T11/80
Abstract: 本发明涉及一种基于计算机视觉的典型应用智能图文教程制作的方法及系统,该方法包括实时操作过程和录屏操作过程,实时操作过程包括:A1、获取用户操作过程中的鼠标和键盘操作,分析鼠键操作对应的典型软件操作内容;A2、对操作内容进行筛选,判定其关键程度,对包含关键文字信息的操作进行用户屏幕区域提取;A3、对提取到的区域进行文字内容识别,将用户操作画面与提取所得文字进行编排,写入文档;录屏操作过程包括:B1、对输入视频进行关键帧提取,识别录屏操作中关键内容;B2、对获取的关键帧内容进行鼠标检测,标定操作位置,整理标定操作位置后的关键帧,写入文档。该方法及系统可以有效地识别用户操作内容,智能化生成操作文档。
-
公开(公告)号:CN109461128B
公开(公告)日:2021-09-28
申请号:CN201811235870.1
申请日:2018-10-24
Applicant: 福州大学
Abstract: 本发明涉及一种基于梯度保持的结构一致立体图像颜色校正方法,首先利用SIFT特征提取和匹配分别对参考图像和目标图像进行特征提取和像素匹配,获取结构图像和匹配图像;然后利用结构相似性算法生成匹配图像和目标图像的置信度图,对图像置信度较低的区域进行局部映射,生成初始颜色校正结果图像;最后利用梯度保持算法对初始颜色校正结果图像的颜色和结构进行有参考的优化,得到最终的结果图像。本发明解决了局部颜色校正算法的结构一致问题和全局颜色校正算的区域颜色混乱问题,而且还保留了图像的梯度信息,提升了图像的保真度。
-
公开(公告)号:CN112598764A
公开(公告)日:2021-04-02
申请号:CN202011569475.4
申请日:2020-12-26
Applicant: 福州大学
IPC: G06T11/20 , G06F40/186 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种迁移场景风格的字符图像生成方法,可用于生成含给定场景风格的汉字字符图像,所述方法包括以下步骤:步骤S1:采集场景字符图像,制作原始字符图像,构建训练数据集;步骤S2:构建用于场景字符图像生成的生成对抗网络,并训练网络;步骤S3:使用源场景字符图像、源原始字符图像和目标原始字符图像,生成场景字符图像;本发明可提供一种通过给定含有场景风格和字体风格的场景字符图像,并通过字体文件制作简单的黑底白字的字符图像,生成指定字符含有给定场景风格的场景字符图像。
-
公开(公告)号:CN112287891A
公开(公告)日:2021-01-29
申请号:CN202011319889.1
申请日:2020-11-23
Applicant: 福州大学
Abstract: 本发明提出一种基于表情及行为特征提取的通过视频评估学习专注力的方法,首先通过人体骨骼点检测方法AlphaPose获取人体骨架,通过轻量化人脸检测模型检测人脸;接着将骨架编码转换为图像,通过神经网络分类器进行动作分类;将获取到的人脸框,先通过VGG‑A网络提取特征,再经过Segmentation网络进一步拟合得到精确的人脸位置,接着将人脸裁剪为多个区域,并使用CNN网络提取特征,通过自注意力模块对不同人脸区域进行加权,融合多个区域的局部特征形成整体特征进行表情分类;最后融合动作和表情识别结果,通过LSTM网络得到最终的专注力分析结果。其针对学生行为构建了有效的运动特征,相对传统的动作识别难以有效地解决视角差异和动作差异带来的问题。
-
公开(公告)号:CN112200258A
公开(公告)日:2021-01-08
申请号:CN202011114773.4
申请日:2020-10-16
Applicant: 福州大学
Abstract: 本发明涉及一种多维度车标数据增强方法,首先通过小框随机选取法,生成一个四个顶点相对车标顶点偏移量为车标区域宽和高1.5到3倍的小矩形框,用这个矩形框框选包含车标区域的图像,截取作为尺度维度增强图像。然后进行数量维度增强,通过滑动交叉分割法,用一个大小为源图像1/2的矩形框每隔1/4的步长对图像进行扫描并截取,生成大量有效的数量维度增强图像。通过正态分布分割法,生成一个长为车标区域的中心到图像左右两边的最小值,宽为车标区域的中心到图像上下两边的最小值的矩形框,用这个矩形框以正态分布的概率选取包含车标区域的一部分图像并截取作为空间维度增强图像。最后使用亮度变换和对比度变换对以上所有数据进行亮度维度和对比度维度的增强。本发明能够有效地对车标进行数据量扩充。
-
公开(公告)号:CN112200065A
公开(公告)日:2021-01-08
申请号:CN202011070118.3
申请日:2020-10-09
Applicant: 福州大学
Abstract: 本发明涉及一种基于动作放大和自适应注意力区域选取的微表情分类方法。首先获取微表情数据集,提取出起始帧和峰值帧;然后将提取的起始帧和峰值帧输入动作放大网络,生成动作放大后的图像;接着对放大后的图像进行预处理;最后利用自适应注意力区域选取方法对预处理后的图像进行识别,得到最终分类的结果。
-
-
-
-
-
-
-
-
-