-
公开(公告)号:CN114359885A
公开(公告)日:2022-04-15
申请号:CN202111620882.8
申请日:2021-12-28
Applicant: 武汉工程大学 , 武汉逸锦科技有限公司
Abstract: 本发明提供了一种高效的类手‑文混合目标检测方法,通过设计的混合目标检测模型在已经具备手指、笔等类柱体物和目标文本的图像数据集进行训练,平衡地划分训练的正负样本,使深度网络模型只对图像中同时包含类手指指尖和文本字词的区域感兴趣,降低深度网络模型在图像其他区域所生成的预测框的置信度,从而在现实阅读场景中做到模型只对手指所指向的文本进行检测,而忽略当前页的其他文本字词,避免了对图像中手指、笔等类柱体物和文字的两次目标检测与坐标变换的过程,优化了检测的实时性,简化了检测的思路。
-
公开(公告)号:CN105389819B
公开(公告)日:2019-02-01
申请号:CN201510776198.7
申请日:2015-11-13
Applicant: 武汉工程大学
Abstract: 本发明公开了一种鲁棒的半标定下视图像极线校正方法及系统,该方法包括以下步骤:S1、获取无人飞行器每一成像时刻下视相机拍摄的图像,相机的内参数矩阵,以及无人飞行器的惯导系统提供的姿态参数,构建平行于地平面的虚拟成像环境;S2、对不同成像时刻的图像分别提取特征点,构建初始特征点对应集合;并根据该集合得到变换后的特征点对应集合;S3、构建概率表达模型,计算无人飞行器的航向与正北方向的夹角;S4、计算单应变换矩阵,并根据该矩阵,对每一成像时刻的图像进行极线校正。本发明能够快速的完成校正,并且能够得到精度较高的校正图像,对于无人机辅助导航等应用领域具有重要的指导意义。
-
公开(公告)号:CN105243636A
公开(公告)日:2016-01-13
申请号:CN201510852303.0
申请日:2015-11-27
Applicant: 武汉工程大学
IPC: G06T3/00
CPC classification number: G06T3/0093
Abstract: 本发明公开了一种基于MRLS-TPS的图像变形方法及系统,该方法包括以下步骤:S1、输入原图像、权值参数α和正则化参数λ,并从原图像中选取控制点集合和该控制点集合对应的目标点集合S2、取径向基函数作为TPS核,根据TPS核构建控制点集合的核矩阵K,并根据TPS模型构建变形映射模拟函数fp,fp可以分解为一个全局的仿射变换矩阵A和一个局部的弯曲函数gp;S3、根据S2中的公式求解原图像中每个像素点的权重矩阵W、核向量Kp及变形映射函数fp;S4、根据变形映射函数的集合{fp(p)},通过逆向映射获得变形图像。本发明的优点为:(1)变形后的图像可以很好地保留细节;(2)变形函数具有简单封闭解;(3)它具有非常高的计算效率。
-
公开(公告)号:CN114611530A
公开(公告)日:2022-06-10
申请号:CN202210162374.8
申请日:2022-02-22
Applicant: 武汉工程大学 , 武汉逸锦科技有限公司
IPC: G06F40/56 , G06F40/242 , G06F16/33 , G06V30/142 , G06V30/413 , G06V10/82
Abstract: 本申请涉及一种阅读交互装置、方法、计算机设备和阅读笔,属于图像处理技术领域。装置包括图像采集模块和雾端连接模块;图像采集模块,用于获取包括目标文字区域的图像;雾端连接模块,用于和外接雾端建立连接,通过外接雾端中的学习软件对包括目标文字区域的图像进行相应的处理;其中,外接雾端为存储有学习软件的平台,学习软件为基于自然语言处理技术的算法模型。本申请通过与外接雾端建立连接,可以利用外接雾端中的学习软件对获取的包括目标文字区域的图像进行相应的处理,不占用阅读交互装置自身的资源。学习软件为基于自然语言处理技术的算法模型,可具备不同的处理方式,使得本申请中阅读交互装置的应用场景更加丰富,用户体验感更好。
-
公开(公告)号:CN114219742A
公开(公告)日:2022-03-22
申请号:CN202111055117.6
申请日:2021-09-09
Applicant: 武汉工程大学 , 武汉逸锦科技有限公司
Abstract: 本发明提供了一种联合流形约束和FB‑GAN的人脸变形方法和系统,通过使用生成对抗神经网络设计出端到端的人脸图像拼接对抗网络FB‑GAN,实现了在人脸变形过程中生成高分辨率的人脸图像的功能。本发明通过人脸变形算法生成高分辨率的人脸图像,解决了传统变形中人脸嘴巴从闭合到张开所导致的嘴巴“扭曲”或“空洞”问题。本发明解决了人脸拼接问题中的颜色差异较大而导致的拼接效果较差的问题,提高了人脸生成图像的真实性。
-
公开(公告)号:CN117218641A
公开(公告)日:2023-12-12
申请号:CN202311235672.6
申请日:2023-09-25
Applicant: 武汉逸锦科技有限公司 , 武汉工程大学
IPC: G06V20/62 , G06V10/26 , G06V10/25 , G06V10/40 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种密集场景文本检测与识别方法,包括:获取公共数据集以及密集文本图像数据集;建立基于词长感知Transformer的深度学习网络模型,采用所述公共数据集对所述深度学习网络模型进行预训练,以生成初始识别模型;采用所述密集文本图像数据集对所述初始识别模型进行训练,以优化所述初始识别模型后,生成密集场景文本检测和识别协同模型;获取待识别密集场景文本图像,将所述待识别密集场景文本图像输入至所述密集场景文本检测和识别协同模型中,以得到识别结果。本发明解决了现有技术中密集场景文本检测与识别方法准确度低、容易出现漏检误检的技术问题。
-
公开(公告)号:CN114219742B
公开(公告)日:2025-02-18
申请号:CN202111055117.6
申请日:2021-09-09
Applicant: 武汉工程大学 , 武汉逸锦科技有限公司
IPC: G06T3/4038 , G06T3/4046 , G06T5/50 , G06T5/60 , G06T5/40 , G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明提供了一种联合流形约束和FB‑GAN的人脸变形方法和系统,通过使用生成对抗神经网络设计出端到端的人脸图像拼接对抗网络FB‑GAN,实现了在人脸变形过程中生成高分辨率的人脸图像的功能。本发明通过人脸变形算法生成高分辨率的人脸图像,解决了传统变形中人脸嘴巴从闭合到张开所导致的嘴巴“扭曲”或“空洞”问题。本发明解决了人脸拼接问题中的颜色差异较大而导致的拼接效果较差的问题,提高了人脸生成图像的真实性。
-
公开(公告)号:CN114513681A
公开(公告)日:2022-05-17
申请号:CN202210088178.0
申请日:2022-01-25
Applicant: 武汉工程大学 , 武汉逸锦科技有限公司
IPC: H04N21/231 , H04N21/234
Abstract: 本申请涉及一种视频处理系统、方法、装置、电子设备和存储介质,属于软件监控技术领域。包括:边缘端中的前置服务单元用于获取应用场景设备端采集的初始视频数据,对初始视频数据进行目标对象识别操作,以提取包含目标对象的图像帧,并发送至算法服务单元;边缘端中的算法服务单元用于对于每帧包含目标对象的图像帧,根据该图像帧对应的当前应用场景,确定对应的对象提取模型,根据当前应用场景对应的对象提取模型提取图像帧中的目标对象,得到图像帧的目标数据;云端用于存储初始视频数据对应的目标数据。本申请具备高效率的图像处理能力,根据不同的应用场景加载不同的对象提取模型,并非一个应用场景对应一个视频处理系统,适用范围较广。
-
公开(公告)号:CN105389819A
公开(公告)日:2016-03-09
申请号:CN201510776198.7
申请日:2015-11-13
Applicant: 武汉工程大学
CPC classification number: G06T5/006 , G06T2207/10032
Abstract: 本发明公开了一种鲁棒的半标定下视图像极线校正方法及系统,该方法包括以下步骤:S1、获取无人飞行器每一成像时刻下视相机拍摄的图像,相机的内参数矩阵,以及无人飞行器的惯导系统提供的姿态参数,构建平行于地平面的虚拟成像环境;S2、对不同成像时刻的图像分别提取特征点,构建初始特征点对应集合;并根据该集合得到变换后的特征点对应集合;S3、构建概率表达模型,计算无人飞行器的航向与正北方向的夹角;S4、计算单应变换矩阵,并根据该矩阵,对每一成像时刻的图像进行极线校正。本发明能够快速的完成校正,并且能够得到精度较高的校正图像,对于无人机辅助导航等应用领域具有重要的指导意义。
-
-
-
-
-
-
-
-