-
公开(公告)号:CN106780614B
公开(公告)日:2019-09-24
申请号:CN201611036768.X
申请日:2016-11-23
Applicant: 湖北工业大学
Abstract: 本发明公开了一种基于多通道图像处理的海上装置自标定方法,属于海上装置的各个系统精确定位技术领域。本发明的自标定方法包括如下步骤:(1)第一次捕获目标信息;(2)第二次捕获目标信息;(3)主控机计算ki和θi;(4)调整第i个通道的架位信息;(5)完成海上装置的自标定。本发明将目标从北极星拓展到可被镜头捕捉的恒星或太阳,采用图像目标识别技术和目标质心自动获取算法,且无需借助标定板,只需要保证相机在标定过程中使目标位于十字准星附近即可,实现调整所有通道零点与参考通道一致。本发明的自标定方法对校标环境要求宽松,且标定过程更加方便快捷。
-
公开(公告)号:CN110084862A
公开(公告)日:2019-08-02
申请号:CN201910271763.2
申请日:2019-04-04
Applicant: 湖北工业大学
IPC: G06T9/00
Abstract: 本发明公开了一种基于多尺度小波变换与深度学习的图像压缩感知算法,包括图像采集阶段,利用卷积层采样,得到的采样向量;初始重建阶段,采用Reshape操作初始重建向量中每1×1×B2重排为B×B的图像块;深度重建阶段,采用4个残差块来深度重建图像,通过中的初始重建图像块向量作为输入,输出大小为的深度重建图像;在得到深度重建图像块后,将图像块重排,最终得到重建图像,本发明在采样阶段,用卷积神经网络进行采样,提高采样效率;在重建端,利用卷积神经网络进行初始重建,进而利用残差网进行深度重建,并且本发明使用多个网络进行重建,显著提高重建性能;使用残差网在增加网络深度的同时,依然能保持高效的训练效果,进而获得更优的重建效果。
-
公开(公告)号:CN109262607A
公开(公告)日:2019-01-25
申请号:CN201810929256.9
申请日:2018-08-15
Applicant: 武汉华安科技股份有限公司 , 湖北工业大学
IPC: B25J9/16
Abstract: 本发明涉及一种机器人坐标系转换方法,S1:在用户坐标系与机器人世界坐标系的公共空间中,寻找公共点,并分别读取该公共点在用户坐标系和机器人坐标系中的位置;S2:找出用户坐标系与机器人世界坐标系之间的转换关系;S3:将S1获得的公共点位置坐标带入S2中的转换关系,通过最小二程法可确定步骤2中转换关系式。本发明提出一种机器人坐标系转换方法,极大简化了在用户坐标系与机器人世界坐标系之间的转换问题,该转换方法能直接从用户坐标系转换到机器人世界坐标系,计算简便,流程清晰。
-
公开(公告)号:CN108537999A
公开(公告)日:2018-09-14
申请号:CN201810505339.5
申请日:2018-05-24
Applicant: 湖北工业大学
IPC: G08B7/06
Abstract: 本发明公开了一种八路竞赛抢答器,所述控制电路连接抢答电路和计时电路:抢答电路:可供八名选手同时使用,当选手选手按动按钮,会将最先抢到的选手编号进行锁存,并在屏幕上显示;计时电路:当主持人启动“开始”键后,定时器进行减计时,参赛选手在设定的时间内进行抢答,抢答有效;如果定时时间已到,无人抢答,则抢答无效。与传统抢答器相比,本发明中采用74LS148八路锁存器的功能特点,用74LS148和其他常用的74LS系列数字集成电路,大大降低了生产成本。
-
公开(公告)号:CN107169504A
公开(公告)日:2017-09-15
申请号:CN201710200172.7
申请日:2017-03-30
Applicant: 湖北工业大学
CPC classification number: G06K9/6218 , G06K9/6273 , G06K2209/01 , G06N3/0454 , G06N3/084
Abstract: 本发明公开一种基于扩展非线性核残差网络的手写字符识别方法,在利用深度网络的结构特点上,提供一种新型深度学习方法—基于扩展非线性核残差网络算法。并将该深度学习算法应用在手写字符识别中,提出基于扩展非线性核残差网络的手写字符识别方法。该方法能深度地描述样本数据和期望数据的相关性,能高效的从原始数据中自动地学习数字图像特征;其次,该方法引入了合适的类内无监督聚类算法,克服了深度学习网络在手写字符识别领域现有的技术不足。本发明简单且易于实现,提升手写字符识别性能的同时,也提高了网络的训练效率。
-
公开(公告)号:CN114048770B
公开(公告)日:2024-07-26
申请号:CN202111315681.7
申请日:2021-11-08
Applicant: 湖北工业大学
IPC: G10L25/51 , G06F18/241 , G10L25/30 , G10L25/18 , G06F18/10 , G06F18/213 , G06F18/24 , G06N3/0464 , G06N3/09
Abstract: 本发明属于数字音频信号篡改检测技术领域,公开了一种面向数字音频删除和插入篡改操作自动检测方法及系统,利用训练好的电网频率的通用背景模型,提取每个数字音频信号的电网频率频谱特征超矢量;将所提取的电网频率频谱特征超矢量输入由注意力机制和残差网络构成的深度表示学习网络进行浅层特征的学习;将训练好的浅层特征输入到分类网络中,判断是否经过删除或插入的篡改。本发明采用提取电网频率频谱特征超矢量,并建立深度神经网络训练所提取的特征;本发明不仅实现了篡改检测的自动化,还将深度神经网络很好的应用于篡改检测,并且取得很好的效果。本发明具有更高的准确率和较好的鲁棒性。
-
公开(公告)号:CN113568727B
公开(公告)日:2024-05-10
申请号:CN202110835323.2
申请日:2021-07-23
Applicant: 湖北工业大学
Abstract: 本发明提供了一种基于深度强化学习的移动边缘计算任务分配方法,旨在将深度强化学习策略引入到移动边缘计算任务分配,以期实现移动边缘计算任务的智能分配。首先,考虑到用户设备的计算能力和能量容量有限,本专利提出多边缘云协作移动边缘计算系统模型。其次,通过联合设计多边缘云的计算任务分配和计算资源管理,建立延迟和能量消耗的总和最小化的任务分配优化问题模型。再次,为了解决上述非凸优化任务分配问题,将移动边缘计算任务分配问题建模为马尔可夫决策过程。最后,针对上述马尔可夫决策过程中高维连续动作空间特点,提出双延迟深度确定性策略梯度算法,以获得多边缘云的计算任务分配和计算资源管理的近似最优联合策略。
-
公开(公告)号:CN110796010B
公开(公告)日:2023-06-06
申请号:CN201910931461.3
申请日:2019-09-29
Applicant: 湖北工业大学
Abstract: 本发明公开了一种结合光流法和卡尔曼滤波的视频稳像方法,首先在预稳定阶段,通过光流法跟踪视频帧的最小特征值特征点,由此求解出每个视频帧的2D仿射变换矩阵,并将其作用于下一步输入视频的帧,从而将最终生成的裁剪视频作为预稳定阶段的输出。然后对预稳定视频帧进行Shi‑Tomasi角点检测,并对角点进行LK角点跟踪;随后利用RANSAC算法估计全局运动;再使用卡尔曼滤波器对得到的运动参数进行滤波,以达到平滑的目的;最后由原始相机路径与平滑路径的关系进行运动补偿,从而得到稳定视频;本发明采用光流法预稳定视频,使得视频内部运动减小,使得运动效果更好;本发明采用卡尔曼滤波器平滑相机路径,使得内部运动路径更加平滑。从而使得抖动视频更加稳定。
-
公开(公告)号:CN112151040B
公开(公告)日:2023-04-28
申请号:CN202011035890.1
申请日:2020-09-27
Applicant: 湖北工业大学
Abstract: 本发明涉及一种基于端到端联合优化及决策的鲁棒性说话人识别方法,采用卷积网络对语音信号进行特征提取和后端分类,旨在将原始的音频信号输入决策分析模型后直接输出识别结果,省略中间步骤,实现完全自动化的效果。其中使用参数化带通滤波器完成特征提取。后端分类决策则使用基于自注意力机制的深度残差网络,目的是更有效利用声学特征的深层次信息。本发明的说话人识别方法在背景噪声的环境下能够有效提升系统的识别性能,在降低噪声对系统性能影响、提高系统噪声鲁棒性的同时,优化系统结构,提高了相应说话人识别产品的竞争力。
-
公开(公告)号:CN111062899B
公开(公告)日:2023-02-17
申请号:CN201911047213.9
申请日:2019-10-30
Applicant: 湖北工业大学
IPC: G06T5/50 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及基于引导的生成对抗网络的眨眼视频生成方法。本发明首先利用卷积神经网络模型,通过闭眼识别定位算法来定位眼睛位置并标记,然后根据要处理的图像数据规模,设定生成对抗网络的生成器网络G和判别网络D的各项参数,再结合引导参考图片和生成网络生成初始目标图片,通过构建的损失函数和目标函数计算,完成判别器和生成网络的迭代训练。最后将测试集中的图片及其引导参考图片作为网络模型的输入,以睁眼图片为原图片,闭眼图片为相对应的引导图片,经过视频合成处理模块后得到最终的眨眼视频,眨眼频率可根据需要进行适当改变。
-
-
-
-
-
-
-
-
-