-
公开(公告)号:CN105205488A
公开(公告)日:2015-12-30
申请号:CN201510407779.3
申请日:2015-07-13
Applicant: 西北工业大学
IPC: G06K9/46
CPC classification number: G06K9/4604 , G06K9/4671
Abstract: 本发明提供了一种基于Harris角点和笔画宽度的文字区域检测方法,该方法主要包括边缘增强的Harris角点检测,依据笔画宽度筛选候选区域以及基于文字颜色的区域膨胀三大部分,本发明通过对角点检测得到的文字区域后进行连通区域分析,去掉不符合文字行特征的响应区域,可显著提高角点检测图像中文字区域的准确率,较单一基于边缘特征的文字检测方法,可提高图像中的文字检测的召回率,较单一基于连通区域的文字检测方法,可获得更高的检测效率,本发明较单一的基于边缘特征和基于连通区域的文字检测方法都具有优势。
-
-
公开(公告)号:CN118196298A
公开(公告)日:2024-06-14
申请号:CN202410393330.5
申请日:2024-04-02
Applicant: 西北工业大学
IPC: G06T17/00 , G06T15/20 , G06N3/0464
Abstract: 本发明涉及三维重建领域,具体涉及一种无先验位姿输入的三维重建方法,包括以下步骤:S1、基于单目估计网络模型估计预处理多视角图像的深度图像和法向图像;S2、在无先验位姿输入的情况下,多视角图像基于多层感知器网络构建无位姿神经辐射场并经过体渲染预测三维模型颜色信息及对应输入图像视角下的深度图像和法向图像;S3、在构建无位姿神经辐射场的同时,利用相邻帧间提取几何信息优化相对位姿,之后经过体渲染,输出无畸变深度图像和无畸变法向图像得到三维模型几何信息;S4、通过等值面算法,将得到三维模型几何信息和颜色信息的无位姿神经辐射场转化为三维网格模型;本发明提高重建的准确性和鲁棒性,并能够处理更加复杂的场景和数据。
-
公开(公告)号:CN116597274A
公开(公告)日:2023-08-15
申请号:CN202310482722.4
申请日:2023-05-02
Applicant: 西北工业大学
IPC: G06V10/82 , G06V10/40 , G06N3/0455 , G06N3/088 , G06N3/045 , G06N3/0475 , G06N3/094 , G06V10/774
Abstract: 本发明涉及一种无监督双向变分自编码本质图像分解网络、方法及应用,属于图像识别技术领域。该网络使用并行编解码策略,即使用两套相同但互不关联的由编码器和解码器组成的深度学习网络进行反射图或光照图的图像生成。编码器和解码器由包含下采样或上采样的网络模块组成;在编码器和解码器间特征经编码器得到潜在向量分布的均值和标准差,再从中采样到符合特定分布的特征。该方法提出了引入了变分自编码的思想,对编解码过程中的中间向量进行约束,提高模型的鲁棒性;同时提出了一种非对称生成对抗框架,提高了模型的收敛性能。
-
公开(公告)号:CN116597273A
公开(公告)日:2023-08-15
申请号:CN202310482721.X
申请日:2023-05-02
Applicant: 西北工业大学
IPC: G06V10/82 , G06V10/774 , G06V10/40 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及一种自注意力的多尺度编解码本质图像分解网络、方法及应用,属于图像识别技术领域。该网络使用并行编解码策略,即使用两套相同但互不关联的编码器和解码器进行反射图和光照图的图像生成。每个网络都包含编码器、解码器和跳连接三个部分。其中编码器和解码器都由多个自注意力模块和下采样或上采样模块组成。该方法提出的自适应窗口自注意力可根据图像内容自适应调整窗口,以强化网络对不同类型特征的关注并降低模型的资源占用;通道增强自注意力模块,则通过在不同维度间展开自注意力计算来增强特征图中的有效信息。
-
公开(公告)号:CN116188791A
公开(公告)日:2023-05-30
申请号:CN202310136169.9
申请日:2023-02-20
Applicant: 西北工业大学
IPC: G06V10/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/08
Abstract: 本发明涉及一种基于双边特征金字塔网络与多尺度鉴别的本质图像分解方法,将两个并行的生成对抗网络作为主体网络,分别对反射图和光照图进行重构。针对生成网络,提出了局部分频特征融合的策略,分别实现对高频反射特征和低频光照特征的选择和保留。同时,在鉴别器中加入了多尺度的自适应组合模块,对多尺度特征的贡献进行自适应评估,强化鉴别效果并提升生成效果。本发明方法在多种数据集上都表现优异,在MPI‑Sintel数据集中,本发明相比其他方法的最优结果的重构均方误差降低了13.26%;在ShapeNet数据集中,本发明相比其他方法的最优结果的重构均方误差降低了26.09%。
-
公开(公告)号:CN111259831B
公开(公告)日:2023-03-24
申请号:CN202010063711.9
申请日:2020-01-20
Applicant: 西北工业大学
IPC: G06V40/40 , G06V40/16 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明提供了一种基于重组颜色空间的虚假人脸判别方法,根据2D图像选择不同颜色空间中对虚假人脸检测最有效的颜色通道构成重组颜色空间,然后通过神经网络训练权重矩阵确定重组颜色空间的颜色通道的构成比重,通过分类网络完成虚假人脸判别。本发明不依赖图像深度信息,相较3D图像方法降低设备要求和部署成本,相较2D图像方法判别效果好,本发明在普通2D摄像头的支持下运行,降低了算法的部署成本。
-
公开(公告)号:CN114881852A
公开(公告)日:2022-08-09
申请号:CN202210229298.8
申请日:2022-03-09
Applicant: 西北工业大学
Abstract: 基于去噪和超分辨率重构融合的攻击图像防御方法。针对智能攻击图像防御任务,本文提出采用去噪和超分辨率重构融合的策略实现对攻击噪声的多阶段消除方法。由于深度智能网络存在着一定的缺陷,所以攻击者可设计特定的噪声叠加于输入图像之上,诱导深度网络的识别结果错误。因而,消除攻击图像中的攻击噪声,是实现攻击防御的有效途径之一。首先,本文采用多级嵌套的编解码网络,对图像中的噪声进行粗清洗。由于噪声主要是高频信息,因而多尺度编解码网络可以利用低频信息引导高频信息的重构,进而实现对高频噪声的消除。然后,本文使用超分辨率重构网络对噪声进行精清洗,通过在超分重构过程中注入高频分量,破坏残留的对抗噪声的分布。本算法有效地结合了自编码器去噪和超分辨率重构来进行对抗防御。在实验中,本文提出的样本清洗防御算法在自制的卫星对抗样本数据集上取得了优异的防御效果。样本清洗之后,攻击噪声完全被清除,在EfficientNet网络的识别中准确率提升了42.67%。
-
公开(公告)号:CN109448131B
公开(公告)日:2022-07-26
申请号:CN201811243690.8
申请日:2018-10-24
Applicant: 西北工业大学
Abstract: 本发明提供了一种基于Kinect的虚拟钢琴弹奏系统的构建方法,利用Kinect设备完成场景的三维重建,在场景中在合适的平面上选择创建虚拟键盘的区域,产生虚拟琴键,进行琴键按压检测后,设置对应音符播放,即可实现弹奏虚拟钢琴的功能。本发明作为人和机器的交互方式,简单便捷的虚拟键盘,可以扩展到智能家居、游戏及机器人等领域;采用OpenGL库用作显示,并且结合了指尖位置的值来判断琴键的状态,提高了琴键弹奏的准确度,能够带来良好的用户体验。实现虚拟钢琴时,建立了三维立体模型,使得画面效果更有立体感,满足人们的沉浸式的体验。
-
公开(公告)号:CN114612727A
公开(公告)日:2022-06-10
申请号:CN202210290919.3
申请日:2022-03-23
Applicant: 西北工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/46 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 针对本质图像分解任务,本发明提出了一种并行局部分频选择的重构方法,可实现对反射图和光照图的准确重构。本质图像分解是一个欠约束问题。基于编解码网络的本质图像重构提供了一个有效的解决方案,但该方案的结果仍存在不足,因此,需要对各个频段的信息做更加精准的选择才能获得更加准确的分解结果。本发明提出的网络结构将两个并行的生成对抗网络作为主体网络,分别对反射图和光照图进行重构。针对生成网络,本发明提出了局部分频特征融合的策略,分别实现对高频反射特征和低频光照特征的选择和保留。同时,本发明在鉴别器中加入了多尺度的自适应组合模块,对多尺度特征的贡献进行自适应评估,强化鉴别效果并提升生成效果。进一步,本发明构建了多种损失函数来约束生成结果并促进网络的训练。本发明所提算法在多种数据集上都表现优异。在MPI‑Sintel数据集中,本发明相比其他方法的最优结果的重构均方误差降低了13.26%;在ShapeNet数据集中,本发明相比其他方法的最优结果的重构均方误差降低了26.09%。
-
-
-
-
-
-
-
-
-