-
公开(公告)号:CN116740286A
公开(公告)日:2023-09-12
申请号:CN202310782575.2
申请日:2023-06-29
Applicant: 杭州电子科技大学
Inventor: 颜成钢 , 任浩帆 , 李宗鹏 , 丁贵广 , 付莹 , 郭雨晨 , 赵思成 , 孙垚棋 , 朱尊杰 , 王帅 , 高宇涵 , 王鸿奎 , 赵治栋 , 殷海兵 , 张继勇 , 薛安克
IPC: G06T17/00 , G06T5/00 , G06T7/11 , G06T7/66 , G06V20/10 , G06V10/30 , G06V10/762 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的快速增量式室内语义建图方法,首先构造识别墙面、地板和天花板的主平面识别深度神经网络;对于增量式的RGBD序列,基于主平面识别深度神经网络获取序列的每一帧彩色图中的墙面、地板和天花板的掩膜;根据获取的掩膜进行快速的物体聚类后,通过相机内外参数,获得点云簇;计算聚类后物体的属性,构建图神经网络所需的图表示,通过图神经网络获取语义信息,从而实现语义建图。本发明无需提前获取完整的三维地图,在机器人运动的过程当中就可以获取语义信息,而且处理速度较快。
-
公开(公告)号:CN115861637A
公开(公告)日:2023-03-28
申请号:CN202211701856.2
申请日:2022-12-28
Applicant: 杭州电子科技大学
IPC: G06V10/42 , G06V10/44 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种基于双分支网络的显著目标检测方法。首先分别采用CNN和Tranformer两个分支作为模型的编码器,来提取不同分支的特征;再采用特征交互模块来分别对两个分支后三层提取的特征进行交互,来获得更加丰富的初始特征信息;然后通过特征融合模块来将两个分支相对应层的特征进行融合;再将融合后的特征送入到边缘补充模块中,来增强边缘信息;最后通过解码器来得到显著图。本发明通过特征交互模块得到了更丰富的全局多尺度特征。同时,为了解决不同分支之间特征的差异性,采用了特征融合模块,使两个分支的特征可以有效融合。而且,针对目前常见的边缘模糊问题,本发明通过边缘补充模块来增强特征的边缘信息。
-
公开(公告)号:CN115631810A
公开(公告)日:2023-01-20
申请号:CN202211274910.X
申请日:2022-10-18
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于流的图同构自回归分子生成方法。首先进行数据预处理;构建基于流的图同构自回归分子生成模;通过预处理后的数据对分子生成模型进行训练;最后通过训练好的分子生成模型完成分子生成。本发明针对分子生成问题,采取了基于流的自回归生成模型,通过多层感知机求出基分布和现实数据分布之间的可逆变换,从而在提高了模型的灵活性同时,因其迭代的采样过程,使得可以在节点和边的生成过程中引入价态检验,这大大提高了所生成分子的现实意义。采用了图神经网络表征能力达到上限的图同构神经网络GIN来进行分子图的表示学习,极大的提升了模型对于分子图结构的学习能力。
-
公开(公告)号:CN115565107A
公开(公告)日:2023-01-03
申请号:CN202211203700.1
申请日:2022-09-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于双流架构的视频显著性预测方法。首先提取视频帧和光流图中包含的时间和空间特征;通过注意力模块增强时间特征并将时间和空间特征融合;再使用时间解码器生成的掩膜图过滤时空特征;使用GRU模块获取视频帧之间的长期时空信息;最后使用空间解码器生成预测图。本发明通过使用一种新颖的双流架构更加有效地提取出光流图和视频帧中包含的时间和空间特征;通过使用注意力模块对不同尺度的时间特征进行增强处理,更加有效地融合了时间和空间特征;通过使用一种时间掩膜方法更加准确地定位出时空特征中显著对象的位置;通过使用GRU模块能够捕获到视频中更长的时空信息。
-
公开(公告)号:CN115511914A
公开(公告)日:2022-12-23
申请号:CN202211215389.2
申请日:2022-09-30
Applicant: 杭州电子科技大学
IPC: G06T7/246 , G06V10/762 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于YOLO算法和PID算法的鸟类摄影云台控制方法,首先准备包含各类鸟类的照片数据并进行标注,通过标注好的照片数据对YOLOv5网络模型进行训练,在现有摄影云台的主控芯片上加载训练好的网络模型;通过网络模型对图像进行检测有无鸟类。对比鸟类中心坐标和图像中心的坐标,若有偏差,则转动舵机,使得相机追踪鸟类,相机转动角度用PID算法来优化,并保存图像。本发明针对于特定的摄影环境和摄影对象,旨在帮助摄影师更好的追踪和捕捉鸟类,本发明在传统的云台控制算法上,融入了人工智能相关算法,在保证预测准确度的同时,也要充分考虑芯片性能以保证算法运行和算法推理运算速度。
-
公开(公告)号:CN115511747A
公开(公告)日:2022-12-23
申请号:CN202211203733.6
申请日:2022-09-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于像素域和频域信息损失的视频去压缩伪影方法。首先进行数据预处理,获取高质量及低质量的视频帧数据集,搭建视频增强网络模型;再训练低质量图像增强的网络模型;最后将低质量的视频帧输入模型得到高质量的视频帧。本发明通过在频域上进行计算梯度轮廓损失和像素域的密集残差连接配合,能使得低质量的视频帧输出菱角分明边缘清晰的视频帧。本发明方法同时在频域和像素域的联合操作大大提升了质量增强的效果。
-
公开(公告)号:CN115496186A
公开(公告)日:2022-12-20
申请号:CN202211201830.1
申请日:2022-09-29
Applicant: 杭州电子科技大学
IPC: G06N3/04 , G06N3/08 , G06Q40/02 , G06F16/901
Abstract: 本发明公开了一种基于图结构学习提升网络鲁棒性的优化方法,首先通过重构新的低秩且稀疏的邻接矩阵来学习到新的邻接矩阵S逼近中毒图的邻接矩阵,然后针对对抗性攻击连接节点并赋予明显的特征,通过保证图数据的特征平滑度来保护图数据不受攻击影响,获得训练图神经网络的总损失函数;最后进行GNN图神经网络的迭代学习得到最优的鲁棒性图神经网络。本发明有效的将对抗思想迁移到图数据来提升图神经网络的鲁棒性。本发明针对中毒图数据依旧保持良好的学习效率,在分类等各种任务上保持良好的效果。在各种对抗性攻击下都可以保持良好的整体鲁棒性,可以解决大部分的对抗性攻击。
-
公开(公告)号:CN115457600A
公开(公告)日:2022-12-09
申请号:CN202211277054.3
申请日:2022-10-18
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种多目标的行人重识别攻击方法。首先通过人体区域切割网络确定扰动图片可叠加的区域,再计算该区域内的平滑度,确定平滑度最大的点作为叠加区域的左上角;再初始化大尺寸攻击图,利用STN缩放为小尺寸攻击图,叠加到图片上;计算针对多目标攻击的多目标损失函数,利用梯度反向传播更新攻击图,得到多目标扰动图片;最后将得到的多目标扰动图片打印出来贴到衣服上,实现物理层面的攻击。相比单目标的攻击方法,本发明可以进行多目标攻击,攻击性能更强,攻击更多样;通过人体区域检测网络,以及平滑度最小方法,使得本方法攻击区域尽可能处于人体的衣物区域,使得物理攻击更容易开展。
-
公开(公告)号:CN108876897B
公开(公告)日:2022-10-18
申请号:CN201810361369.3
申请日:2018-04-20
Applicant: 杭州电子科技大学
Abstract: 本发明属于计算机视觉与计算机图形学相结合的领域。本发明公开了一种相机快速运动下的场景三维重建方法。本发明步骤如下:步骤1:预处理;步骤2:建立模糊模型;步骤3:相机姿态估计;步骤4:从深度相机采集的模糊深度图中提取出清晰深度图像,将清晰深度图像计算得到的三维点云模型与当前场景模型进行融合,获得新的场景模型。本发明利用相机模糊原理,建立快速运动下的相机运动模型,在进行相机姿态估计时,先利用图像信息估计出一个粗糙的相机姿态作为ICP的初始值,再利用ICP和深度图得到相对准确的相机姿态信息,最后利用能量函数优化该相机姿态信息。传统方法单纯使用ICP方法估计相机姿态,这在快速运动的情况下是无法实现的。
-
公开(公告)号:CN113536417A
公开(公告)日:2021-10-22
申请号:CN202110683663.8
申请日:2021-06-21
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于平面约束的室内场景模型补全方法。在稠密室内三维重建的基础上使用循环使用RANSAC方法进行三维平面的检测,通过平面检测结果,将室内环境分割为不同的平面区域和物体区域,然后利用物体区域中各mesh顶点的邻接关系将空间上彼此分离的物体分割开,然后分别在不同的平面区域和不同的物体模型上进行孔洞检测,分别完成孔洞补全任务,然后将逐个补全的结果放在同一个三维空间中,最终完成室内全场景的三维模型孔洞补全任务。本发明消除了不同物体上孔洞之间的干扰,极大的提高了物体模型的补全精度,提高了补全效果,在对场景中的平面模型进行补全时,能够在平面方程的约束下,实现更加鲁棒的平面补全效果。
-
-
-
-
-
-
-
-
-