-
公开(公告)号:CN119785031A
公开(公告)日:2025-04-08
申请号:CN202411971057.6
申请日:2024-12-30
Applicant: 哈尔滨工业大学
IPC: G06V10/26 , G06N3/0455 , G06N3/084 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于置信度约束平均教师模型的无源领域自适应眼底图像分割方法,所述方法包括如下步骤:步骤一、学生网络眼底视杯、视盘分割;步骤二、教师网络眼底视杯、视盘分割;步骤三、学生网络损失函数计算及参数更新;步骤四、动态EMA参数调整计算;步骤五、教师网络参数更新;步骤六、分布对齐JS损失函数计算。本发明将置信度约束引入到平均教师模型的更新机制中,并且引入JS散度在分布层面上对齐教师模型和学生模型的,从而增强伪标签的稳定性,以实现更高精度的眼底视盘、视杯分割。
-
公开(公告)号:CN115965652B
公开(公告)日:2024-09-03
申请号:CN202211224736.8
申请日:2022-10-09
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于四叉树胶囊的深度回归跟踪方法,所述方法包括如下步骤:一、给定当前帧的搜索区域,采用在ImageNet上预训练的VGG‑16网络的conv4‑3和conv5‑3两个特征层作为特征提取器分别提取底层和高层语义表示;二、通过四叉树胶囊模块构造空间胶囊;三、通过多光谱姿态矩阵注意力构造时空胶囊;四、时序胶囊的局部位移;五、将时序胶囊的姿态矩阵压平,并将它们传递给解码器进行解码。本发明利用搜索区域作为输入,提出利用四叉树胶囊架构构建目标与其上下文之间的时空关系。与现有基于胶囊网络的跟踪器相比,在鲁棒跟踪结果的同时,运行速度达到了43FPS,使得基于胶囊网络的跟踪器首次达到了实时处理。
-
公开(公告)号:CN118428479A
公开(公告)日:2024-08-02
申请号:CN202410631370.9
申请日:2024-05-21
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于实体对齐和跨模态推理的视觉文本问答方法,所述方法包括如下步骤:步骤一、提出VTQA任务;步骤二、构建VTQA数据集;步骤三、构建KECMRN模型;步骤四、利用训练集和验证集训练KECMRN模型;步骤五、利用测试开发集对训练好的KECMRN模型进行筛选,将测试集输入筛选后的最佳KECMRN模型中,得到问题答案。该方法为了更全面的评估,引入了一个新数据集,包含来自10,124对图文对的23,781个问题,这个数据集的任务要求模型对同一实体的多模态表示进行对齐,以实现图像和文本之间的多跳推理,并最终使用自然语言回答问题。
-
公开(公告)号:CN118261970A
公开(公告)日:2024-06-28
申请号:CN202410556228.2
申请日:2024-05-07
Applicant: 哈尔滨工业大学
IPC: G06T7/70 , G06N3/0464 , G06V10/764 , G06V10/80
Abstract: 本发明公开了一种基于单位点积注意力机制的跨视角地理定位方法,所述方法包括如下步骤:步骤一、提取不同视角的浅层特征图;步骤二、使用单位点积注意力模块增强不同视角的浅层特征图;步骤三、提取不同视角的浅层特征图;步骤四、使用单位点积注意力模块增强不同视角的深层特征图;步骤五、提取不同视角图像的视角不变图像级特征;步骤六、通过地理位置分类代理学习任务优化模型提取视角不变图像级特征的能力。较现有的基于普通卷积神经网络的跨视角地理定位方法,跨视角地理定位的准确度取得了显著提高,展现了良好的定位鲁棒性。
-
公开(公告)号:CN113971686B
公开(公告)日:2024-05-31
申请号:CN202111250528.0
申请日:2021-10-26
Applicant: 哈尔滨工业大学
IPC: G06T7/246 , G06T5/77 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于背景修复和胶囊网络的目标跟踪方法,所述方法包括如下步骤:一、构建背景胶囊表示;二、构建目标胶囊;三、设计背景‑目标胶囊路由算法,获得背景‑目标胶囊表示;四、将背景‑目标路由胶囊的大小调整为36×36×64,然后通过3个反卷积操作将这些特征进行放大处理,最后得到与输入大小相同的288×288×1的背景响应图,通过对其进行取反操作,得到目标的响应图;五、将背景胶囊表示通过一个反卷积层调整到36×36×64,之后通过3个反卷积层,每层对应的核大小为3×3,逐步将36×36×64大小的特征放大到288×288×3,生成3通道的背景修复图像。本发明将目标跟踪的关注点从目标自身转移至对目标与背景差异的刻画,规避了单一外观模型无法应对目标各种外观变化的缺陷。
-
公开(公告)号:CN109829391B
公开(公告)日:2023-04-07
申请号:CN201910024728.0
申请日:2019-01-10
Applicant: 哈尔滨工业大学
IPC: G06V20/00 , G06V10/46 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094 , G06N3/09
Abstract: 本发明公开了一种基于级联卷积网络和对抗学习的显著性目标检测方法,所述方法包括如下步骤:一、设计全局显著性估计器E;二、设计局部显著性细化器R;三、将全局显著性估计器E和局部显著性细化器R组合成为基于级联卷积神经网络的产生器G,用于生成显著性图;四、优化产生器G;五、设计对抗学习判别器D来区分真实的显著性图和产生器G生成的预测显著性图;六、产生器G和对抗学习判别器D遵循CGAN的策略,以一种完全端到端的方式进行训练,使产生器G更好地了解显著性物体结构信息,得到好的显著性检测结果。本发明通过对抗学习隐式学习这些结构信息,可以很好的进行显著性目标检测,并在多个数据库上取得了最好的结果。
-
公开(公告)号:CN110570450B
公开(公告)日:2023-03-24
申请号:CN201910882861.X
申请日:2019-09-18
Applicant: 哈尔滨工业大学
IPC: G06T7/207
Abstract: 本发明公开了一种基于级联的上下文感知框架的目标跟踪方法,所述方法提出了一个基于两个网络的级联的上下文感知框架,其包括两个子网络:一个基于图像的上下文感知网络ICANet和一个基于图像块的上下文感知网络PCANet。该框架渐近地建模了各种目标与其上下文信息之间的各种变化。第一个网络关注的是目标与其上下文之间最具判别力的信息以及目标粗略的结构,第二个网络关注的是目标自身的细致的结构信息。根据这两个网络的输出—最终的上下文感知图,可以灵活地生成目标的定位框,有效地区分目标与其周围干扰物等背景信息。本发明所获得的FCA map能够灵活地嵌入到多种跟踪框架中。
-
公开(公告)号:CN109829391A
公开(公告)日:2019-05-31
申请号:CN201910024728.0
申请日:2019-01-10
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于级联卷积网络和对抗学习的显著性目标检测方法,所述方法包括如下步骤:一、设计全局显著性估计器E;二、设计局部显著性细化器R;三、将全局显著性估计器E和局部显著性细化器R组合成为基于级联卷积神经网络的产生器G,用于生成显著性图;四、优化产生器G;五、设计对抗学习判别器D来区分真实的显著性图和产生器G生成的预测显著性图;六、产生器G和对抗学习判别器D遵循CGAN的策略,以一种完全端到端的方式进行训练,使产生器G更好地了解显著性物体结构信息,得到好的显著性检测结果。本发明通过对抗学习隐式学习这些结构信息,可以很好的进行显著性目标检测,并在多个数据库上取得了最好的结果。
-
公开(公告)号:CN102389317B
公开(公告)日:2016-02-10
申请号:CN201110196411.9
申请日:2011-07-14
Applicant: 哈尔滨工业大学
IPC: A61B5/22
Abstract: 本发明提供一种实时击键压力采集系统。它是由压力传感器和接口电路组成的,压力传感器连接接口电路,压力传感器使用四个应变片组成一个惠斯通全桥电路,将电阻的变化转换为电压的变化再进行采集;压力传感器安装在标准键盘的底部,包括键帽和回弹装置,接口电路包括放大器、多路复选器、模数转换器和主控制器,模数转换器将选通的模拟信号数字化,主控制器负责整个硬件电路的控制及与计算机通信,采用89SC52作为主控单元,其内置的串口控制器可以方便的与计算机进行通信。本发明在不改变用户接口的情况下实时采集击键压力,使用普通键盘作为用户接口,克服了使用特殊键盘容易造成用户击键习惯改变的缺点,这对于身份识别意义重大。
-
公开(公告)号:CN103793705A
公开(公告)日:2014-05-14
申请号:CN201410087806.9
申请日:2014-03-11
Applicant: 哈尔滨工业大学
IPC: G06K9/00
Abstract: 本发明提供了一种基于迭代随机抽样一致性算法和局部掌纹描述符的非接触掌纹认证方法,分为注册和认证两个阶段。本发明使用基于圆形Gabor滤波器的掌纹ROI图像预处理方法;在预处理后的掌纹ROI图像上提取SIFT特征并进行匹配,得到匹配SIFT特征点;使用迭代随机抽样一致性算法去除错误匹配的SIFT特征点;使用局部掌纹描述符进一步去除错误匹配的SIFT特征点;将最终剩余的SIFT特征点的数目作为匹配度,进行决策。本发明提高了非接触式掌纹识别的精度。
-
-
-
-
-
-
-
-
-