-
公开(公告)号:CN115409812A
公开(公告)日:2022-11-29
申请号:CN202211067591.5
申请日:2022-09-01
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04
Abstract: 本发明公开了一种基于融合时间注意机制的CT图像自动分类方法,首先构建基于时间注意机制的3D CNN分类网络,该网络利用时间注意力层自动学习到CT图像中的空间和时间信息,以更精确地进行分类嵌入的表示,提高分类准确度;随后构建一种噪声校正网络,该网络通过给真实标签加上一个参数未知的噪声信道,并利用神经网络学习噪声分布参数,可以有效识别出分类干扰噪声,从而缓解数据分布的多中心效应,在辅助提高网络分类精度的同时,使得模型具有更高的泛化性和鲁棒性,也具有更高的推广性。
-
公开(公告)号:CN114936601A
公开(公告)日:2022-08-23
申请号:CN202210593321.1
申请日:2022-05-27
Applicant: 杭州电子科技大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于加权特征融合的多传感器信息融合方法。首先建立了一种三层树状结构的多层级融合识别框架,其中最高层为最终目标识别结果,中间层为多个传感器数据采集平台,最低层是从各类传感器中提取得到的基本特征集。首先,利用层次分析法结合模糊信息理论确定多层级融合识别框架中相邻层间的相对权值,再由权值路径得到最低层基本特征对最高层的相对权值,最后利用D‑S证据理论组合加权特征信息以得到最终目标识别结果。本发明结合了模糊信息理论的层次分析法,利用多冲突衡量标准与模糊信息理论,定量计算证据层和标准层的两两比较矩阵,通过求解两两比较矩阵计算各层权值,进而得出各证据的权值。
-
公开(公告)号:CN115984308A
公开(公告)日:2023-04-18
申请号:CN202310037807.1
申请日:2023-01-10
Applicant: 杭州电子科技大学
IPC: G06T7/11 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及基于平均教师模型的半监督肺叶分割方法,采用了一种平均教师模型的半监督肺叶分割框架,并利用全局和局部对比损失对主干网络进行总体预训练。预训练的编码器和解码块提取了未标记数据中全局和局部的有用信息表示,并将预训练的U‑Net结构作为平均教师模型中教师网络和学生网络的主干。将经过数据增强处理的无标签数据送入教师网络得到对应的伪标签,利用伪标签训练学生网络以使学生模型和教师模型在语义层面趋于一致,同时,使用学生网络中的指数移动平均(EMA)权重来更新教师模型的网络参数,以此方式来优化肺叶分割网络的性能,来生成准确率更高的肺叶掩膜。
-
公开(公告)号:CN114612729B
公开(公告)日:2025-01-07
申请号:CN202210340575.2
申请日:2022-03-31
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于SAR图像的图像分类模型训练方法及装置,针对同一目标以相同角度获取多源图像,包括SAR、红外、可见光图像及对应的图像分类数据,通过训练基于红外和可见光图像的辅助神经网络获得的“红外‑可见光特征”,来辅助训练基于SAR图像的图像分类模型,其中,红外、可见光图像仅在训练过程中作为辅助模态,而实际应用中网络的输入为SAR单模态图像。本发明使用多任务学习的方法,提高了基于SAR图像的图像分类的精度,提供了一种解决单模态SAR图像在实际应用中局限性的方法。
-
公开(公告)号:CN116110018A
公开(公告)日:2023-05-12
申请号:CN202310117431.5
申请日:2023-01-20
Applicant: 杭州电子科技大学
IPC: G06V20/56 , G06V20/59 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于多维度跨模态信息交互的驾驶员意图预测方法,应用于智能驾驶领域。本发明设计了一个高效的视频分类网络来分别提取车内、外视频序列的通道‑时序特征,在特征提取过程中,本发明通过设计一种跨模态通道‑空间加权机制来实现车内、外视频序列特征间的信息交互,此外,本发明还提出一种对比学习模块来迫使两个特征提取网络学习到车内、外视频序列向量表示的结构知识。然后,通过基于残差结构和GRU分类器的预测模块获得初步预测结果,接着利用GPS信息校正初步预测结果来得到最终预测结果。
-
公开(公告)号:CN115049012A
公开(公告)日:2022-09-13
申请号:CN202210773608.2
申请日:2022-07-01
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于全局和局部信息联合的时序数据分类方法。该方法首先通过强化学习的方式从每个时期中选择信息量最丰富的数据,合并成输入样本。然后建立局部信息模块和全局信息模块,并加入ResNet18网络中原有的残差块中,从而实现对时序数据同时期的特征提取与不同时期的特征交互,最终完成对时序信息的分类。本方法采用局部信息模块,能够加强样本本身在时间上的联系,全局信息模块可以加强该时序数据在不同时间上的交互。相对于一般的3D卷积网络,减少了计算量,提高分类的效率和精确度,对于具有时序关系的数据分类任务,有一定的参考价值。
-
公开(公告)号:CN115878983A
公开(公告)日:2023-03-31
申请号:CN202211597492.8
申请日:2022-12-12
Applicant: 杭州电子科技大学
IPC: G06F18/213 , G06F18/25 , G06F17/16 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于多层次交互融合的多模态数据场景识别方法。使用自动驾驶场景下车载传感器收集的视频数据和车载数据,分别提取三种单模态特征,包括基于双阶段注意力机制的多示例学习获取视频中2D级别的特征;通过多层时空注意力网络提取出场景视频中的3D时空特征,同时加入了车载信息特征向量一起训练,进行交互;以及对车载信息特征向量进行训练。完成三个模态的特征提取后,进行相似度损失的计算,在训练过程中最大化三个模态的相似部分,并基于多层自注意力网络对三个模态的特征进行交互,最后进行分类操作。该方法能利用已有的视频和车载信息交互,补充信息,提高识别场景识别速度和精度。
-
公开(公告)号:CN114937225A
公开(公告)日:2022-08-23
申请号:CN202210614670.7
申请日:2022-05-30
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于通道‑时间特征的行为识别方法,该方法构建了一个多模块block用于替换ResNet‑50网络第2~第5层中的block。所述多模块block包括通道注意力模块、长期时序模块、短期时序模块。其中,通道注意力模块与SE block结构相似,通过对特征通道间的相关性进行建模,强化重要的特征,使得网络就可以学习通过全局信息来有选择性的加强包含有用信息的特征并抑制无用特征;长期时序模块参考了STM模块,通过沿时间维度移动特征图来执行有效的时间建模,实现跨时域的信息交互;短期时序模块通过计算特征级的帧差信息,实现对局部运动信息的表征,增强对运动信息敏感特征。
-
公开(公告)号:CN114612729A
公开(公告)日:2022-06-10
申请号:CN202210340575.2
申请日:2022-03-31
Applicant: 杭州电子科技大学
Abstract: 本发明提供一种基于SAR图像的图像分类模型训练方法及装置,针对同一目标以相同角度获取多源图像,包括SAR、红外、可见光图像及对应的图像分类数据,通过训练基于红外和可见光图像的辅助神经网络获得的“红外‑可见光特征”,来辅助训练基于SAR图像的图像分类模型,其中,红外、可见光图像仅在训练过程中作为辅助模态,而实际应用中网络的输入为SAR单模态图像。本发明使用多任务学习的方法,提高了基于SAR图像的图像分类的精度,提供了一种解决单模态SAR图像在实际应用中局限性的方法。
-
-
-
-
-
-
-
-