-
公开(公告)号:CN112331232A
公开(公告)日:2021-02-05
申请号:CN202011228473.9
申请日:2020-11-06
Applicant: 杭州电子科技大学
IPC: G10L25/63 , G10L21/0208 , G10L21/0232 , G10L25/03 , G10L25/18 , G10L25/30 , G10L25/45
Abstract: 本发明公开了一种结合CGAN谱图去噪和双边滤波谱图增强的语音情感识别方法,包括:S1、获取干净语谱图以及加噪语谱图;S2、将干净语谱图和加噪语谱图输入基于矩阵距离的条件生成对抗网络进行训练,得到去噪模型;S3、利用去噪模型对加噪语谱图进行去噪处理,分别进行两个不同尺度的双边滤波,得到低、高尺度滤波图,低、高尺度滤波图相差再乘以增强系数,然后与低尺度滤波图相加,得到细节增强的语谱图;S4、将细节增强的语谱图输入卷积神经网络模型中进行分类,得到分类模型;S5、待识别语音的语谱图经过步骤S3中对语谱图的处理,得到的细节增强的语谱图输入分类模型,得到语音情感分类结果。本发明有效实现语音情感的识别。
-
公开(公告)号:CN110136202A
公开(公告)日:2019-08-16
申请号:CN201910422933.2
申请日:2019-05-21
Applicant: 杭州电子科技大学
Abstract: 本发明提供一种基于SSD与双摄像头的多目标识别与定位方法,包括:基于张氏标定法的相机标定,利用内参使用EPnP算法和Levenberg-Marquardt算法计算得到精确相机位姿;利用深度学习目标检测框架SSD训练多目标检测模型,可以精准识别双摄像头视线内的多目标;利用SIFT特征把左右摄像机检测出的目标匹配,根据得到的相机位姿,求解目标在现实世界中的位置,实现目标的定位。本发明在室内定位导航中利用深度学习训练模型对多目标进行检测,识别的目标可以包括但不限于行人、狗、车等;既能够实现双摄像头在远距离情况下的定位,又利用了深度学习识别目标的鲁棒性,实现双摄像头多目标快速识别和定位。
-
公开(公告)号:CN109920111A
公开(公告)日:2019-06-21
申请号:CN201910163121.0
申请日:2019-03-05
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种人脸识别和步态识别融合的门禁系统,包括步态采集装置、人脸采集装置、步态数据库、人脸数据库、步态匹配模块、人脸匹配模块、特征融合模块、中央控制器、电源模块、电脑记录仪、门禁控制器和警报器,电源模块、电脑记录仪、门禁控制器、警报器分别连接中央控制器,步态采集装置和步态数据库都连接步态匹配模块,人脸采集装置和人脸数据库都连接人脸匹配模块,步态匹配模块和人脸匹配模块都连接特征融合模块。本系统采用特征融合的方式进行身份识别,鲁棒性好,识别率高,电脑记录仪实时记录通过和未通过门禁的数据,整个系统管理方便,安全高效。
-
公开(公告)号:CN109165735A
公开(公告)日:2019-01-08
申请号:CN201810762313.9
申请日:2018-07-12
Applicant: 杭州电子科技大学
IPC: G06N3/08
Abstract: 本发明公开了一种基于生成对抗网络与自适应比例生成新样本的方法,包括以下步骤:S1,在输入样本上直接添加由生成对抗网络生成的与输入样本分布接近的噪声;S2根据样本方差构造自适应比例,将输入样本与生成对抗网络生成的噪声以该比例进行融合生成新样本,新样本根据自适应比例调节噪声与输入样本比重;S3通过像素相加的操作为新样本补充原样本信息,生成有益于提高DNN检测率的最终样本。采用本方法提高了DNN的准确率,成本相对较小的,复杂度也更低。
-
公开(公告)号:CN114898158B
公开(公告)日:2025-05-23
申请号:CN202210569646.6
申请日:2022-05-24
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V20/54 , G06V10/74 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于多尺度注意力耦合机制的小样本交通异常图像采集方法及系统,本发明方法包括步骤:S1.将早先布置的摄像头中收集的交通异常情形图像打上标签作为有标签数据集,并进一步划分训练集和测试集;S2.对样本数据进行数据处理并构造情景任务,从训练集中随机采样少量样本作为支持集样本和一定量同类样本作为查询样本图像;S3.利用骨干网络对每个情景任务中的图像进行特征提取,并获取多尺度输入特征;S4.将两个不同层次注意力结合,形成特征多域层次结构;S5.将不同尺度度量结果加权聚合,根据最终的支持集和查询集样本间的度量分数实现影像分类;S6.利用损失函数进行端到端训练;S7.进行测试保留最优训练权重;S8.模型部署和图像采集。
-
公开(公告)号:CN119961909A
公开(公告)日:2025-05-09
申请号:CN202510049408.6
申请日:2025-01-13
Applicant: 杭州电子科技大学
IPC: G06F21/32 , G06F18/10 , G06F18/213 , G06F18/214 , G06F18/2415 , G06N3/042 , G06N3/084
Abstract: 本发明公开了一种基于知识蒸馏的心跳信号身份识别方法、系统、存储介质及电子设备。方法包括如下步骤:1)数据预处理阶段:将毫米波雷达采集到的心跳信号,进行分段处理,将每一段心跳信号通过频域分析得到log‑mel(对数梅尔)频谱图,将得到的log‑mel频谱图集划分为训练集和测试集。2)训练阶段:基于残差网络ResNet和ViT构建知识蒸馏模型,采用ResNet作为教师模型指导ViT学生模型训练,再基于训练集完成知识蒸馏模型训练;3)测试阶段:使用步骤2)训练得到的知识蒸馏模型在测试集上进行测试,得到心跳信号身份识别结果。本发明克服了因数据集规模过小导致的过拟合问题,提高了身份识别的准确率。
-
公开(公告)号:CN114694262B
公开(公告)日:2025-04-04
申请号:CN202210397625.0
申请日:2022-04-15
Applicant: 杭州电子科技大学
IPC: G06V40/20 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于两个正交视角方向的特征分开提取的多视角步态识别方法及系统,方法具体步骤:S1.采集得到多视角、多协变量情况的步态数据集,并对数据集进行预处理;S2.将预处理后的输入送入训练好的特征提取网络,提取出90°和0°两个视角方向成分的特征向量;同时,根据输入的样本识别出样本的协变量,并得到协变量向量;S3.根据得到的协变量向量,对步骤S2的特征向量做加权处理,得到最终的步态特征向量;S4.设置注册集,注册集中只含有90°和0°两个视角方向的样本;S5.通过对比网络输出的步态特征与注册集的步态特征,分类得到输入的身份信息。本发明实现了多视角、多携带物状态的步态识别的目的,有效降低了协变量对步态识别的影响。
-
公开(公告)号:CN118570527A
公开(公告)日:2024-08-30
申请号:CN202410646713.9
申请日:2024-05-23
Applicant: 杭州电子科技大学平湖数字技术创新研究院有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/20 , G06V10/40
Abstract: 本发明属于基于深度学习的图像异常检测技术领域,具体涉及基于受控特征生成器的图像异常检测方法及系统。方法包括:S1:获取图像异常检测数据集;S2:对图像数据集进行预处理;S3:构建深度学习模型,将预训练权重加载到特征提取器中;S4:生成伪标签,定义不确定特征和模糊域;S5,伪标签控制特征生成器中生成异常的数量;S6,伪标签控制特征生成器中添加对抗扰动的幅度;S7,受控特征迭代生成;S8,定义模型损失函数,对经过生成的特征进行约束;S9,对受控特征生成器进行参数设置;S10,迭代深度学习模型中的参数,保存迭代训练好的深度学习模型;S11,导入模型训练参数,将待检测的图像数据输入模型进行异常检测。
-
公开(公告)号:CN118505762A
公开(公告)日:2024-08-16
申请号:CN202410646716.2
申请日:2024-05-23
Applicant: 杭州电子科技大学平湖数字技术创新研究院有限公司
IPC: G06T7/30 , G06V10/74 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种基于多分辨率层次化结构的梯度调节医学图像配准方法及系统,方法包括以下步骤:S1.获取医学图像,制作数据集,分成训练集和测试集;S2.构建多分辨率层次化网络架构,分辨率分为三层,从低到高进行配准;S3.制定多层次梯度调节策略;S4.确定优化使用的相似性损失和正则化损失函数;S5.设计多分辨率层次化网络的梯度调节实施方案;S6.将数据集输入设计好的多层次网络架构中,通过各层梯度调节完成训练,并保存模型。本发明利用多分辨率层次化结构对医学图像从全局到局部完成多尺度配准。
-
公开(公告)号:CN114693565B
公开(公告)日:2024-05-03
申请号:CN202210439935.4
申请日:2022-04-25
Applicant: 杭州电子科技大学
IPC: G06T5/00 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于跳跃连接多尺度融合的GAN图像修复方法,根据跳跃连接未考虑编解码器中各层特征之间的相关性的特点,利用编码器中相对高层的特征图与相对低层的特征图融合,再传递至各层解码器并输出生成图像。然后细化了损失的类型,重新定义损失函数为对抗损失、像素重构损失和金字塔损失来进一步指导网络的训练向正确的方向进行。本发明方法针对现有图像修复方法高层特征不能指导低层特征的生成导致修复的结果可能存在语义不连贯的问题进行改善,提升了破损图像修复的效果,在满足人类视觉感知需求的同时也能在一定程度上与原图相似。且经实验验证,该方法在人脸图像、自然场景图像和建筑图像上都达到了不错的修复效果。
-
-
-
-
-
-
-
-
-