-
公开(公告)号:CN120014234A
公开(公告)日:2025-05-16
申请号:CN202510092114.1
申请日:2025-01-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/25 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于误分类修正的弱监督目标检测方法、系统、电子设备及存储介质,方法包括利用卷积神经网络提取目标候选位置的区域特征;通过分类器对提取的区域特征分配所属类别标签;根据类别间的置信度差异,设计误分类修正驱动的标签分配模块,以识别误分类情况并予以修正,并重新分配标签用于目标检测模型训练。本发明方法通过修正训练阶段生成的错误类别标签,显著提高弱监督目标检测方法的分类性能。
-
公开(公告)号:CN118866011B
公开(公告)日:2025-02-07
申请号:CN202411333837.8
申请日:2024-09-24
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明属于环境噪声监测技术领域,本发明公开了一种基于自注意力机制的环境噪声监测方法,包括以下步骤:通过短时傅里叶变换将音频信号转换为频谱图;通过自注意力机制提取频谱图的声纹特征;通过神经网络声纹特征对应到具体的环境声源类别,本发明通过利用短时傅里叶变换将音频信号转换为频谱图,并结合自注意力机制提取频谱图中的声纹特征,实现了对环境声音的多维度监测与分析。这种方法能够捕捉到声音的频率、能量分布、时间变化等丰富信息,为环境声监测提供更加全面和准确的指标,并且自注意力机制能够自动学习频谱图中的关键信息,并赋予其更高的权重,从而有效提取出对分类任务至关重要的声纹特征。
-
公开(公告)号:CN119048759A
公开(公告)日:2024-11-29
申请号:CN202411271128.1
申请日:2024-09-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/26 , G06V10/20 , G06V10/44 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06V40/18
Abstract: 本发明属于模式识别技术领域,且公开了基于异构卷积感知网络的糖尿病视网膜病变病灶分割方法,包括如下步骤:将输入的眼底图像进行预处理,使眼底图像的分辨率统一调整为预设分辨率,并去除多余的背景部分;构建基于异构卷积感知网络的模型,并使用加权交叉熵损失函数和噪声调整损失函数相结合的训练策略进行训练;将预处理后的测试眼底图像输入到训练好的模型中进行预测,输出预测结果;对模型输出的预测结果进行后处理,后处理包括特征图大小的还原、病灶涂色,获得最终的分割结果,本发明采用异构条形卷积、异构调制可变形卷积和异构近远感知卷积结构,提高了分割精度,还增强了模型的鲁棒性。
-
公开(公告)号:CN111724303B
公开(公告)日:2024-11-29
申请号:CN202010398292.4
申请日:2020-05-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Inventor: 徐勇
IPC: G06T3/4076 , G06T7/40 , G06T7/90 , G06F17/16 , G06V10/774
Abstract: 本发明提供了一种具有图像类型适应性的超分辨率图像处理方法,包括以下步骤:S1、构建基于多类型图像的“通用”超分辨率模,将待处理图像作为基于多类型图像的“通用”超分辨率模的输入,运行基于多类型图像的“通用”超分辨率模型后,得出待处理图像的初步高分辨率图像;S2、构建基于单一类型图像的“精细”超分辨率模型,将初步高分辨率图像作为基于单一类型图像的“精细”超分辨率模型的输入,运行基于单一类型图像的“精细”超分辨率模型后,得出最终的高分辨率图像。本发明还提供了一种具有图像类型适应性的超分辨率图像处理系统。本发明的有益效果是:在提升图像分辨率的同时,还可以克服原图像中存在的局部亮度异常等问题。
-
公开(公告)号:CN118471268B
公开(公告)日:2024-10-18
申请号:CN202410926523.2
申请日:2024-07-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Inventor: 徐勇
Abstract: 本发明公开了一种智能识别环境噪声类别的方法、系统及存储介质,包括:将环境噪声划分为多个环境噪声类别;针对各环境噪声类别,均采集一段声音文件,并人工打标噪声类别标签;对已打标噪声类别标签的各声音文件进行预处理,获取预处理后的若干声音片段;对预处理后的各声音片段进行特征提取,获取各声音片段特征;基于所述环境噪声类别和所述声音片段特征构建噪声类别识别模型;将各声音片段特征输入噪声类别识别模型进行模型训练,并利用训练后的所述噪声类别识别模型识别待识别声音片段的噪声类型及其对应的置信度。本发明完善了当前的环境噪声监测指标以及可为噪声治理提供依据。
-
公开(公告)号:CN117789080A
公开(公告)日:2024-03-29
申请号:CN202311772954.X
申请日:2023-12-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V20/40 , G06V10/82 , G06V10/26 , G06N3/0455 , G06N3/08
Abstract: 本申请提供了一种指向性视频对象分割方法,包括基于短视频数据进行文本标注制作数据集;用所述数据集训练神经网络分割模型,所述神经网络分割模型包括时间编码器、空间编码器、解码器,在所述空间编码器和所述时间编码器的第s级后插入所述LBDT模块,所述LBDT模块的结果输入到所述解码器;将待预测视频数据输入到训练好的所述神经网络分割模型,得到对象分割结果。首创基于短视频制作数据集,并添加中文标注训练得到的包含改进LBDT模块的神经网络分割模型。可以至少用以解决现有指向性视频对象分割方法在特定语种下准确度不够高的技术问题。
-
公开(公告)号:CN117273330A
公开(公告)日:2023-12-22
申请号:CN202311201777.X
申请日:2023-09-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06Q10/0631 , G06Q50/06 , G06N3/006 , G06N5/01
Abstract: 本发明实施例提供了一种资源分配方法及装置,本申请提供了“采用启发式的、基于群智能的猫鼬群优化算法(Meerkat Swarm Intelligence Algorithm,MSIA)、拉格朗日松弛法和分支定价算法相结合的策略”的解决方案,具体为:获取城市水资源的基础参数;依据所述基础参数确定种群内资源的近似最优解;依据所述近似最优解确定种群内资源的全局最优解。本发明采用启发式的MSIA方法、拉格朗日松弛法和分支定价算法相结合的策略,通过模拟猫鼬捕猎的具体行为,设置启发式算法平衡探索阶段和利用阶段之间的平衡以及提升算法解的准确性,最后将全局最优解近似为算法所求的近似最优解。
-
公开(公告)号:CN116758693A
公开(公告)日:2023-09-15
申请号:CN202310711869.6
申请日:2023-06-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请提供了一种基于室内的无线火灾报警系统,采用了无线方式对检测火灾参数的传感器进行布局,以实现对室内环境信息实时感知,并对室内火灾作出判别和报警,为火灾报警技术领域提供了一定的思路。传感器的无线布局方式解决了传统有线布局方式的繁琐性、复杂性以及资源浪费等问题,其为后续消防检查工作也带来了一定的便利性。
-
公开(公告)号:CN119785403A
公开(公告)日:2025-04-08
申请号:CN202411879010.7
申请日:2024-12-19
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V40/16 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0464
Abstract: 本发明公开了一种面向威廉斯综合症的面部图像分析系统,包括:面部检测模块,用于识别并裁剪面部图像中的人脸区域,得到训练图像和测试图像;面部特征提取模块,用于根据训练图像,通过MobileFaceNet网络提取局部面部区域并重映射坐标值;其中局部面部区域包括:眼部区域、鼻子区域、嘴巴区域;逐像素加权模块,用于对训练图像的局部面部区域进行加权处理,得到加权图像;网络训练模块,用于通过VMamba网络对加权图像进行分类预测,得到训练好的VMamba网络;图像分析模块,用于将测试图像输入至训练好的VMamba网络,得到面向威廉斯综合症的面部图像分析结果。本发明能够准确分析具有威廉斯综合证的面孔图像。
-
公开(公告)号:CN119205513A
公开(公告)日:2024-12-27
申请号:CN202411586232.X
申请日:2024-11-08
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T3/4053 , G06T3/4046 , G06V10/80
Abstract: 本发明公开了一种视频超分辨率方法、系统、电子设备及存储介质,所述方法包括建立复杂运动场景下的视频超分辨率模型并训练和测试所述模型,模型包括特征提取子模块、跨帧对齐子模块、特征增强子模块和上采样重建子模块,特征提取子模块用于提取输入连续视频帧的浅层特征;跨帧对齐子模块利用可变形卷积对不同帧进行特征级对齐,实现跨帧的时空信息融合和运动补偿;特征增强子模块对特征进行增强;上采样重建子模块针对特征增强子模块输出的增强特征进行分辨率放大,并将分辨率放大后的增强特征重构为视频帧。本发明提高了复杂运动场景下视频的超分效果,增强视频的质量和视觉效果。
-
-
-
-
-
-
-
-
-