-
公开(公告)号:CN111582483B
公开(公告)日:2022-12-13
申请号:CN202010409546.8
申请日:2020-05-14
Applicant: 哈尔滨工程大学
Abstract: 本发明的目的在于提供基于空间和通道联合注意力机制的无监督学习光流估计方法,首先构建一种融合空洞卷积的新型特征金字塔网络,并利用其提取包含更多运动信息的多尺度特征。之后基于空间和通道联合注意力机制构建光流估计网络,使网络能够学习到更有针对性的运动信息。最后基于正反一致性校验和Census变换构造遮挡感知的无监督损失函数,并利用其对网络进行无监督训练,得到性能更优的无监督光流估计模型。
-
公开(公告)号:CN109599120B
公开(公告)日:2021-12-07
申请号:CN201811589296.X
申请日:2018-12-25
Applicant: 哈尔滨工程大学
IPC: G10L17/26 , G10L21/0208 , G10L25/18 , G10L25/24
Abstract: 本发明公开了一种基于大规模养殖场厂哺乳动物异常声音监测方法,属于声音识别领域,具体涉及一种无监督的声音识别方法。本发明主要包括以下几个部分:1.谱图分析:对采集来的音频进行分析,确定声音识别方案的可行性;2.音频降噪:对音频降噪处理,提高声音识别的准确性;3.无监督音频分割:简化音频处理过程,无需手动切分得到包含所需声音事件的音频段;4.音频特征提取:采用的特征提取技术为Mel频率倒谱系数;5.无监督分类:采用无监督分类方法为K均值算法。本发明通过采用无监督的音频分割技术和K均值的分类方法,结合频谱、时频谱分析技术,音频降噪技术,Mel频率倒谱系数特征提取技术,实现了对大规模养殖场动物无监督的声音识别。
-
公开(公告)号:CN111105413B
公开(公告)日:2021-05-14
申请号:CN201911407774.5
申请日:2019-12-31
Applicant: 哈尔滨工程大学
Abstract: 本发明属于图像处理领域,具体涉及一种智能火花塞外观缺陷检测系统,包括以下步骤:采集待识别火花塞的外观图像;将采集得到的TIFF格式的图像转换为JPG格式图像;根据火花塞外观缺陷的类型将原图像进行区域分割;针对每一类缺陷,训练集与测试集按照一定比例生成数据集划分目录,根据此目录对采集到的图像进行数据集划分,分为训练集与测试集两部分;根据火花塞表面缺陷评价标准,应用标记工具LabelMe对采集数据进行缺陷标注;本发明利用图像区域分割的方式将多种缺陷类型区域化识别,极大提高了外观缺陷检测的准确率。利用基于GPU的多进程模型加载,一并输出待检测图片的识别结果,提高了外观缺陷检测的效率。
-
公开(公告)号:CN109377517B
公开(公告)日:2021-04-06
申请号:CN201811216196.2
申请日:2018-10-18
Applicant: 哈尔滨工程大学
IPC: G06T7/277
Abstract: 本发明公开了一种基于视频追踪技术的动物个体识别系统,属于机器学习领域。基于图像视频处理技术,将多目标追踪思想应用于动物个体识别场景中,通过实时记录圈内各个动物的轨迹位置坐标,实现动物个体识别。在方案具体实施中,将深度学习中的Faster‑RCNN多目标检测模型与传统追踪算法卡尔曼滤波器结合,解决了多目标追踪应用中经常出现的遮挡,轨迹交叉,实时性差等难点问题。利用采集的海量圈养数据模型,训练出基于Faster‑RCNN模型的圈养动物检测模型。本发明能够有效地实现零接触,无应激,在动物个体最自然的状态下实现动物个体识别,并且安装设备可实施性强,具有非常强的实际应用价值。
-
公开(公告)号:CN111582483A
公开(公告)日:2020-08-25
申请号:CN202010409546.8
申请日:2020-05-14
Applicant: 哈尔滨工程大学
Abstract: 本发明的目的在于提供基于空间和通道联合注意力机制的无监督学习光流估计方法,首先构建一种融合空洞卷积的新型特征金字塔网络,并利用其提取包含更多运动信息的多尺度特征。之后基于空间和通道联合注意力机制构建光流估计网络,使网络能够学习到更有针对性的运动信息。最后基于正反一致性校验和Census变换构造遮挡感知的无监督损失函数,并利用其对网络进行无监督训练,得到性能更优的无监督光流估计模型。
-
公开(公告)号:CN105809184B
公开(公告)日:2020-06-16
申请号:CN201510726868.4
申请日:2015-10-30
Applicant: 哈尔滨工程大学
IPC: G06K9/62
Abstract: 本发明涉及机器视觉识别领域,特别是一种适用于加油站的车辆实时识别跟踪与车位占用判断的方法。本发明包括:收集加油站车辆样本和非车辆样本;对车辆样本和非车辆样本进行预处理;训练车辆分类器;利用车辆分类器对获取的实时图像进行车辆识别并记录车辆区域;采用光流法对识别到的车辆区域角点进行跟踪并绘制中心点轨迹;通过计算车辆区域与事先划定的加油站车位的面积重合比来判定车位占用情况并对车辆占用车位时间进行计时。本发明既可以对加油站内部车辆进行识别并对车辆轨迹进行跟踪,又可判断加油站内部车位占用情况,具有实施成本低,自动化程度高的特点。
-
公开(公告)号:CN110095749A
公开(公告)日:2019-08-06
申请号:CN201910377716.6
申请日:2019-05-05
Applicant: 哈尔滨工程大学
IPC: G01S3/14
Abstract: 本发明听的是一种基于非圆信号的多重孔径嵌套阵列设置及DOA估计方法。首先根据总阵元数N得到原始嵌套阵列两子阵阵元数N1和N2及阵列结构;然后基于嵌套阵列两子阵对应关系得到各自的偏移量l1和l2;接着根据阵列接收非圆信号及虚拟阵列的特点设计连续虚拟阵列自由度最大的多种物理阵列摆放形式;最后根据实际需求取其中一种用于非圆信号欠定波达方向估计。本发明提出的非圆信号阵列设置与现有嵌套阵列相比,具有阵列摆放灵活和孔径多变但连续虚拟阵列自由度固定且有效提高的优点,可实现高性能的非圆信号欠定波达方向估计。
-
公开(公告)号:CN109785337A
公开(公告)日:2019-05-21
申请号:CN201811588576.9
申请日:2018-12-25
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种基于实例分割算法的栏内哺乳动物清点方法,属于计算机视觉领域;本发明通过摄像头将栏内哺乳动物的图像采集并发送到工作站中;然后选取目标轮廓清晰的图像,并将图像分为训练集、验证集和测试集,作为数据集用于模型训练;其次通过深度学习的实例分割算法,生成用于测试的分割模型;将测试集图像依次输入训练生成的分割模型,进行预测,输出测试结果和测试效果图;在测试完成后,自动保存测试效果图;最后通过对测试结果中目标边界框进行计数,进而实现对图像中目标数量的清点,本发明利用神经网络训练模型,避免了复杂的图像预处理步骤,有效提高了遮挡目标的识别准确率。
-
公开(公告)号:CN101794443A
公开(公告)日:2010-08-04
申请号:CN201010101804.2
申请日:2010-01-28
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种基于线性最小二乘支持向量机的高光谱图像端元选择方法。步骤1.选取前N个像素点作为初始端元;步骤2.令目前所选端元中的第i个为“1”类,其余N-1个为“0”类,首次执行i=1,建立相应的LLSSVM判别函数即距离测算函数;步骤3.依次计算每个像素的距离,如果某个像素的绝对距离大于1,则将该像素替换第i个端元,置i=1,转入步骤2;步骤4.i=i+1,若i>N,转入步骤5,否则转入步骤2;步骤5.当前端元即为最终选择端元,结束。本发明为一种高光谱图像端元选择方法,采用LLSVM作为主要工具来完成。无需降维预处理、复杂度低。
-
公开(公告)号:CN101127086A
公开(公告)日:2008-02-20
申请号:CN200710144301.1
申请日:2007-09-12
Applicant: 哈尔滨工程大学
IPC: G06K9/62
Abstract: 本发明提供的是一种高光谱图像复选性加权分类方法,它至少包括样本加权、特征加权或类别加权处理过程的一个。本发明根据样本异常程度与样本偏离类中心距离之间的关系,将距离非线性映射为相应权值来完成样本加权;根据类内散度矩阵对线性光谱分离问题的加权特性,将其推广到最小二乘SVM分类问题中来完成特征加权;根据最小二乘SVM线性方程组中单位矩阵对角元素的特殊含义,将其设定为体现类别重要性的不同数值来完成类别加权。
-
-
-
-
-
-
-
-
-