-
公开(公告)号:CN115862608A
公开(公告)日:2023-03-28
申请号:CN202211220366.0
申请日:2023-01-09
Applicant: 浙江大学
Abstract: 本发明公开了一种基于音频增强、Mel声谱图和ViT的环境声音分类方法。该方法包括四个步骤:①构建数据集:针对要进行分类的环境声音,构建环境声音数据集;②音频增强:将采集到的声音数据进行音频增强;③音频转化为声谱图:使用算法将音频文件转化为Mel声谱图;④模型训练:将Mel声谱图送入改进的ViT(VisionTransformer)模型中进行训练。训练结束后,就可以用训练结果进行环境声音分类了。传统的环境声音识别大多使用波形特征进行识别分类,本发明使用Mel声谱图作为特征进行识别分类,将声音识别转换到了图像识别。目前一些环境声音分类方法使用Mel声谱图进行旋转、移动和剪切等图片增强方法,忽略了其声音特性,本发明采用音频增强方法,更符合音频本身的特性。目前一些环境声音分类方法使用的网络结构较为简单,本发明引入目前分类效果比较好的ViT网络结构进行模型训练。
-
公开(公告)号:CN115496780A
公开(公告)日:2022-12-20
申请号:CN202211148365.X
申请日:2022-09-21
Applicant: 浙江大学
Abstract: 本发明公开了一种鱼类识别计数、测速预警和进出数量统计系统。用户可以结合自身实际情况,自定义训练数据集,将训练好的权重文件结合本发明中使用的基于Deepsort的多目标追踪算法、基于双凸轨线测算的计数算法和基于视觉倾斜度的测速算法,可以实现了鱼类多目标追踪、统计画面中各种鱼类数量、计算进入和离开监控画面的鱼数量、对每条鱼的游动速度进行测速等一系列功能。本发明可以根据自己所要管理的观赏鱼类,达到智能化管控的效果。本发明应用拓展性较好,结合用户需求,添加一些算法可以进行许多的二次开发。
-
公开(公告)号:CN116756543A
公开(公告)日:2023-09-15
申请号:CN202310673516.1
申请日:2023-06-08
Applicant: 浙江大学
IPC: G06F18/213 , G06F18/24 , G06F18/214 , G06F18/10 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于时空域结合、MFCC和预提取技术的Φ‑OTDR信号快速训练识别算法。该算法包括四个步骤:①首先,将Φ‑OTDR信号数据集进行时域与空间域的相互结合;②其次,求Mel频率倒谱系数(MelFrequencyCepstrumCoefficient,MFCC);③然后,将Mel频率倒谱系数预先提取,存储起来;④最后,在训练时,导入预先存储的Mel频率倒谱系数进行训练。总体而言,通过本发明的以上技术方案与现有技术相比,能够取得下列有益效果:①与检测单个光纤节点进行识别分类的方法相比较,本方案中的时域与空间域的相互结合方法可以避免因单个节点报错而产生过大干扰,有更强的抗干扰能力,同时引入了空间域的信息;②与将光纤节点数据直接进行训练识别的方法相比较,本方案中的转化为Mel频率倒谱系数的方法提升了信息特征密度,减少了训练时的数据量;③与同时提取特征和进行训练的方法相比较,本方案中的预先提取技术可以减少训练时间;④与采用复杂的网络结构的方法相比较,本方案中的采用精简的网络结构不仅模型训练快,而且识别也快,更加实用。
-
公开(公告)号:CN115909486A
公开(公告)日:2023-04-04
申请号:CN202211376196.5
申请日:2022-11-04
Applicant: 浙江大学
Abstract: 本发明公开了一种基于YOLOv5、TFLite量化和移动端部署的引体向上视觉识别计数系统。该系统包括四个步骤:①引体向上的图像数据集制作;②使用YOLOv5s网络结构进行训练,得到训练好的权重文件;③将训练好的权重文件进行TFLite量化,得到量化文件;④使用Android Studio将量化文件进行Android移动端部署,生成应用程序APP。人们可以在手机上使用该应用程序,随时随地用手机实现引体向上智能计数。总体而言,本发明的技术方案与现有技术相比,能够取得下列有益效果:①与基于传感器硬件的引体向上计数系统相比较,本发明无需繁琐的安装调试工作;②与基于人体关键点的视觉识别引体向上计数系统,本发明无需计算复杂的人体关键点角度,也不怕拍摄角度问题影响计算效果;③与近几年的引体向上自动计数系统的专利相比,本发明具有简单实用性,只需要一个手机就可以轻松计数,不需要连接电脑或人工智能开发板等智能设备进行繁杂的分析处理。
-
-
-