-
公开(公告)号:CN114049899B
公开(公告)日:2024-11-26
申请号:CN202111390367.5
申请日:2021-11-23
Applicant: 中国林业科学研究院资源信息研究所
Abstract: 本申请涉及声音识别技术领域,具体提供一种声音识别方法、装置、电子设备及存储介质,对获取的长臂猿录音数据进行预处理、提取Mel谱特征,通过将Mel谱特征训练好的长臂猿声音分类模型得到待分类长臂猿录音数据中的长臂猿音频片段,并对长臂猿音频片段进行拼接裁剪得到完整的长臂猿音频,进而记录长臂猿在目标区域的鸣叫时间,实现对长臂猿的高效监测。由于采用的长臂猿声音分类模型更为轻量化,能够快速识别出长臂猿录音数据中的长臂猿音频片段,实现对长臂猿的实时监测。
-
公开(公告)号:CN116129914A
公开(公告)日:2023-05-16
申请号:CN202310348692.8
申请日:2023-04-04
Applicant: 中国林业科学研究院资源信息研究所
Abstract: 本发明涉及声音识别技术领域,尤其涉及声音识别模型的训练方法、装置、电子设备及存储介质,该方法包括:将音频样本特征数据输入到当前的声音识别模型的卷积层中,得到第一音频样本特征数据;将第一音频样本特征数据依次输入到当前的声音识别模型的至少一个轻量倒残差结构中,得到第二音频样本特征数据;将第二音频样本特征数据依次输入到当前的声音识别模型的平均池化层和全连接层,得到音频样本特征数据的声音识别结果;根据音频样本特征数据的声音识别标签和声音识别结果,对当前的声音识别模型进行模型更新。本申请能够对声音识别模型进行训练,通过该声音识别模型识别动物声音,提高了识别动物声音的准确率。
-
公开(公告)号:CN117351357A
公开(公告)日:2024-01-05
申请号:CN202311367012.3
申请日:2023-10-20
Applicant: 中国林业科学研究院资源信息研究所
IPC: G06V20/10 , G06V10/25 , G06V10/26 , G06V10/44 , G06V10/766 , G06V10/82 , G06V10/80 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明的实施例提供了一种树木害虫识别方法和装置,所述方法包括如下步骤:获取图像数据,所述图像数据包括感兴趣区域,所述感兴趣区域包括树木害虫;使用PestSwinNet模型对图像数据进行处理,以得到感兴趣区域;所述PestSwinNet模型包括:主干网,区域候选网络,和全连接层和语义分割网络。所述装置包括:获取单元和图像处理单元。本发明实施例提出了一种融合Swin Transformer的害虫图像实例分割优化模型(PestSwinNet模型),该模型具有主干网的特征提取能力强、识别精度高、运行速率快、识别效果好、漏检误检率低的优势。上述技术方案特别适用于野外真实情况下获取、无明显障碍物遮挡的害虫图像。
-
公开(公告)号:CN114049899A
公开(公告)日:2022-02-15
申请号:CN202111390367.5
申请日:2021-11-23
Applicant: 中国林业科学研究院资源信息研究所
Abstract: 本申请涉及声音识别技术领域,具体提供一种声音识别方法、装置、电子设备及存储介质,对获取的长臂猿录音数据进行预处理、提取Mel谱特征,通过将Mel谱特征训练好的长臂猿声音分类模型得到待分类长臂猿录音数据中的长臂猿音频片段,并对长臂猿音频片段进行拼接裁剪得到完整的长臂猿音频,进而记录长臂猿在目标区域的鸣叫时间,实现对长臂猿的高效监测。由于采用的长臂猿声音分类模型更为轻量化,能够快速识别出长臂猿录音数据中的长臂猿音频片段,实现对长臂猿的实时监测。
-
-
-