-
公开(公告)号:CN115544297A
公开(公告)日:2022-12-30
申请号:CN202211162960.9
申请日:2022-09-23
Applicant: 珠海高凌信息科技股份有限公司
IPC: G06F16/683 , G06F16/61 , G06N5/02
Abstract: 本发明公开了一种声音数据库构建及智能检索方法、系统及存储介质,方法包括:获取原始音频数据;对原始音频数据进行数据预处理,得到声音元数据;根据原始音频数据和声音元数据,构建声音数据库及知识图谱;响应于目标对象的检索数据,基于声音数据库及知识图谱匹配返回检索结果;其中,检索数据包括检索文本和检索音频。本发明通过对原始音频数据的预处理,提取声音元数据;进而构建声音数据库及知识图谱,实现基于声音元数据以及原始音频数据声音检索的全文索引。通过声音数据库的创建,并基于知识图谱实现了基于元数据和音频数据的检索功能,能够实现包含多特性的声音检索技术,可广泛应用于数据检索技术领域。
-
公开(公告)号:CN117541735A
公开(公告)日:2024-02-09
申请号:CN202311386933.4
申请日:2023-10-24
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提供一种基于倾斜摄影模型构建动态三维噪声地图的方法,包括完成倾斜摄影和像控点测量数据采集;将获取到的原始影像数据进行图像处理,获得最佳成像效果的倾斜摄影数据;基于倾斜摄影数据形成完整的CIM城市信息三维模型,根据修正后的源清单信息构建噪声地图计算模型,将数据代入噪声地图计算模型进行动态计算,结合声源噪声拟合算法和噪声传播衰减算法,计算生成基础三维噪声地图,并利用监测数据进行修正,根据瞬时、小时、昼夜等频生成动态噪声地图数据,并结合噪声地图原始数据在cesium三维渲染引擎上进行地图数据更新。本发明以三维地图为基础,融合CIM实景三维模型、城市实时动态噪声地图模型,实现实时动态的噪声地图一屏统览。
-
公开(公告)号:CN117351995A
公开(公告)日:2024-01-05
申请号:CN202311247442.1
申请日:2023-09-25
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提出了一种基于深度学习复合模型的环境声音识别方法及装置,该方法包括:获取环境音频,对环境音频进行特征提取得到环境音频特征,将环境音频特征输入预先训练好的复合模型,复合模型包括多个网络结构不同的通用模型;通过通用模型识别出各个类别标签对应的通用识别置信度;基于通用模型的模型权值和通用识别置信度,确定各个类别标签的目标加权置信度作为通用模型的分类输出结果;根据目标加权置信度的均值得到复合模型的输出结果。根据本发明实施例的技术方案,能够通过多个不同网络结构的通用模型对环境音频识别的置信度进行加权融合,能够降低分类识别的过拟合风险,增强泛化能力,能够在长期使用场景下维持对环境音频识别的准确性。
-
公开(公告)号:CN116246660A
公开(公告)日:2023-06-09
申请号:CN202310095611.8
申请日:2023-02-06
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明公开了一种电信欺诈的检测方法、装置及电子设备,方法包括:对目标音频使用声音序列进行特征提取,获得包括情感特征的声音嵌入向量;识别目标音频的文本,将文本中的每个单词与预设的词库进行多个语言维度的比较,并生成语言风格向量;通过包括卷积神经网络与循环神经网络的深度学习模型,将声音嵌入向量与语言风格向量融合,得到包括声音特征与语言风格特征的融合特征向量;通过深度学习模型检测目标音频是否属于电信欺诈的音频。本发明电信欺诈的检测准确性高且检测效率高,可广泛应用于电信欺诈检测领域。
-
公开(公告)号:CN115312075A
公开(公告)日:2022-11-08
申请号:CN202210910044.2
申请日:2022-07-29
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提供一种噪声声源事件检测方法、装置、电子设备及存储介质,该噪声声源事件检测方法包括:获取噪声声源的多声道音频;对多声道音频执行特征提取,得到第一特征序列;通过卷积神经网络对第一特征序列执行正则化及降维处理,得到第二特征序列;通过循环卷积神经网络对第二特征序列确定时间序列信息,得到第三特征序列;对第三特征进行映射及分类,确定多声道音频的声音事件和到达方向。本发明的有益效果为:提高了准确率和声源检测的扩展性,易于扩展到不同的阵列结构。
-
-
-
-