环境声音描述方法、装置、电子设备及存储介质

    公开(公告)号:CN116486830A

    公开(公告)日:2023-07-25

    申请号:CN202310392211.3

    申请日:2023-04-12

    Abstract: 本发明提供一种环境声音描述方法、装置、电子设备及存储介质,该环境声音描述方法包括:响应于环境声音描述请求,获取第一目标环境声音,对第一目标环境声音执行预处理,得到第二目标环境声音;对第二目标环境声音采用环境声音描述模型进行识别处理,得到第一目标环境声音的描述结果;环境声音描述模型的训练包括:获取环境声音的音频数据集,对音频数据集执行音频剪辑处理,得到验证集及测试集;对验证集及测试集执行预处理,进而执行基于迁移学习处理,得到音频特征;对音频特征执行深度卷积神经网络训练处理,得到环境声音描述模型。本发明的有益效果为:提高了声源描述准确率和声源检测的扩展性。

    基于行为策略的内网安全防护方法、系统及介质

    公开(公告)号:CN113904804B

    公开(公告)日:2023-07-21

    申请号:CN202111036424.X

    申请日:2021-09-06

    Abstract: 本发明提供了一种基于行为策略的内网安全防护方法、系统及介质,所述方法包括以下步骤:判断内网中是否存在第一类异常行为及第二类异常行为;确定是否接收到新流量packets,响应于接收到的新流量packets,提取新流量packets中的目的MAC地址,将该目的MAC地址与MAC地址表hostList进行比对;若所述MAC地址表hostList中存在所述目的MAC地址,则判定新流量packets为内网报文,并判断新流量packets是否为基于连接协议的流量packets;若新流量packets不是基于连接协议的流量packets,则判断新流量packets中的目的MAC地址是否与异常标识Ⅰ或者异常标识Ⅱ关联,以及新流量packets中的源MAC地址是否与异常标识Ⅰ或者异常标识Ⅱ关联;若均不关联,则生成第一流量控制策略;否则,生成第二流量控制策略,以此阻断内网中的威胁。

    基于边缘设备的AI服务方法、装置和存储介质

    公开(公告)号:CN116360976A

    公开(公告)日:2023-06-30

    申请号:CN202310073092.5

    申请日:2023-01-31

    Inventor: 张建军 王文重

    Abstract: 本申请公开了基于边缘设备的AI服务方法、装置和存储介质,本申请的方法包括将AI模型分为若干个分区,将第一分区的计算分配给边缘计算端,将第二分区的计算分配给分布式边缘节点,将第三分区的计算分配给云端,其中,所述边缘计算端为边缘设备的计算处理端;利用EEoI执行初始特征提取,判断置信度达到预设值,若是,则给出推理结果,否则通过所述云端的人工智能模型执行处理。本申请通过协同边缘计算终端设备与边缘服务器的方案,来整合二者的计算本地性与强计算能力的互补性优势,能够显著降低深度学习模型推理的延迟与能耗。

    多模态数据集成管理方法、装置及介质

    公开(公告)号:CN116150320A

    公开(公告)日:2023-05-23

    申请号:CN202310026624.X

    申请日:2023-01-09

    Abstract: 本发明提供一种多模态数据集成管理方法、装置及介质,该多模态数据集成管理方法包括:对接入的第一多模态数据执行临时存储;对第一多模态数据执行预处理,得到第二多模态数据;对第二多模态数据执行提取,得到包括有数据特征、数据来源及存储位置的元数据;采用对应的数据存储方式对元数据执行存储。使用可定制算法来实现文本、声音及视觉数据的统一集成,通过使用本体模型/元模型的方式统一提取文本、声音和视觉数据的元数据,并通过对象存储辅以结构化存储方式,来实现多模态的统一存储,借助元数据和对象存储技术,实现多模态数据的高可靠、高性能访问的统一管理,使得多模态数据分析效率和准确性大大提升。

    一种声学场景分类方法、系统、装置及存储介质

    公开(公告)号:CN115798510A

    公开(公告)日:2023-03-14

    申请号:CN202211247560.8

    申请日:2022-10-12

    Abstract: 本发明公开了一种声学场景分类方法、系统、装置及存储介质,声学场景分类方法通过对声学场景声音进行数据增强处理,采用预训练的声音分类大模型对数据增强处理得到的声学场景声音序列进行特征提取,获取第一嵌入向量,并接入深度卷积神经网络对第一嵌入向量进行分类训练,得到第一模型,进而采用第一模型对声学场景声音进行分类,生成声学场景分类结果,无需依赖大量的有标签数据进行模型训练,提高了基于小样本有标签数据的声学场景分类的准确性和稳定性,并降低了训练成本。本发明可广泛应用于计算机技术领域。

    基于深度学习的声音隔离方法、装置和存储介质

    公开(公告)号:CN115713944A

    公开(公告)日:2023-02-24

    申请号:CN202211335613.1

    申请日:2022-10-28

    Abstract: 本申请公开了基于深度学习的声音隔离方法、装置和存储介质,本申请的方法包括获得用于构建DeepAudioSep模型的音频文件并对所述用于构建DeepAudioSep模型的音频文件进行预处理;构建DeepAudioSep模型并训练所述DeepAudioSep模型,所述DeepAudioSep模型包括一个混合源输入和十个隔离的源输出;通过所述DeepAudioSep模型进行声音分离。本申请将数据驱动和深度学习思想引入声音分离及噪声隔离处理,提升在环境监测领域对于声音分离及噪声隔离处理能力,因此具有广泛的噪声处理前景及实用价值。

    主备控制板实时同步方法及系统

    公开(公告)号:CN111478947B

    公开(公告)日:2023-02-17

    申请号:CN202010200007.3

    申请日:2020-03-20

    Abstract: 本发明公开了一种主备控制板实时同步方法及系统,该方法包括:主用控制板对业务进行处理,将非同步数据存入本控制板的第一级数据缓冲区,将需要同步的数据存入与备用控制板共享的第二级数据缓冲区,并通过定时心跳与所述备用控制板进行通信,所述备用控制板仅与所述主用控制板通信;所述备用控制板通过主备用判决切换成主用工作状态,使能对所述第二级数据缓冲区的读写,原所述主用控制板则不再对所述第二级数据缓冲区进行读写。本发明至少具有如下有益效果:重塑主备同步过程,有效避免耗时的批量同步,替换系统开销较大的实时备份操作,简化平滑过程,保证主切换过程中的业务处理的顺利过度,提高系统的稳定性和可靠性。

    一种多模态数据的融合方法、系统及存储介质

    公开(公告)号:CN115545093A

    公开(公告)日:2022-12-30

    申请号:CN202211107885.6

    申请日:2022-09-13

    Abstract: 本发明公开了一种多模态数据的融合方法、系统及存储介质,方法包括:获取多模态原始数据;对文本数据进行分词编码操作,结合卷积神经网络提取得到预设维度的文本特征;对语音数据进行端点检测,结合语音特征提取工具包提取得到预设维度的语音特征;对视频数据进行序列化处理,结合循环神经网络提取得到预设维度的视频特征;对文本特征、语音特征和视频特征进行对齐拼接处理,得到预设通道的特征向量;根据特征向量,通过多核分类模型进行线性连接,得到多模态特征分类结果。本发明能够实现对文本、语音和视觉的多模态数据的统一特征提取和融合,从而促进从单模态数据到多模态数据的分析和应用,可广泛应用于数据处理技术领域。

    一种声音数据库构建及智能检索方法、系统及存储介质

    公开(公告)号:CN115544297A

    公开(公告)日:2022-12-30

    申请号:CN202211162960.9

    申请日:2022-09-23

    Abstract: 本发明公开了一种声音数据库构建及智能检索方法、系统及存储介质,方法包括:获取原始音频数据;对原始音频数据进行数据预处理,得到声音元数据;根据原始音频数据和声音元数据,构建声音数据库及知识图谱;响应于目标对象的检索数据,基于声音数据库及知识图谱匹配返回检索结果;其中,检索数据包括检索文本和检索音频。本发明通过对原始音频数据的预处理,提取声音元数据;进而构建声音数据库及知识图谱,实现基于声音元数据以及原始音频数据声音检索的全文索引。通过声音数据库的创建,并基于知识图谱实现了基于元数据和音频数据的检索功能,能够实现包含多特性的声音检索技术,可广泛应用于数据检索技术领域。

Patent Agency Ranking