基于深度学习的多模态数据融合身份认证与安全监控系统

    公开(公告)号:CN120048010A

    公开(公告)日:2025-05-27

    申请号:CN202510113075.9

    申请日:2025-01-24

    Inventor: 段艺博 丁卓

    Abstract: 本发明涉及身份识别技术领域,具体涉及一种基于深度学习的多模态数据融合身份认证与安全监控系统;包括身份认证模块、实时分析模块和远程控制模块,身份认证模块用于,收集用户的面部图像、声音以及行为模式多模态数据,并进行多模态数据融合,输出用户的身份认证数据;实时分析模块用于,分别收集实时的视频数据及音频数据,并融合画面检测数据和声音检测数据,输出实时异常行为数据;远程控制模块用于,存储身份认证数据和实时异常行为数据,并采用远程访问的方式传输数据;通过上述方式,实现提高在分析时提高识别精度,减少受环境因素的干扰,从而提高整体身份认证系统的安全性和用户体验。

    匿名说话人身份验证溯源系统
    2.
    发明公开

    公开(公告)号:CN119479656A

    公开(公告)日:2025-02-18

    申请号:CN202411649065.9

    申请日:2024-11-19

    Abstract: 本发明涉及声纹识别技术领域,尤其涉及一种匿名说话人身份验证溯源系统,包括音频输入模块、预处理模块、伪造音频检测模块、声纹溯源模块、身份及匿名技术确认模块、正常音频处理模块和身份验证模块,预处理模块与音频输入模块连接,伪造音频检测模块与预处理模块连接,声纹溯源模块和正常音频处理模块均与伪造音频检测模块连接,身份及匿名技术确认模块和身份验证模块分别与声纹溯源模块和正常音频处理模块连接,以此方式解决了现有技术中声纹认证系统在常环境下表现良好,但缺乏足够的机制来识别和防御经过高级匿名技术处理的声音,进而存在伪造音频的检测能力不足、缺乏溯源能力和适应性和灵活性不足的问题的技术问题。

    一种基于freeswitch呼叫中心的音频流识别推送系统

    公开(公告)号:CN119052362A

    公开(公告)日:2024-11-29

    申请号:CN202411025522.7

    申请日:2024-07-30

    Inventor: 周坤坤 丁卓

    Abstract: 本发明涉及通信技术领域,具体涉及一种基于freeswitch呼叫中心的音频流识别推送系统;包括音频流数据接收模块、音频流预处理模块、音频流识别推送模块、结果推送模块和集成模块;音频流数据接收模块用于接收音频流数据;音频流预处理模块用于对接收到的音频流数据进行预处理,去除音频流中的噪声和干扰;音频流识别推送模块用于对预处理后的音频流数据进行识别,将语音信息数据转换为文字信息数据,得到识别结果;结果推送模块用于将识别结果推送至终端设备,进行结果的实时传输和共享,通过上述方式,获得提高freeswitch呼叫中心的音频流传输效果和质量的效果。

    基于PANNs结构的口吃类型检测方法

    公开(公告)号:CN118969014A

    公开(公告)日:2024-11-15

    申请号:CN202411194757.9

    申请日:2024-08-29

    Inventor: 谭涛 丁卓 邵曦

    Abstract: 本发明涉及医疗检测技术领域,具体涉及一种基于PANNs结构的口吃类型检测方法,包括:获取原始训练数据并进行各种变换处理,生成具有多样性的训练数据,以增加训练数据的多样性,将具有多样性的训练数据置入PANNs‑CNN14模型中对PANNs‑CNN14模型进行预训练,基于预训练好的PANNs‑CNN14模型来提取声音的深层特征,精准的识别和分类不同的口吃类型,将PANNs‑CNN14模型输出进行解码转换为二进制标签,获得具体的口吃事件标签,完成对口吃事件的分类和识别,达到了不依赖于特定语言的语音识别特性,可以适应各种语言的音频数据,提高了系统的通用性和适应性的效果。

    一种用于提高数据传输安全的隐私计算方法及系统

    公开(公告)号:CN118842584A

    公开(公告)日:2024-10-25

    申请号:CN202411116875.8

    申请日:2024-08-15

    Inventor: 李朋程 丁卓

    Abstract: 本发明涉及计算机技术领域,具体公开了一种用于提高数据传输安全的隐私计算方法及系统,包括数据混淆模块、数据传输模块和扩展加密算法模块,数据混淆模块生成盐值和秘钥,确保数据的混淆性和完整性,数据传输模块负责保障数据传输过程的完整性和安全性,对请求参数和请求结果进行加密,同时采用不可逆的加密算法,扩展加密算法模块通过增加秘钥长度、轮数和修改轮函数来提高加密强度。使用AES扩展算法对传输的数据进行加密,确保数据在传输过程中即使被截获也无法阅读,每个消息都使用不同的盐值,并且使用密钥进行计算,使得攻击者无法轻易预测盐值或破解密钥,保证加密数据的混淆性和不可逆性。

    一种拓展孔径双麦克风阵列宽带无模糊DOA估计方法

    公开(公告)号:CN118707439A

    公开(公告)日:2024-09-27

    申请号:CN202410837353.0

    申请日:2024-06-26

    Abstract: 本发明提出了一种拓展孔径双麦克风阵列宽带无模糊DOA估计方法,针对麦克风阵列拓展孔径产生相位模糊的问题,在用窄带MUSIC算法估计宽带信号声源DOA的任务上给出了基于聚类的解模糊方案。以开始出现相位模糊的频率点为界限,将整个频带分为两部分。对于无相位模糊的部分频率点,直接用窄带MUSIC算法估计信号的MUSIC谱,读取峰值坐标为当前频率点信号DOA估计结果;并用这部分频带信号的估计结果初始化聚类中心,引导存在相位模糊的部分频率点,对存在伪峰的谱函数进行修正,从修正后的谱函数上读取峰值坐标为当前频率点信号估计结果。从而实现全频带的无模糊DOA估计。该方法使得双麦克风阵列能够藉由拓展阵列孔径获得更准确的DOA估计结果。

    一种基于自适应步长LMS滤波器的广义旁瓣消除方法

    公开(公告)号:CN118571244A

    公开(公告)日:2024-08-30

    申请号:CN202410615296.1

    申请日:2024-05-17

    Abstract: 本发明提出了一种基于自适应步长最小均方误差滤波器的广义旁瓣消除方法,根据基于循环插值的双通道互相关算法和宽带MUSIC算法,利用麦克风阵列从音频中收集目标语音的波达方向信息,根据波达方向信息补偿麦克风阵列各通道音频间的时延,并将时延补偿后的音频在时频域上表示,作为波束形成部分的输入,分别计算时延补偿后的音频通过固定波束形成滤波器和阻塞矩阵后得到的固定波束形成结果和多路参考噪声信号;估计音频中噪声的功率谱密度。最后计算固定波束形成器输出和噪声抑制后的参考噪声的残差,作为当前帧算法的输出;再将该输出反馈给噪声抑制滤波器,计算下一帧噪声抑制滤波器的权值,从而消除残留的旁瓣噪声,达到降噪的目的。

    一种车载情境感知语音交互系统
    8.
    发明公开

    公开(公告)号:CN118484161A

    公开(公告)日:2024-08-13

    申请号:CN202410552355.5

    申请日:2024-05-07

    Inventor: 赵胜 丁卓 段艺博

    Abstract: 本发明涉及通信技术领域,具体涉及一种车载情境感知语音交互系统;包括情感识别模块、环境感知模块、自适应反馈生成模块和交互历史管理模块,情感识别模块和环境感知模块分别与自适应反馈生成模块连接,自适应反馈生成模块与交互历史管理模块连接;情感识别模块用于分析驾驶者的情感状态;环境感知模块用于获取车辆内外部环境信息;自适应反馈生成模块用于根据驾驶者的情感状态和车辆内外部环境信息生成自适应的语音反馈;交互历史管理模块用于维护交互历史记录,通过上述结构,实现根据车辆内外部环境和驾驶者情绪,自适应地调整语音交互。

    基于情绪识别的伪造音频检测方法

    公开(公告)号:CN117059131B

    公开(公告)日:2024-03-29

    申请号:CN202311324794.2

    申请日:2023-10-13

    Inventor: 陈卓越 丁卓

    Abstract: 本发明涉及音频分析技术领域,具体涉及一种基于情绪识别的伪造音频检测方法;建立语音情绪识别系统,建立合成语音检测系统,使用语音情绪识别系统和合成语音检测系统对伪造音频进行检测,在建立语音情绪识别系统的步骤中:选择情感语音语料库,进行语音输入的预处理和转换,从语音中提取情感特定特征,使用分类模型来识别情感,在建立合成语音检测系统的步骤中:合成语音检测系统由二值分类器组成,以特征向量Fx作为输入,估计输入信号所属的类别,使用标准的34层残差网络,使用多头注意力池来学习假音频和欺骗检测的判别嵌入,利用神经拼接来提高模型的泛化能力,通过上述方式,实现更加全面地检测伪造音频。

Patent Agency Ranking