一种基于性别和语言的说话人识别方法及系统

    公开(公告)号:CN114360551B

    公开(公告)日:2025-04-11

    申请号:CN202210014706.8

    申请日:2022-01-07

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于性别和语言的说话人识别方法及系统,属于说话人识别领域。包括:获取待识别语音数据,具体为包含有效说话人音频的音频文件;将音频文件通过降噪处理得到低噪声的语音音频;将降噪后的语音音频通过SMAC特征提取得到语音频谱特征图;将语音频谱特征图输入ResNet模型中得到语音特征向量;将语音特征向量输入到多目标学习模型中,识别得到说话人身份、说话人性别以及说话人使用的语言信息;通过将三个识别任务结果进行加权融合,得到待识别语音数据对应的说话人识别结果。本发明综合利用了语音中带有的性别信息和语言信息,有效的提高了说话认识别的鲁棒性,特别是在说话人语音变化的情况下,识别精度高。

    一种基于不自然性的语音对抗样本检测方法

    公开(公告)号:CN118155656A

    公开(公告)日:2024-06-07

    申请号:CN202410344084.4

    申请日:2024-03-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于不自然性的语音对抗样本检测方法,属于智能语音系统中的语音识别模型安全技术领域。获取对抗音频与不自然性相关的共性特征,包括时域信号不连续、频域信号不连续、时域信号不规律;针对每一种共性特征,计算良性、对抗音频样本的不自然性相关声学‑统计特征;利用良性、对抗音频样本的声学‑统计特征训练随机森林模型作为预处理模型,用于特征筛选;根据特征筛选后的良性音频样本与对抗音频样本的声学‑统计特征训练分类器;提取待测音频样本的特征筛选后的声学‑统计特征,基于训练后的分类器得到识别结果。本发明基于不自然性相关的共性特征,采用轻量化分类器,实现了基于自然度评估的语音对抗样本检测。

    一种针对语音对抗攻击的语音自然度评估方法

    公开(公告)号:CN118155655A

    公开(公告)日:2024-06-07

    申请号:CN202410344082.5

    申请日:2024-03-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种针对语音对抗攻击的语音自然度评估方法,属于智能语音系统中的语音识别模型安全技术领域。获取对抗音频共性特征并筛选得到与不自然性相关的共性特征,包括时域信号不连续、频域信号不连续、时域信号不规律、频域信号不规律、语音模式异常;针对每一种共性特征,计算良性语音样本与测试语音的不自然性相关声学‑统计特征;根据良性语音样本的不自然性相关声学‑统计特征设计语音自然度指标,语音自然度指标的基准值为良性语音样本的不自然性相关声学‑统计特征的概率密度分布;根据语音自然度指标的基准值,计算测试语音的自然度分数。本发明通过对语音样本的自然度进行评估,可以量化测试语音与人类正常语音之间的相似度。

    一种基于图像信号处理器参数优化的隐私保护方法

    公开(公告)号:CN116320713A

    公开(公告)日:2023-06-23

    申请号:CN202310196874.8

    申请日:2023-03-03

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于图像信号处理器参数优化的隐私保护方法,该方法利用现有摄像头中图像信号处理器自身参数的优化,来防止恶意第三方利用该摄像头拍摄的图像进行隐私信息挖掘(例如,人脸识别),但是在同一组图像信号处理器参数下,该摄像头所拍摄的画面仍然可以被一些隐私不敏感的算法识别。本发明方法将隐私保护嵌入图像生成过程中,相比于已有的隐私保护方法,主要优势在于:不需额外的硬件和软件,仅需改造已有摄像头的图像信号处理器参数;摄像头与图像识别所用的处理器形成地址空间隔离,被恶意篡改的可能性大大降低;图像信号处理器是现代摄像头模组的必要组成部分,该方法适用于大多数现存摄像头模组的隐私保护。

    一种基于流量捕捉的网络摄像头非法拍摄检测方法

    公开(公告)号:CN115085978B

    公开(公告)日:2023-03-14

    申请号:CN202210578983.1

    申请日:2022-05-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于流量捕捉的网络摄像头非法拍摄检测方法,涉及信息安全技术领域。所述方法包括:向空间内发射周期性光信号,获取检测空间内的数据流量,对捕获数据包进行筛选,确定空间内的包含光源的摄像头流量。本发明能够有效检测网络摄像头对目标的拍摄行为,检测结果具有极高的准确性,保护关键设备信息隐私安全。

    一种基于流量分析的网络摄像头非法安装及占用检测方法

    公开(公告)号:CN115085979A

    公开(公告)日:2022-09-20

    申请号:CN202210598824.8

    申请日:2022-05-30

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于流量分析的网络摄像头非法安装及占用检测方法,涉及信息安全技术领域。所述方法包括:路由器实时检测数据流量,对捕获数据包进行筛选,确定是否含有用户摄像头流量。与此同时,通过手机APP询问用户是否正在调用摄像头。若确定非用户本人调用,则认为网络摄像头被非法控制,并立即切断其数据上传。同时路由器也可以根据检测到的数据流量判断是否存在用户未知的摄像头。本发明能够有效检测网络摄像头被非法控制的情况,检测结果具有极高的准确性,保护关键设备信息隐私安全。

    一种基于声波触发的可触发对抗补丁生成方法

    公开(公告)号:CN114363509B

    公开(公告)日:2022-09-20

    申请号:CN202111485223.8

    申请日:2021-12-07

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于声波触发的可触发对抗补丁生成方法,该方法利用现有机器视觉系统中惯性传感器和深度学习算法的脆弱性,使用声波构造适用于物理世界的模糊噪声,创新性地提出利用该模糊噪声触发当前场景中存在的可触发对抗补丁,从而欺骗机器视觉系统。相比于现有基于数字域的图像对抗补丁构造方法,本发明方法构造的声波可触发对抗补丁在真实物理世界中具有更强的实时操纵性;相比于现有基于物理域的纯模糊图像对抗样本构造方法,本发明方法借助对抗补丁极大降低了对于模糊噪声的操纵要求,具有更强的通用性和可行性。

    一种物理可实现的激光雷达3D点云对抗样本生成方法及系统

    公开(公告)号:CN114282437A

    公开(公告)日:2022-04-05

    申请号:CN202111590826.4

    申请日:2021-12-23

    Applicant: 浙江大学

    Abstract: 本发明公开了一种物理可实现的激光雷达3D点云对抗样本生成方法及系统,属于对抗机器学习技术领域。通过获取包含目标区域的原始3D点云数据,根据激光雷达点云的物理规律建模;在目标区域的球坐标范围内随机注入预设数量的对抗点;设计“目标隐藏攻击”损失函数和“目标创建攻击”损失函数,代入到云对抗样本仿真模型中,优化随机注入的对抗点的坐标信息,将点云对抗样本仿真模型的最优输出作为最终生成的3D点云对抗样本。本发明利用现有的3D点云目标检测器的脆弱性,创新性地对激光雷达采集点云数据满足的物理规律进行建模,以构造物理可实现的面向两种不同类型的3D点云对抗样本,为机器学习安全分析与防护提供了新的指导。

    一种基于超声波的音频定点投放方法

    公开(公告)号:CN109345276B

    公开(公告)日:2022-02-11

    申请号:CN201810893879.5

    申请日:2018-08-07

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于超声波的音频定点投放方法,采用将音频信号调制到超声波信号上,通过两个超声波阵列发出,利用超声波在空气中的互解调效应,实现音频定点投放。与现有全方向性音频投放方法相比,该方法利用了超声波的定向性,可以实现特定位置的音频投放,避免对其余位置的用户进行干扰。与现有基于超声波的音频投放方法相比,该方法通过两个超声波阵列调制不同超声波信号,实现音频定点投放而非传统的定向投放,且避免了传统定向投放存在的音频泄露问题,从而提高了用户体验。

Patent Agency Ranking