一种基于性别和语言的说话人识别方法及系统

    公开(公告)号:CN114360551B

    公开(公告)日:2025-04-11

    申请号:CN202210014706.8

    申请日:2022-01-07

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于性别和语言的说话人识别方法及系统,属于说话人识别领域。包括:获取待识别语音数据,具体为包含有效说话人音频的音频文件;将音频文件通过降噪处理得到低噪声的语音音频;将降噪后的语音音频通过SMAC特征提取得到语音频谱特征图;将语音频谱特征图输入ResNet模型中得到语音特征向量;将语音特征向量输入到多目标学习模型中,识别得到说话人身份、说话人性别以及说话人使用的语言信息;通过将三个识别任务结果进行加权融合,得到待识别语音数据对应的说话人识别结果。本发明综合利用了语音中带有的性别信息和语言信息,有效的提高了说话认识别的鲁棒性,特别是在说话人语音变化的情况下,识别精度高。

    基于对抗样本生成的高保真语音脱敏方法和装置

    公开(公告)号:CN115083426B

    公开(公告)日:2025-02-14

    申请号:CN202210629015.9

    申请日:2022-06-06

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于对抗样本生成技术的高保真语音脱敏方法和装置,属于数据隐私保护领域。通过将受保护者音频输入对抗式生成网络脱敏模型,输出音频能在保持原来语义内容的前提下,改变音频中的声纹特征,进而使得人工智能说话人识别模型无法通过输入音频判断说话者身份,实现脱除原始说话人身份信息的效果。该脱敏模型的训练主要通过最小化对抗式生成网络中的生成器以及鉴别器损失以达到训练目的。在具体应用场景中,说话者可以先将自己的音频经已训练好的脱敏模型处理,而后将生成的音频提供给外界,而不泄露自己的身份,达到保护个人隐私的目的。

    一种具有隐私保护功能的麦克风及其隐私保护方法

    公开(公告)号:CN116825117B

    公开(公告)日:2024-06-21

    申请号:CN202310858785.5

    申请日:2023-07-13

    Applicant: 浙江大学

    Abstract: 本发明公开了一种具有隐私保护功能的麦克风及其隐私保护方法,属于语音隐私保护领域。本发明通过对麦克风内传感器模块输出的数字语音信号进行特征提取和共振峰转换,重建语音信号来防止恶意第三方利用该麦克风录制的音频进行隐私信息挖掘(例如,声纹识别),同时保证该麦克风录制的音频不影响语音内容识别。本发明将隐私保护嵌入麦克风硬件模块中,相比于已有的隐私保护方法,安全性高,嵌入麦克风固件中的音频编码器难以被获取;易于部署,算法轻量化,占用内存和计算资源少。

    一种基于不自然性的语音对抗样本检测方法

    公开(公告)号:CN118155656A

    公开(公告)日:2024-06-07

    申请号:CN202410344084.4

    申请日:2024-03-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于不自然性的语音对抗样本检测方法,属于智能语音系统中的语音识别模型安全技术领域。获取对抗音频与不自然性相关的共性特征,包括时域信号不连续、频域信号不连续、时域信号不规律;针对每一种共性特征,计算良性、对抗音频样本的不自然性相关声学‑统计特征;利用良性、对抗音频样本的声学‑统计特征训练随机森林模型作为预处理模型,用于特征筛选;根据特征筛选后的良性音频样本与对抗音频样本的声学‑统计特征训练分类器;提取待测音频样本的特征筛选后的声学‑统计特征,基于训练后的分类器得到识别结果。本发明基于不自然性相关的共性特征,采用轻量化分类器,实现了基于自然度评估的语音对抗样本检测。

    一种针对语音对抗攻击的语音自然度评估方法

    公开(公告)号:CN118155655A

    公开(公告)日:2024-06-07

    申请号:CN202410344082.5

    申请日:2024-03-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种针对语音对抗攻击的语音自然度评估方法,属于智能语音系统中的语音识别模型安全技术领域。获取对抗音频共性特征并筛选得到与不自然性相关的共性特征,包括时域信号不连续、频域信号不连续、时域信号不规律、频域信号不规律、语音模式异常;针对每一种共性特征,计算良性语音样本与测试语音的不自然性相关声学‑统计特征;根据良性语音样本的不自然性相关声学‑统计特征设计语音自然度指标,语音自然度指标的基准值为良性语音样本的不自然性相关声学‑统计特征的概率密度分布;根据语音自然度指标的基准值,计算测试语音的自然度分数。本发明通过对语音样本的自然度进行评估,可以量化测试语音与人类正常语音之间的相似度。

    一种电容式触摸屏异常触碰检测方法及装置

    公开(公告)号:CN114546162B

    公开(公告)日:2024-04-09

    申请号:CN202210066463.2

    申请日:2022-01-20

    Applicant: 浙江大学

    Abstract: 本发明公开了一种电容式触摸屏异常触碰检测方法及装置,属于传感器异常检测领域。步骤1:对设备屏幕划分触摸区域,获取不同区域在正常触摸下的触摸点数据,包括触摸的起始时间及对应的压力值;步骤2:对触摸点数据进行特征提取,获得有效触摸点特征分布;步骤3:在设备屏幕的正常使用过程中,获取触摸点的所在区域、起始间隔和压力值,进行有效性检测,若属于有效触摸点,则屏幕正常响应,若属于无效触摸点,则对该触摸点进行阻断,屏幕不响应。该异常检测方法及装置可以检测到由于环境噪声导致的假触摸点,并进行阻断,保证手机等智能设备的安全性和用户体验。

    一种基于数据特征统计学分布的智能模型逆向工程方法

    公开(公告)号:CN117744757A

    公开(公告)日:2024-03-22

    申请号:CN202311781128.1

    申请日:2023-12-22

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于数据特征统计学分布的智能模型逆向工程方法,涉及人工智能(AI)和机器学习(ML)领域,该方法可实现在缺乏训练数据时,从已经训练好的模型中恢复训练数据,并用于知识蒸馏。本发明方法通过反演一个已经训练好的网络,在无需使用任何有关训练数据集的额外信息的情况下,保持教师模型固定,通过知识蒸馏训练学生模型,优化输入,在DeepDream方法的基础上,正则化深度反演利用教师模型的批归一化层中存储的信息对正则化项进行改进。此外,自适应深度反演通过最大化教师模型和学生模型逻辑输出之间的JS散度,提高图像的多样性,增强正则化深度反演的效果,进一步优化图像,从而实现相比DeepDream而言更好的效果。

    一种安全驾驶监控方法、系统及可存储介质

    公开(公告)号:CN114212093B

    公开(公告)日:2024-03-12

    申请号:CN202111495952.1

    申请日:2021-12-08

    Applicant: 浙江大学

    Abstract: 本发明公开了一种安全驾驶监控方法、系统及可存储介质,涉及安全驾驶技术领域,该方法包括:通过智能手机的声学传感器和惯性测量单元,采集声学传感器信号和IMU信号;基于所述IMU信号中固定时间段内波峰和波谷对应关系,判断车辆状态,即正常驾驶、变道、转弯、离开环岛;基于所述声学传感器信号,并利用多普勒轮廓和深度神经网络对不同车辆状态时驾驶员的分心驾驶行为、后视镜检查行为进行检测,获取检测结果。本发明针对现有分心驾驶检测技术的缺陷进行改进,解决了现有检测技术中侵犯用户隐私及微小转动难以检测等问题,提高了分心驾驶识别精度的同时能够保障用户隐私。

    一种基于电子设备陶瓷电容发声的麦克风语音注入方法

    公开(公告)号:CN114301569B

    公开(公告)日:2024-02-20

    申请号:CN202111659734.7

    申请日:2021-12-30

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于电子设备陶瓷电容发声的麦克风语音注入方法,通过在电子设备上运行一段程序,使电子设备内部的陶瓷电容两端电压发生变化,并由陶瓷电容的逆压电效应转化为机械振动,从而产生语音信号并注入到麦克风中。本发明采用脉宽调制方式将语音信号调制到超声波,并利用麦克风的非线性作用自动解调,实现了不可听的麦克风语音注入。本发明可用于被监听状态下的隐蔽通信,如敏感语音信号传输、机密信息传输等。

Patent Agency Ranking