Patent search ap:("浙江大学") AND inv:"王宇炜" Page 1

1.

发明公开
基于硬件特性的非线性注入攻击检测方法与装置审中-实审

公开(公告)号：CN115862670A

公开(公告)日：2023-03-28

申请号：CN202211399084.1

申请日：2022-11-09

Applicant: 浙江大学杭州国际科创中心

Inventor： 巴钟杰 , 龚斌 , 程鹏 , 王宇炜 , 卢立 , 林峰 , 刘振广 , 任奎

IPC: G10L25/18 , G10L25/51 , G10L21/0264

Abstract: 本发明公开了一种基于硬件特性的非线性注入攻击检测方法与装置，其中，检测方法包括以下步骤：(1)对采集的待测音频做语音活动检测，并将待测音频按语音部分进行切分，剔除无语音部分后得到多个语音片段；(2)对于每一个语音片段，同时进行欠采样音频检测与异常白噪声检测；若存在与常规语音部分相似的欠采样音频和/或存在与语音能量高度相关的近似白噪声，则判定该语音片段由非线性注入，并对用户发出警告。本发明中，检测方法可以直接部署于智能设备上，检测装置可以部署于智能设备附近，均可独立完成检测工作，可以为语音助手用户提供便捷、普适、无法规避的非线性注入攻击检测方案。

2.

发明授权
一种基于语义空间扰动的语音识别模型安全性测评方法有权

公开(公告)号：CN116758899B

公开(公告)日：2023-10-13

申请号：CN202311008778.2

申请日：2023-08-11

Applicant: 浙江大学

Inventor： 巴钟杰 , 王宇炜 , 程鹏 , 黄鹏 , 林峰 , 卢立 , 任奎

IPC: G10L15/01 , G10L15/07 , G10L15/16 , G10L15/18 , G10L15/22 , G10L25/18

Abstract: 本发明公开了一种基于语义空间扰动的语音识别模型安全性测评方法，包括（1）选择目标指令，将指令文本输入给预训练语音合成模型获得命令的原始语义特征、原始梅尔频谱和原始对齐信息；（2）初始化特征扰动为0；（3）将特征扰动加到命令的原始语义特征上，将加扰后的语义特征输入给语音合成模型的解码器，获得新的梅尔频谱和新的对齐信息；（4）将获得的梅尔频谱进行模糊化，并输入声码器获得音频；（5）将音频输入给待测目标语音识别模型获得识别结果；（6）如果识别结果和目标命令相同则保留音频；（7）计算损失并更新特征扰动；（8）回到步骤（3）直到扰动超过阈值或到达最大迭代次数；（9）检查最终是否通过步骤（6）保留了音频。

3.

发明公开
一种基于语义空间扰动的语音识别模型安全性测评方法有权

公开(公告)号：CN116758899A

公开(公告)日：2023-09-15

申请号：CN202311008778.2

申请日：2023-08-11

Applicant: 浙江大学

Inventor： 巴钟杰 , 王宇炜 , 程鹏 , 黄鹏 , 林峰 , 卢立 , 任奎

IPC: G10L15/01 , G10L15/07 , G10L15/16 , G10L15/18 , G10L15/22 , G10L25/18

Abstract: 本发明公开了一种基于语义空间扰动的语音识别模型安全性测评方法，包括（1）选择目标指令，将指令文本输入给预训练语音合成模型获得命令的原始语义特征、原始梅尔频谱和原始对齐信息；（2）初始化特征扰动为0；（3）将特征扰动加到命令的原始语义特征上，将加扰后的语义特征输入给语音合成模型的解码器，获得新的梅尔频谱和新的对齐信息；（4）将获得的梅尔频谱进行模糊化，并输入声码器获得音频；（5）将音频输入给待测目标语音识别模型获得识别结果；（6）如果识别结果和目标命令相同则保留音频；（7）计算损失并更新特征扰动；（8）回到步骤（3）直到扰动超过阈值或到达最大迭代次数；（9）检查最终是否通过步骤（6）保留了音频。

4.

发明公开
基于跨领域自适应的深度伪造语音检测方法审中-实审

公开(公告)号：CN116153331A

公开(公告)日：2023-05-23

申请号：CN202211533985.5

申请日：2022-12-01

Applicant: 浙江大学嘉兴研究院

Inventor： 巴钟杰 , 温晴 , 程鹏 , 王宇炜 , 林峰 , 卢立 , 刘振广 , 任奎

IPC: G10L25/48 , G10L25/30 , G10L25/03

Abstract: 本发明公开了一种基于跨领域自适应的深度伪造语音检测方法及装置，涉及语音检测技术领域。该方法包括：获取跨语种音频数据集；从跨语种音频数据集随机抽取的包含源语种及目标语种真伪音频数据的N个音频数据输入至特征提取器进行音频特征提取；将音频特征分别输入至真伪分类器、语种分类器、差异测量器，计算得到真伪分类损失参数、语种分类损失参数和语种间特征差异损失参数；根据真伪分类损失参数、语种分类损失参数和语种间特征差异损失参数，以减小总损失为优化目标，采用优化算法对神经网络模型进行参数优化及更新；重复上述步骤得到深度伪造语音检测模型，通过该深度伪造语音检测模型可实现对不同语种待测音频数据真伪的精确识别。

Patent Agency Ranking