Patent search ap:("中国科学院自动化研究所") AND inv:"梁山" Page 1

1.

发明授权
一种骨传麦克风语音增强方法及装置、设备及存储介质有权

公开(公告)号：CN115862656B

公开(公告)日：2023-06-02

申请号：CN202310054459.9

申请日：2023-02-03

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 陶建华 , 聂帅 , 李冠君 , 易江燕

IPC: G10L21/0224 , G10L21/0232 , G10L19/26 , H04R1/08

Abstract: 本公开涉及一种骨传麦克风语音增强方法及装置、设备及存储介质，所述方法包括：获取两种频域信号，并根据预设的截止频率，对所述两种频域信号分别进行截取，得到两种截取后频域信号；对所述两种截取后频域信号分别进行半波整流，得到两种半波整流后时域信号；按照预设的中间频带，根据所述两种半波整流后时域信号确定融合因子；根据融合因子对所述两种截取后频域信号进行融合，得到骨传麦克风语音增强语音，根据预设的截止频率作为滤波器组，先对两种频域信号进行截取和融合，并通过半波整流对整体信号进行修正，实现对噪声的有效抑制，能够保留骨传导麦克风清晰的低频信号，同时对其缺失的中、高频信息进行补充，得到感知质量更高的音频信号。

2.

发明公开
语音分离方法和装置有权

公开(公告)号：CN105096961A

公开(公告)日：2015-11-25

申请号：CN201410189386.5

申请日：2014-05-06

Applicant: 华为技术有限公司 , 中国科学院自动化研究所

Inventor： 杨小洪 , 肖玮 , 梁山 , 刘文举

IPC: G10L21/0272 , G10L21/02 , G10L21/0208

Abstract: 本发明实施例提供一种语音分离方法和装置，本实施例语音分离方法，包括：通过获得第一信号，根据第一信号确定初始理想二值掩蔽矩阵，根据初始理想二值掩蔽矩阵，对第一信号进行谐波补偿，得到谐波补偿后的分离语音信号，根据谐波补偿后的分离语音信号，对第一信号和第二信号进行滤波，得到目标分离语音信号，从而减少目标分离语音信号中能量空洞的产生，抑制了目标分离语音信号的扭曲。

3.

发明公开
基于噪声更新因子的语音增强方法和装置有权

公开(公告)号：CN116403594A

公开(公告)日：2023-07-07

申请号：CN202310671651.2

申请日：2023-06-08

Applicant: 澳克多普有限公司 , 中国科学院自动化研究所

Inventor： 柯登峰 , 王运峰 , 聂帅 , 梁山 , 刘文举

IPC: G10L21/0208 , G10L25/84 , G10L25/27

Abstract: 本发明涉及一种基于噪声更新因子语音增强的方法和装置，该方法包括：获取带噪语音；对带噪语音进行傅里叶变换分解，得到带噪傅里叶系数；对带噪傅里叶系数进行特征提取，得到带噪Fbank特征；将带噪Fbank特征输入至预先训练的语音降噪模型，通过维纳滤波对带噪信号进行滤波，得到降噪后的目标语音信号的傅里叶系数；根据降噪后的目标语音傅里叶系数生成降噪后语音波形信号。本发明具有显著的性能提升，既能处理平稳噪声，又能应对非平稳噪声，生成的纯净语音质量较高，同时鲁棒性高，在各自声学场景中性能稳定，提升用户体验。

4.

发明公开
生成语音的检测方法、装置、电子设备及存储介质有权

公开(公告)号：CN113808579A

公开(公告)日：2021-12-17

申请号：CN202111383856.8

申请日：2021-11-22

Applicant: 中国科学院自动化研究所

Inventor： 易江燕 , 陶建华 , 傅睿博 , 聂帅 , 梁山

IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/26 , G10L25/30 , G10L25/60 , G06N3/04 , G06N3/08

Abstract: 本公开涉及一种生成语音的检测方法、装置、电子设备及存储介质，上述方法包括：获取待检测语音，并提取所述待检测语音的第一声学特征和第二声学特征；将所述第一声学特征输入语音识别模型，输出所述第一声学特征对应的文本序列；分别通过词嵌入模型与语音嵌入模型提取所述文本序列的词向量和音向量；对所述词向量和所述音向量进行拼接处理，得到第一融合特征，并将所述第一融合特征输入韵律节奏预测模型，输出韵律节奏特征；对所述第二声学特征和所述韵律节奏特征进行所述拼接处理，得到第二融合特征，并将所述第二融合特征输入语音检测模型，输出语音检测结果。

5.

发明公开
基于相位偏移检测的数字音频篡改取证方法有权

公开(公告)号：CN113178199A

公开(公告)日：2021-07-27

申请号：CN202110727936.4

申请日：2021-06-29

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 聂帅 , 陶建华 , 易江燕

IPC: G10L19/02 , G10L25/21 , G10L25/51

Abstract: 本发明提供基于相位偏移检测的数字音频篡改取证方法，包括：将待鉴别信号与时间标签做乘积，得到待鉴别信号的调制信号；再对所述待鉴别信号和所述调制信号进行短时傅里叶变换，得到鉴别信号功率谱和调制信号功率谱；应用所述鉴别信号功率谱和调制信号功率谱计算群延迟特征；对所述群延迟特征做均值计算，再应用均值计算结果做平滑计算，得到当前帧信号的相位信息；应用所述当前帧信号的相位信息计算动态阈值，在应用所述动态阈值和所述当前帧信号的相位信息来判定所述待鉴别信号是否被篡改。

6.

发明授权
麦克风阵列语音增强的方法、装置、电子设备及存储介质有权

公开(公告)号：CN113889137B

公开(公告)日：2022-04-01

申请号：CN202111473848.2

申请日：2021-12-06

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 梁山 , 陶建华 , 易江燕

IPC: G10L21/0216 , G10L21/0232

Abstract: 本申请涉及一种麦克风阵列语音增强的方法、装置、电子设备及存储介质，所述方法包括：通过麦克风阵列获取已知声源方向的待增强语音信号；提取所述待增强语音信号的频谱特征和方向相干特征；将所述待增强语音信号的频谱特征和方向相干特征输入预先训练好的语音增强网络中，得到所述待增强语音信号的增强后傅里叶系数；对所述待增强语音信号的增强后傅里叶系数进行逆傅里叶变换，得到增强后语音信号，本申请通过语音增强网络实现了波束形成的滤波操作，并且波束形成的权重系数基于数据驱动的监督性学习方法训练得到，更接近实际应用场景，以提高语音增强效果。

7.

发明授权
一种语音鉴伪与说话人识别联合建模的方法有权

公开(公告)号：CN113555023B

公开(公告)日：2022-01-11

申请号：CN202111098690.5

申请日：2021-09-18

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 陶建华 , 梁山 , 易江燕 , 傅睿博

IPC: G10L17/04 , G10L17/18 , G10L17/02 , G06N3/08 , G06N3/04

Abstract: 本发明提供一种语音鉴伪与说话人识别联合建模的方法及系统，其中方法包括：前端信号处理：把训练数据通过信号重采样统一到一个固定采样率，得到信号处理后的训练数据；特征提取：对信号处理后的训练数据的每帧信号提取Fbank特征；表示向量提取：通过滑窗的方式将训练数据的Fbank特征切分成若干长度为T的片段序列，再将片段序列输入可以识别说话人的深度学习网络，得到说话人片段表示向量，并构造帧级别说话人识别损失函数；语音鉴伪和说话人识别联合分类：定说话人识别网络的目标函数；定义语音鉴伪网路的目标函数；联合帧级别说话人识别损失函数、片段级别说话人识别目标函数和语音鉴伪目标函数三个函数进行联合优化。

8.

发明公开
一种语音鉴伪与说话人识别联合建模的方法有权

公开(公告)号：CN113555023A

公开(公告)日：2021-10-26

申请号：CN202111098690.5

申请日：2021-09-18

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 陶建华 , 梁山 , 易江燕 , 傅睿博

IPC: G10L17/04 , G10L17/18 , G10L17/02 , G06N3/08 , G06N3/04

Abstract: 本发明提供一种语音鉴伪与说话人识别联合建模的方法及系统，其中方法包括：前端信号处理：把训练数据通过信号重采样统一到一个固定采样率，得到信号处理后的训练数据；特征提取：对信号处理后的训练数据的每帧信号提取Fbank特征；表示向量提取：通过滑窗的方式将训练数据的Fbank特征切分成若干长度为T的片段序列，再将片段序列输入可以识别说话人的深度学习网络，得到说话人片段表示向量，并构造帧级别说话人识别损失函数；语音鉴伪和说话人识别联合分类：定义片段级别说话人识别目标函数；定义语音鉴伪目标函数；联合帧级别说话人识别损失函数、片段级别说话人识别目标函数和语音鉴伪目标函数三个目标进行联合优化。

9.

发明公开
篡改音频的检测方法、装置、电子设备及存储介质有权

公开(公告)号：CN113488070A

公开(公告)日：2021-10-08

申请号：CN202111048241.X

申请日：2021-09-08

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 陶建华 , 聂帅 , 易江燕

IPC: G10L25/24 , G10L25/18 , G10L25/51

Abstract: 本公开涉及一种篡改音频的检测方法、装置、电子设备及存储介质，上述方法包括：获取待检测信号，并对待检测信号进行第一预设阶数的小波变换，得到数量等于第一预设阶数的待检测信号对应的第一低频系数和第一高频系数；对阶数大于等于第二预设阶数的第一高频系数进行小波逆变换，得到待检测信号对应的第一高频分量信号；以帧为单位计算第一高频分量信号的第一梅尔倒谱特征，并将第一高频分量信号的当前帧信号和当前帧信号之前的预设数量的帧信号的第一梅尔倒谱特征融合，得到第一融合特征；通过深度学习模型对第一融合特征进行篡改音频检测。

10.

发明授权
基于相位偏移检测的数字音频篡改取证方法有权

公开(公告)号：CN113178199B

公开(公告)日：2021-08-31

申请号：CN202110727936.4

申请日：2021-06-29

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 聂帅 , 陶建华 , 易江燕

IPC: G10L19/02 , G10L25/21 , G10L25/51

Abstract: 本发明提供基于相位偏移检测的数字音频篡改取证方法，包括：将待鉴别信号与时间标签做乘积，得到待鉴别信号的调制信号；再对所述待鉴别信号和所述调制信号进行短时傅里叶变换，得到鉴别信号功率谱和调制信号功率谱；应用所述鉴别信号功率谱和调制信号功率谱计算群延迟特征；对所述群延迟特征做均值计算，再应用均值计算结果做平滑计算，得到当前帧信号的相位信息；应用所述当前帧信号的相位信息计算动态阈值，在应用所述动态阈值和所述当前帧信号的相位信息来判定所述待鉴别信号是否被篡改。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification