Patent search ap:("中国科学院自动化研究所") AND inv:"梁山" Page 2

11.

发明公开
基于相位偏移检测的数字音频篡改取证方法有权

公开(公告)号：CN113178199A

公开(公告)日：2021-07-27

申请号：CN202110727936.4

申请日：2021-06-29

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 聂帅 , 陶建华 , 易江燕

IPC: G10L19/02 , G10L25/21 , G10L25/51

Abstract: 本发明提供基于相位偏移检测的数字音频篡改取证方法，包括：将待鉴别信号与时间标签做乘积，得到待鉴别信号的调制信号；再对所述待鉴别信号和所述调制信号进行短时傅里叶变换，得到鉴别信号功率谱和调制信号功率谱；应用所述鉴别信号功率谱和调制信号功率谱计算群延迟特征；对所述群延迟特征做均值计算，再应用均值计算结果做平滑计算，得到当前帧信号的相位信息；应用所述当前帧信号的相位信息计算动态阈值，在应用所述动态阈值和所述当前帧信号的相位信息来判定所述待鉴别信号是否被篡改。

12.

发明授权
语音控制方法、装置、电子设备及存储介质有权

公开(公告)号：CN113436629B

公开(公告)日：2024-06-04

申请号：CN202110997178.8

申请日：2021-08-27

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 陶建华 , 梁山 , 易江燕 , 傅睿博

IPC: G10L15/22 , G10L15/14 , G10L15/06

Abstract: 本申请涉及一种语音控制方法、装置、电子设备及存储介质，所述语音控制方法，包括以下步骤：获取已知唤醒词的音节；确定与所述唤醒词对应的非唤醒词的音节；根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络，以根据所述唤醒词解码网络对输入的语音进行解码，并根据解码结果确定是否执行唤醒操作，本申请在解码网络中引入非唤醒词的音节从而统一描述非唤醒词，能够降低非唤醒词引起的误唤醒率。

13.

发明授权
基于噪声更新因子的语音增强方法和装置有权

公开(公告)号：CN116403594B

公开(公告)日：2023-08-18

申请号：CN202310671651.2

申请日：2023-06-08

Applicant: 澳克多普有限公司 , 中国科学院自动化研究所

Inventor： 柯登峰 , 王运峰 , 聂帅 , 梁山 , 刘文举

IPC: G10L21/0208 , G10L25/84 , G10L25/27

Abstract: 本发明涉及一种基于噪声更新因子语音增强的方法和装置，该方法包括：获取带噪语音；对带噪语音进行傅里叶变换分解，得到带噪傅里叶系数；对带噪傅里叶系数进行特征提取，得到带噪Fbank特征；将带噪Fbank特征输入至预先训练的语音降噪模型，通过维纳滤波对带噪信号进行滤波，得到降噪后的目标语音信号的傅里叶系数；根据降噪后的目标语音傅里叶系数生成降噪后语音波形信号。本发明具有显著的性能提升，既能处理平稳噪声，又能应对非平稳噪声，生成的纯净语音质量较高，同时鲁棒性高，在各自声学场景中性能稳定，提升用户体验。

14.

发明授权
生成语音的检测方法、装置、电子设备及存储介质有权

公开(公告)号：CN113808579B

公开(公告)日：2022-03-08

申请号：CN202111383856.8

申请日：2021-11-22

Applicant: 中国科学院自动化研究所

Inventor： 易江燕 , 陶建华 , 傅睿博 , 聂帅 , 梁山

IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/26 , G10L25/30 , G10L25/60 , G06N3/04 , G06N3/08

Abstract: 本公开涉及一种生成语音的检测方法、装置、电子设备及存储介质，上述方法包括：获取待检测语音，并提取所述待检测语音的第一声学特征和第二声学特征；将所述第一声学特征输入语音识别模型，输出所述第一声学特征对应的文本序列；分别通过词嵌入模型与语音嵌入模型提取所述文本序列的词向量和音向量；对所述词向量和所述音向量进行拼接处理，得到第一融合特征，并将所述第一融合特征输入韵律节奏预测模型，输出韵律节奏特征；对所述第二声学特征和所述韵律节奏特征进行所述拼接处理，得到第二融合特征，并将所述第二融合特征输入语音检测模型，输出语音检测结果。

15.

发明公开
麦克风阵列语音增强的方法、装置、电子设备及存储介质有权

公开(公告)号：CN113889137A

公开(公告)日：2022-01-04

申请号：CN202111473848.2

申请日：2021-12-06

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 梁山 , 陶建华 , 易江燕

IPC: G10L21/0216 , G10L21/0232

Abstract: 本申请涉及一种麦克风阵列语音增强的方法、装置、电子设备及存储介质，所述方法包括：通过麦克风阵列获取已知声源方向的待增强语音信号；提取所述待增强语音信号的频谱特征和方向相干特征；将所述待增强语音信号的频谱特征和方向相干特征输入预先训练好的语音增强网络中，得到所述待增强语音信号的增强后傅里叶系数；对所述待增强语音信号的增强后傅里叶系数进行逆傅里叶变换，得到增强后语音信号，本申请通过语音增强网络实现了波束形成的滤波操作，并且波束形成的权重系数基于数据驱动的监督性学习方法训练得到，更接近实际应用场景，以提高语音增强效果。

16.

发明公开
语音控制方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN113436629A

公开(公告)日：2021-09-24

申请号：CN202110997178.8

申请日：2021-08-27

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 陶建华 , 梁山 , 易江燕 , 傅睿博

IPC: G10L15/22 , G10L15/14 , G10L15/06

Abstract: 本申请涉及一种语音控制方法、装置、电子设备及存储介质，所述语音控制方法，包括以下步骤：获取已知唤醒词的音节；确定与所述唤醒词对应的非唤醒词的音节；根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络，以根据所述唤醒词解码网络对输入的语音进行解码，并根据解码结果确定是否执行唤醒操作，本申请在解码网络中引入非唤醒词的音节从而统一描述非唤醒词，能够降低非唤醒词引起的误唤醒率。

17.

发明公开
篡改音频的检测方法、装置及存储介质有权

公开(公告)号：CN113421592A

公开(公告)日：2021-09-21

申请号：CN202110983510.5

申请日：2021-08-25

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 陶建华 , 聂帅 , 易江燕

IPC: G10L25/51

Abstract: 本公开涉及一种篡改音频的检测方法、装置及存储介质，上述方法包括：获取待检测信号，并分别通过低通滤波器和高通滤波器提取所述待检测信号的低频成分和高频成分；分别对所述低频成分和所述高频成分进行离散小波变换，并计算经过所述离散小波变换之后的低频成分对应的低频小波系数和经过所述离散小波变换之后的高频成分对应的高频小波系数；根据所述低频小波系数和所述高频小波系数，计算高低频能量比特征；根据所述高低频能量比特征对所述待检测信号进行篡改音频检测。采用上述技术手段，可以解决现有技术中，现有的检测篡改音频的方法的应用场景受限，在一些场景无法使用的问题。

18.

发明公开
基于双谱加权空间相关矩阵的语音声源定位方法无效

公开(公告)号：CN105609113A

公开(公告)日：2016-05-25

申请号：CN201510937548.3

申请日：2015-12-15

Applicant: 中国科学院自动化研究所

Inventor： 刘文举 , 雪巍 , 梁山

IPC: G10L21/0216 , G10L21/0308 , G01S3/808 , G01S5/20

CPC classification number: G10L21/0216 , G01S3/8083 , G01S5/20 , G10L21/0308 , G10L2021/02166

Abstract: 针对实际复杂噪声环境下基于麦克风阵列的鲁棒语音声源定位问题，本发明利用双谱域上麦克风阵列所接收的语音信号及噪声信号的特殊数学性质，提供了一种基于双谱加权空间相关矩阵的语音声源定位方法，包括：对麦克风阵列采集到的信号进行分帧及双谱估计；在双谱域上，计算各个麦克风和参考麦克风之间的双谱相位差；采用参考麦克风的信号，估计双谱单元权重；根据双谱相位差和双谱单元权重，计算对应于候选方位的双谱加权空间相关矩阵；基于双谱加权空间相关矩阵特征值，计算针对当前候选方位的声源方位代价函数；根据声源方位代价函数最大值所对应的方位，估计语音声源方位。

19.

发明公开
一种骨传麦克风语音增强方法及装置、设备及存储介质有权

公开(公告)号：CN115862656A

公开(公告)日：2023-03-28

申请号：CN202310054459.9

申请日：2023-02-03

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 陶建华 , 聂帅 , 李冠君 , 易江燕

IPC: G10L21/0224 , G10L21/0232 , G10L19/26 , H04R1/08

Abstract: 本公开涉及一种骨传麦克风语音增强方法及装置、设备及存储介质，所述方法包括：获取两种频域信号，并根据预设的截止频率，对所述两种频域信号分别进行截取，得到两种截取后频域信号；对所述两种截取后频域信号分别进行半波整流，得到两种半波整流后时域信号；按照预设的中间频带，根据所述两种半波整流后时域信号确定融合因子；根据融合因子对所述两种截取后频域信号进行融合，得到骨传麦克风语音增强语音，根据预设的截止频率作为滤波器组，先对两种频域信号进行截取和融合，并通过半波整流对整体信号进行修正，实现对噪声的有效抑制，能够保留骨传导麦克风清晰的低频信号，同时对其缺失的中、高频信息进行补充，得到感知质量更高的音频信号。

20.

发明授权
篡改音频的检测方法、装置及存储介质有权

公开(公告)号：CN113421592B

公开(公告)日：2021-12-14

申请号：CN202110983510.5

申请日：2021-08-25

Applicant: 中国科学院自动化研究所

Inventor： 梁山 , 陶建华 , 聂帅 , 易江燕

IPC: G10L25/51

Abstract: 本公开涉及一种篡改音频的检测方法、装置及存储介质，上述方法包括：获取待检测信号，并分别通过低通滤波器和高通滤波器提取所述待检测信号的低频成分和高频成分；分别对所述低频成分和所述高频成分进行离散小波变换，并计算经过所述离散小波变换之后的低频成分对应的低频小波系数和经过所述离散小波变换之后的高频成分对应的高频小波系数；根据所述低频小波系数和所述高频小波系数，计算高低频能量比特征；根据所述高低频能量比特征对所述待检测信号进行篡改音频检测。采用上述技术手段，可以解决现有技术中，现有的检测篡改音频的方法的应用场景受限，在一些场景无法使用的问题。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification