Patent search ap:("国家计算机网络与信息安全管理中心" OR "中国科学院声学研究所") AND inv:"高圣翔" Page 1

1.

发明授权
一种基于局部纹理特征的音频场景识别方法及系统有权

公开(公告)号：CN111341319B

公开(公告)日：2023-05-16

申请号：CN201811559040.4

申请日：2018-12-19

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 白海钏 , 葛凤培 , 张鹏远 , 高圣翔 , 黄远 , 沈亮 , 林格平

IPC: G10L17/02 , G10L17/04 , G10L17/18 , G10L25/18 , G10L25/30 , G10L25/45 , G10L25/51 , G06N3/08

Abstract: 本发明公开了一种基于局部纹理特征的音频场景识别方法，所述方法包括：将待识别的音频信号进行预处理后逐帧提取Mel‑fbank特征和描述局部纹理的LTP特征；进行融合后输入预先训练得到的时延深度神经网络模型；得到对应于不同音频场景类型的后验概率；采用后处理决策机制处理后验概率获取待识别音频信号对应的音频场景标签。本发明的音频场景识别方法，基于对场景时频信息的有效表征，更好地实现了音频场景种类的识别。

2.

发明公开
一种基于光学字符识别的传真图像分类方法无效

公开(公告)号：CN110119648A

公开(公告)日：2019-08-13

申请号：CN201810111564.0

申请日：2018-02-05

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所

Inventor： 高圣翔 , 黄远 , 万辛 , 安茂波 , 李鹏 , 孙晓晨 , 沈亮 , 金鑫 , 徐及 , 刘珈麟 , 颜永红

IPC: G06K9/00 , G06K9/34 , G06K9/40 , G06K9/62

Abstract: 本发明公开了一种基于光学字符识别的传真图像分类方法，所述方法包括：步骤1)对扫描得到的传真图像进行噪声消除；步骤2)对噪声消除后的传真图像进行二值化处理；步骤3)对步骤2)得到的二值化图像进行仿射变换校准文本；步骤4)利用OCR方法对步骤3)处理后的传真图像进行识别，得到编码为UTF-8的输出字符串和转写置信度；步骤5)对字符串进行关键词正则匹配，得到传真图像的分类。本发明的方法利用频谱噪声消除和灰度图像二值化的预处理，在满足实时性要求的前提下提升了电子扫描得到的传真图像的质量；使传真图像能够使用基于OCR的分类方法，由此实现了传真图像的自动化分类。

3.

发明授权
一种基于自适应热词权重的语音识别方法及系统有权

公开(公告)号：CN111354347B

公开(公告)日：2023-08-15

申请号：CN201811571564.5

申请日：2018-12-21

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 黎塔 , 缪浩然 , 张鹏远 , 高圣翔 , 黄远 , 沈亮 , 林格平

IPC: G10L15/08

Abstract: 本发明提出了一种基于自适应热词权重的语音识别方法及系统，所述方法包括：生成热词网络并和静态解码网络一起加载到语音识别解码器中；将待识别的语音信号同步地在静态解码网络和热词网络上进行令牌传递，自适应地计算热词权重，并对静态解码网络上令牌的分数重新打分；输出解码结果。本发明的基于自适应热词权重的语音识别方法在一遍解码的过程中就能提升热词召回率，不影响解码的速度，并且自适应地计算热词权重既能有效地提高热词的召回率，不影响原先的解码速度，又能提高系统的鲁棒性。

4.

发明授权
基于遗传算法优化模型参数的音频带宽扩展方法及系统有权

公开(公告)号：CN109599123B

公开(公告)日：2021-02-09

申请号：CN201710911340.3

申请日：2017-09-29

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 白海钏 , 计哲 , 高圣翔 , 颜永红 , 刘建 , 周若华

IPC: G10L21/02 , G10L19/02 , G10L19/04 , G10L21/038

Abstract: 本发明公开一种基于遗传算法优化模型参数的音频带宽扩展方法，所述方法包括：步骤1)对输入音频信号x(n)进行预处理，获得滤波信号；步骤2)对滤波信号进行调制重叠变换得到低频调制重叠变换系数；步骤3)将低频调制重叠变换系数划分子带，计算每个子带的均方根能量，得到低频频谱包络序列；步骤4)根据低频频谱包络序列，采用灰色模型GM(1,1)对音频信号的高频子带能量进行估计，得到高频频谱包络；步骤5)采用频谱复制、频谱折叠、非线性计算、综合多带激励或非线性预测方法对音频频谱细节进行扩展，得到高频频谱细节；步骤6)根据上述所得高频频谱包络和高频频谱细节恢复音频信号x(n)的高频频谱信息；步骤7)利用调制重叠反变换实现x(n)的带宽扩展。

5.

发明公开
基于遗传算法优化模型参数的音频带宽扩展方法及系统有权

公开(公告)号：CN109599123A

公开(公告)日：2019-04-09

申请号：CN201710911340.3

申请日：2017-09-29

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 白海钏 , 计哲 , 高圣翔 , 颜永红 , 刘建 , 周若华

IPC: G10L21/02 , G10L19/02 , G10L19/04 , G10L21/038

Abstract: 本发明公开一种基于遗传算法优化模型参数的音频带宽扩展方法，所述方法包括：步骤1)对输入音频信号x(n)进行预处理，获得滤波信号；步骤2)对滤波信号进行调制重叠变换得到低频调制重叠变换系数；步骤3)将低频调制重叠变换系数划分子带，计算每个子带的均方根能量，得到低频频谱包络序列；步骤4)根据低频频谱包络序列，采用灰色模型GM(1,1)对音频信号的高频子带能量进行估计，得到高频频谱包络；步骤5)采用频谱复制、频谱折叠、非线性计算、综合多带激励或非线性预测方法对音频频谱细节进行扩展，得到高频频谱细节；步骤6)根据上述所得高频频谱包络和高频频谱细节恢复音频信号x(n)的高频频谱信息；步骤7)利用调制重叠反变换实现x(n)的带宽扩展。

6.

发明公开
基于深度递归非负矩阵分解的音频场景分类方法及系统无效

公开(公告)号：CN112712096A

公开(公告)日：2021-04-27

申请号：CN201911022350.7

申请日：2019-10-25

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 高圣翔 , 黄远 , 杨晶超 , 孙晓晨 , 沈亮 , 林格平 , 刘发强 , 胡琦 , 刘建 , 颜永红

IPC: G06K9/62 , G06N3/08

Abstract: 本发明公开了基于深度递归非负矩阵分解的音频场景分类方法及系统，该方法包括：将待分类的音频信号按照贝叶斯信息准则进行音频场景切分；将切分后的每一段音频划分为多个块，每个块包括多个音频帧；以块为单位分别输入多个预先训练好的深度递归NMF网络，得到每块音频在不同子空间中的展开特征；将不同子空间中的展开特征拼接为一个长特征向量，输入支持向量机，获得每块音频的类别判别结果；计算该段音频所有块的类别判别结果的均值，由此得到该段音频的所属类别。本发明的方法将深度NMF用于音频场景分类，通过探索相邻帧之间NMF系数的递归关系，降低模型复杂度，提高泛化能力。

7.

发明公开
一种基于自适应热词权重的语音识别方法及系统有权

公开(公告)号：CN111354347A

公开(公告)日：2020-06-30

申请号：CN201811571564.5

申请日：2018-12-21

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 黎塔 , 缪浩然 , 张鹏远 , 高圣翔 , 黄远 , 沈亮 , 林格平

IPC: G10L15/08

Abstract: 本发明提出了一种基于自适应热词权重的语音识别方法及系统，所述方法包括：生成热词网络并和静态解码网络一起加载到语音识别解码器中；将待识别的语音信号同步地在静态解码网络和热词网络上进行令牌传递，自适应地计算热词权重，并对静态解码网络上令牌的分数重新打分；输出解码结果。本发明的基于自适应热词权重的语音识别方法在一遍解码的过程中就能提升热词召回率，不影响解码的速度，并且自适应地计算热词权重既能有效地提高热词的召回率，不影响原先的解码速度，又能提高系统的鲁棒性。

8.

发明公开
一种基于局部纹理特征的音频场景识别方法及系统有权

公开(公告)号：CN111341319A

公开(公告)日：2020-06-26

申请号：CN201811559040.4

申请日：2018-12-19

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 白海钏 , 葛凤培 , 张鹏远 , 高圣翔 , 黄远 , 沈亮 , 林格平

IPC: G10L17/02 , G10L17/04 , G10L17/18 , G10L25/18 , G10L25/30 , G10L25/45 , G10L25/51 , G06N3/08

Abstract: 本发明公开了一种基于局部纹理特征的音频场景识别方法，所述方法包括：将待识别的音频信号进行预处理后逐帧提取Mel-fbank特征和描述局部纹理的LTP特征；进行融合后输入预先训练得到的时延深度神经网络模型；得到对应于不同音频场景类型的后验概率；采用后处理决策机制处理后验概率获取待识别音频信号对应的音频场景标签。本发明的音频场景识别方法，基于对场景时频信息的有效表征，更好地实现了音频场景种类的识别。

9.

发明公开
一种包含历史深度语义特定文本的识别方法及系统审中-实审

公开(公告)号：CN115238703A

公开(公告)日：2022-10-25

申请号：CN202210616914.5

申请日：2022-06-01

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 宁珊 , 石瑾 , 李鹏 , 高圣翔 , 计哲 , 万辛 , 刘发强 , 孙旭东 , 倪善金 , 齐帅 , 许高尚 , 王拓

IPC: G06F40/30 , G06F40/289 , G06F16/35 , G06N20/00

Abstract: 本发明涉及一种包含历史深度语义特定文本的识别方法及系统，所述一种包含历史深度语义特定文本的识别方法包括：利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定文本初始数据；利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果，通过大数据分析特定文本进行模型训练，并对特定内容的语义特征进行分析筛除，进而进行分类、识别及定性，提升了对于特定文本的识别准确率，避免误差的产生。

10.

发明授权
防止电话诈骗的方法及系统有权

公开(公告)号：CN106791220B

公开(公告)日：2021-06-04

申请号：CN201611082262.2

申请日：2016-11-30

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 万辛 , 李鹏 , 张震 , 安茂波 , 刘振业 , 侯伟 , 高圣翔 , 黄远 , 杨晶超

IPC: H04W12/128 , H04M3/436 , H04M3/22 , H04M1/57

Abstract: 本发明公开了一种防止电话诈骗的方法及系统，其中，所述方法包括：获取实时话单；提取所述实时话单的号码特征和/或行为特征；根据预设的诈骗电话识别模型对所述实时话单的号码特征和/或行为特征进行分析，以确定所述实时话单对应的通话行为是否为诈骗电话；若确认所述实时话单对应的通话行为是诈骗电话，则向所述实时话单中的被叫号码发送报警提示，并将本次诈骗电话识别结果发送到第三方管理系统。本发明能够准确定位诈骗电话，及时获知诈骗电话的发生，并及时向诈骗电话对应的被叫号码发送报警提示，有效提高了用户对骚扰、诈骗电话的防控能力。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification