一种用于远场人机交互的便携式电声门图语音采集装置

    公开(公告)号:CN108682427A

    公开(公告)日:2018-10-19

    申请号:CN201810503133.9

    申请日:2018-05-23

    Abstract: 本发明公开了一种用于远场人机交互的便携式电声门图语音采集装置。在远场语音人机交互中,通过软硬件的复杂结合以及人工智能算法,可以在复杂的环境中,有效解决背景噪声、混响、回声等的影响。利用电声门图获得声门激励信息,进而对目标语音进行分离,可以有效的去除传输过程中的噪声影响,并且去除不同种类信息间的干扰。该便携式电声门图语音采集装置包括:信号采集部分、信号处理部分和信号传输部分。本发明电声门图采集装置结构简洁且便于随身携带,采用高频弱电压,信号采集更精确,且能配合其它设备,很好的提取语音特征,减少或避免语音在空气中传播时受到的噪声影响,具有检测精度高和应用广泛的特点。

    语音处理方法及装置
    3.
    发明授权

    公开(公告)号:CN104851421B

    公开(公告)日:2018-08-17

    申请号:CN201510169121.3

    申请日:2015-04-10

    Abstract: 本申请实施例提供了一种语音处理方法及装置。方法包括:获取语音信号和与所述语音信号同步的电声门图EGG信号;至少根据所述EGG信号,将所述语音信号划分为多个音段。本实施例提供了一种分割音段的方案。

    结合情感点的汉语语音情感提取及建模方法

    公开(公告)号:CN102893326B

    公开(公告)日:2013-11-13

    申请号:CN201180004156.1

    申请日:2011-07-21

    Inventor: 毛峡 陈立江

    CPC classification number: G10L17/26 G10L17/06 G10L17/16 G10L25/63

    Abstract: 本发明一种结合情感点的汉语语音情感提取及建模方法,该汉语语音情感点提取方法为:制定情感点数据库规范,包括发音人规范、录音脚本设计规范、音频文件命名规范等;收集情感点数据;情感点愉悦度、激活度、优势度(PAD)评测,即由区别于说话者的至少十名评测者对情感点数据进行PAD主观听取评测实验。该汉语语音情感点建模方法为:首先根据Fisher比率选择语音特征训练性别识别支持向量机模型(SVM);其次为男声和女声分别建立情感点隐马尔科夫模型(HMM),并根据SVM性别识别结果选择相应的HMM进行情感点分类。本发明汉语语音情感点提取方法为结合语义信息的汉语语音情感识别研究提供了基础,汉语语音情感点建模方法实现了高效的语音情感识别。

    结合情感点的汉语语音情感提取及建模方法

    公开(公告)号:CN102893326A

    公开(公告)日:2013-01-23

    申请号:CN201180004156.1

    申请日:2011-07-21

    Inventor: 毛峡 陈立江

    CPC classification number: G10L17/26 G10L17/06 G10L17/16 G10L25/63

    Abstract: 本发明一种结合情感点的汉语语音情感提取及建模方法,该汉语语音情感点提取方法为:制定情感点数据库规范,包括发音人规范、录音脚本设计规范、音频文件命名规范等;收集情感点数据;情感点愉悦度、激活度、优势度(PAD)评测,即由区别于说话者的至少十名评测者对情感点数据进行PAD主观听取评测实验。该汉语语音情感点建模方法为:首先根据Fisher比率选择语音特征训练性别识别支持向量机模型(SVM);其次为男声和女声分别建立情感点隐马尔科夫模型(HMM),并根据SVM性别识别结果选择相应的HMM进行情感点分类。本发明汉语语音情感点提取方法为结合语义信息的汉语语音情感识别研究提供了基础,汉语语音情感点建模方法实现了高效的语音情感识别。

    结合声门激励和声道调制信息的汉语语音情感提取及建模方法

    公开(公告)号:CN102411932B

    公开(公告)日:2012-12-19

    申请号:CN201110301307.1

    申请日:2011-09-30

    Inventor: 毛峡 陈立江

    Abstract: 本发明一种结合声门激励和声道调制信息的汉语语音情感提取及建模方法,该汉语声门激励信息的提取方法为:制定电声门图情感语音数据库规范;收集电声门图情感语音数据;电声门图情感语音主观评测,即由至少十名评测者对电声门图情感语音进行评测。结合声门激励和声道调制信息的汉语情感建模方法为:首先根据电声门图提取声门激励信息;其次根据电声门图和语音信号的关系提取语音信号中的声道调制信息;最后,利用所有备选特征的Fisher比率为每种情感选择合适的情感特征,并训练一对多支持向量机模型。本发明通过电声门图信号提取声门激励信息,将语音信号中的声门激励信息和声道调制信息分离,更准确的反映语音中的情感信息。

    结合情感点的汉语语音情感提取及建模方法

    公开(公告)号:CN102222500A

    公开(公告)日:2011-10-19

    申请号:CN201110121872.X

    申请日:2011-05-11

    Inventor: 毛峡 陈立江

    CPC classification number: G10L17/26 G10L17/06 G10L17/16 G10L25/63

    Abstract: 本发明一种结合情感点的汉语语音情感提取及建模方法,该汉语语音情感点提取方法为:制定情感点数据库规范,包括发音人规范、录音脚本设计规范、音频文件命名规范等;收集情感点数据;情感点愉悦度、激活度、优势度(PAD)评测,即由区别于说话者的至少十名评测者对情感点数据进行PAD主观听取评测实验。该汉语语音情感点建模方法为:首先根据Fisher比率选择语音特征训练性别识别支持向量机模型(SVM);其次为男声和女声分别建立情感点隐马尔科夫模型(HMM),并根据SVM性别识别结果选择相应的HMM进行情感点分类。本发明汉语语音情感点提取方法为结合语义信息的汉语语音情感识别研究提供了基础,汉语语音情感点建模方法实现了高效的语音情感识别。

    汉语语音情感信息的提取及建模方法

    公开(公告)号:CN101261832B

    公开(公告)日:2011-05-25

    申请号:CN200810104541.3

    申请日:2008-04-21

    Inventor: 毛峡 陈立江

    Abstract: 本发明一种汉语语音情感信息的提取及建模方法,该汉语语音情感信息的提取方法为:制定情感语音数据库规范,包括发音人规范、录音脚本设计规范、音频文件命名规范等;收集情感语音数据;情感语音有效性评测,即由区别于说话者的至少十名评测者对情感语音数据进行主观听取评测实验。该汉语语音情感信息的建模方法为:提取语音情感特征,确定区分各种情感类别的特征组合;采用不同的特征组合训练多级语音情感识别系统的SVM模型;验证该分类模型的识别效果:即采用交叉留一法验证语音情感多极分类模型在说话人无关情况下的分类效果。本发明解决了国内情感语音数据库情感种类较少以及国内情感语音数据库匮乏的问题,同时实现了高效的语音情感识别系统。

    一种基于多说话人语音分离方法的质控报告自动生成系统

    公开(公告)号:CN118782074A

    公开(公告)日:2024-10-15

    申请号:CN202411002842.0

    申请日:2024-07-25

    Abstract: 本发明公开了一种基于多说话人语音分离方法的质控报告自动生成系统,包括基于超文本传输协议和网络应用服务器技术的语音接收模块、基于时频幅度掩蔽和卷积神经网络的语音分离模块、基于双向状态空间扩充变换器块的语音识别模块、质控报告生成模块、基于超文本传输协议和网络应用服务器技术的质控报告上传模块和基于容器引擎容器化部署和超文本传输协议的分布式部署模块,所述基于超文本传输协议和网络应用服务器技术的语音接收模块用于接收待处理语音,所述基于时频幅度掩蔽和卷积神经网络的语音分离模块用于分离出目标对象的单独语音,所述基于双向状态空间扩充变换器块的语音识别模块用于对语音进行识别并生成文本,所述质控报告生成模块用于对文件进行分析并生成所需质控报告,所述基于超文本传输协议和网络应用服务器技术的质控报告上传模块用于质控报告上传到后台系统,所述基于容器引擎容器化部署和超文本传输协议的分布式部署模块用于系统在多台服务器上实现分布式部署和互联。

Patent Agency Ranking