Patent search ap:("中国科学院自动化研究所" OR "国家计算机网络与信息安全管理中心") AND inv:"陶建华" Page 15

141.

发明公开
面向交互场景的自动谎言检测方法、装置、设备及介质有权

公开(公告)号：CN112329748A

公开(公告)日：2021-02-05

申请号：CN202110001077.0

申请日：2021-01-04

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 连政 , 刘斌 , 孙立才

IPC: G06K9/00 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本申请实施例涉及一种面向交互场景的自动谎言检测方法、装置、设备及介质，旨在提高自动谎言检测的准确率。所述方法包括：将待测样片分别按照视频、音频和文本这三个模态进行切分，提取出这三个模态的短时特征，将待测样片中每句对话中三个模态的短时特征分别进行融合，得到每句对话对应的三个模态的长时特征，使用自注意力机制对三个模态的长时特征进行融合，得到每句对话的多模态特征，通过图神经网络为每句对话的多模态特征融合交互信息，得到融合交互信息的多模态特征，根据融合交互信息的多模态特征，预测每句对话的谎言水平。

142.

发明公开
基于深度度量网络的语音合成方法及装置有权

公开(公告)号：CN109346056A

公开(公告)日：2019-02-15

申请号：CN201811102108.6

申请日：2018-09-20

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 傅睿博 , 温正棋 , 李雅

IPC: G10L13/02 , G10L13/08 , G06N3/04 , G06N3/08

Abstract: 本发明涉及语音合成技术领域，具体涉及一种基于深度度量网络的语音合成方法及装置，旨在解决如何得到更为精确的目标代价以及品质更高的合成语音的技术问题。该方法包括将待测文本信息拆分为多个文本基元，提取文本基元的文本特征；从语料库中获取对应的多个候选基元，并提取每个候选基元对应的文本特征和声学特征；对文本基元的文本特征进行编码得到第一特征向量，对候选基元的文本特征和声学特征进行编码得到第二特征向量；计算文本基元对应的第一特征向量与其对应候选基元的第二特征向量之间的余弦距离，获取目标代价；利用语音合成系统根据目标代价对候选基元进行拼接合成语音。上述方法可以提升合成语音的品质。

143.

发明公开
基于协同过滤注意力机制的文本情感识别系统有权

公开(公告)号：CN108388554A

公开(公告)日：2018-08-10

申请号：CN201810008530.9

申请日：2018-01-04

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 赵冬梅 , 李雅

IPC: G06F17/27 , G06F17/30 , G06Q30/02

Abstract: 本发明涉及自然语言处理领域，具体涉及一种基于协同过滤注意力机制的文本情感识别系统，目的在于提高情感识别的正确性。本发明的情感识别系统包括：文本预处理模块、文本向量化模块、用户兴趣分析模块、句子特征提取模块、文档特征提取模块和情感分类模块。文本预处理模块对待处理的文本进行预处理；文本向量化模块生成文本的词向量表示；用户兴趣分析模块根据用户对已知产品的评分数据提取出模型注意力机制；句子特征提取模块接收文本的词向量表示和注意力机制提取句子特征；文档特征提取模块接收句子特征和注意力机制提取文档特征；情感分类模块将文档特征输入分类器进行情感类型识别。因此，文本特征的描述更加准确，提高了情感识别的效果。

144.

发明公开
用于视频图像的情感识别系统及方法有权转让

公开(公告)号：CN108376234A

公开(公告)日：2018-08-07

申请号：CN201810026649.9

申请日：2018-01-11

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 黄健 , 李雅

IPC: G06K9/00 , G06N3/04

Abstract: 本发明涉及情感计算领域，提出用于视频图像的情感识别系统，旨在解决由于图片之间信息的损失，造成情感识别的准确率低下的问题，系统包括：人脸提取模块，情感时序编码模块，情感信息建模模块，情感空间映射模块，人脸提取模块对视频图像进行分帧，从分帧后的图片中提取人脸图片，组成图片序列；情感时序编码模块利用3D卷积算法对图片序列的各人脸图片前后帧信息进行情感信息计算，生成情感的时序信息编码；情感信息建模模块接收时序信息编码，基于情感信息的长时动态特性，利用卷积长短时记忆模型确定时序信息的情感特征矩阵；情感空间映射模块接收情感特征矩阵，通过全连接映射到情感空间，输出情感识别结果。实现了对视频图像的情感识别。

145.

发明授权
在核磁图像序列中自动提取舌位轮廓的方法和系统有权

公开(公告)号：CN105551040B

公开(公告)日：2018-03-09

申请号：CN201510929281.3

申请日：2015-12-15

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 张大伟 , 杨明浩

IPC: G06T7/12 , G06K9/46

Abstract: 本发明提供了一种在核磁图像序列中自动提取舌位轮廓的方法和系统。其中该方法包括：对于核磁图像序列，在舌位运动区域内，利用多方向Sobel算子得到舌位轮廓初始边缘点；建立舌位边缘点映射矩阵，并结合前一帧舌位轮廓位置，对该映射矩阵进行调整；在调整后的映射矩阵中寻找最优边缘点序列，借助过控制点的二次样条曲线拟合技术得到舌位轮廓。本发明能够自动从核磁图像序列中较准确地提取出舌位轮廓，其优势在于当舌位与其他发音器官发生接触时，该方法也具有较好的鲁棒性，且整个过程自动完成，无需人工交互。

146.

发明公开
语音带宽扩展模型的训练方法及语音带宽扩展方法有权

公开(公告)号：CN107705801A

公开(公告)日：2018-02-16

申请号：CN201610634660.4

申请日：2016-08-05

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 刘斌

IPC: G10L21/038 , G10L25/30

Abstract: 本发明公开了一种语音带宽扩展模型的训练方法和语音带宽扩展方法。其中，语音带宽扩展方法包括：获取待扩展窄带语音；计算所述待扩展窄带语音的幅值谱和相位谱，并提取所述待扩展窄带语音的辅助特征；采用训练后的所述语音带宽扩展模型对所述待扩展窄带语音的所述幅值谱和所述辅助特征进行处理，得到重构的宽带语音高频带的幅值谱；在频域上对所述待扩展窄带语音的所述相位谱进行镜像翻转，确定宽带语音高频带的相位谱；基于所述窄带语音的所述幅值谱和所述相位谱，并联合所述重构的宽带语音高频带的幅值谱和所述宽带语音高频带的相位谱，确定宽带语音信号。通过本发明，实现了提高窄带语音的音质和自然度的效果。

147.

发明公开
基于情感维度预测的离散语音情感识别方法、装置及系统有权转让

公开(公告)号：CN107633851A

公开(公告)日：2018-01-26

申请号：CN201710640201.1

申请日：2017-07-31

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 黄健 , 李雅

IPC: G10L25/63 , G10L25/45 , G10L25/12 , G10L25/24 , G10L25/60 , G10L15/08

Abstract: 本发明涉及情感计算领域，具体提出一种基于情感维度预测的离散语音情感识别方法、装置及系统。旨在解决现有语音情感识别方法对情感状态的识别难以满足要求的问题。本发明的方法包括提取语音的基本声学特征，将基本声学特征组合为语音情感特征，并对语音情感特征进行加窗处理，得到全局语音情感特征后，预测得到情感维度信息，将全局语音情感特征与情感维度信息进行组合后，进行离散语音情感识别，得到语音情感识别结果。本发明将情感维度信息加入到全局语音情感特征中，增加了语音情感特征的维度，提高了离散语音情感识别的准确率。本发明还提出了一种基于情感维度预测的离散语音情感识别装置和系统，同样具有上述有益效果。

148.

发明公开
基于球谐函数的头相关传输函数的稀疏建模方法和系统有权

公开(公告)号：CN106412793A

公开(公告)日：2017-02-15

申请号：CN201610802607.0

申请日：2016-09-05

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 戚肖克

IPC: H04S7/00

CPC classification number: H04S7/305 , H04S2400/05

Abstract: 本发明公开了一种基于球谐函数的头相关传输函数的稀疏建模方法和系统。其中，该方法包括：对待测量的头相关传输函数进行处理，生成最小相位头相关传输函数，并去除全测量方向的最小相位幅度均值，得到空间差异性最小相位头相关传输函数；对空间差异性最小相位头相关传输函数进行建模，得到稀疏球谐系数；通过稀疏球谐系数插值，并根据空间的方位生成全空间的连续头相关传输函数。由此，降低了全空间连续HRTF的插值谱失真程度，降低了计算复杂度，所需要的存储量小，便于应用到实际虚拟现实系统中进行动态环境绘制，不受个体个性的限制，具有高鲁棒性，便于在实际环境中的应用。

149.

发明公开
汉语韵律层级结构预测系统有权

公开(公告)号：CN106227721A

公开(公告)日：2016-12-14

申请号：CN201610642956.0

申请日：2016-08-08

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 郑艺斌 , 李雅 , 温正棋

IPC: G06F17/27

CPC classification number: G06F17/2705 , G06F17/277

Abstract: 本发明公开了一种汉语韵律层级结构预测系统。其中，该系统包括：文本分析模块输出分析完成的文本数据；文本特征参数化模块输出参数化的文本特征；字词向量联合训练模块接收所述文本分析模块生成的所述分析完成的文本数据，输出文本的用字向量进行增强的词向量表示模型；词向量生成模块利用用字向量进行增强的词向量表示模型，输出分析完成文本数据的字向量增强的词向量；第一单分类器训练模块输出第一映射模型；第二单分类器训练模块输出第二映射模型；特征重要性排序模块输出具有预定分类性能的文本参数特征；模型融合模块输出所述韵律层级结构预测的结果。通过本发明实施例提高了韵律结构层级预测的准确性。

150.

发明公开
在核磁图像序列中自动提取舌位轮廓的方法和系统有权

公开(公告)号：CN105551040A

公开(公告)日：2016-05-04

申请号：CN201510929281.3

申请日：2015-12-15

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 张大伟 , 杨明浩

IPC: G06T7/00 , G06K9/46

CPC classification number: G06T7/0012 , G06K9/4604 , G06T2207/10088 , G06T2207/30004

Abstract: 本发明提供了一种在核磁图像序列中自动提取舌位轮廓的方法和系统。其中该方法包括：对于核磁图像序列，在舌位运动区域内，利用多方向Sobel算子得到舌位轮廓初始边缘点；建立舌位边缘点映射矩阵，并结合前一帧舌位轮廓位置，对该映射矩阵进行调整；在调整后的映射矩阵中寻找最优边缘点序列，借助过控制点的二次样条曲线拟合技术得到舌位轮廓。本发明能够自动从核磁图像序列中较准确地提取出舌位轮廓，其优势在于当舌位与其他发音器官发生接触时，该方法也具有较好的鲁棒性，且整个过程自动完成，无需人工交互。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification