Patent search ap:("中国科学院自动化研究所") AND inv:"连政" Page 3

21.

发明公开
自然场景下的表情识别方法和装置有权

公开(公告)号：CN112580617A

公开(公告)日：2021-03-30

申请号：CN202110222926.5

申请日：2021-03-01

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 肖明远 , 刘斌 , 连政

IPC: G06K9/00 , G06K9/46 , G06K9/62 , G06T5/00 , G06T5/50

Abstract: 本申请涉及自然场景下的表情识别方法和装置，具体方法包括：数据切分：将输入视频按指定帧率转化为视频帧序列，并进行人脸表情标注，得到视频帧标注序列；视频帧标注序列预处理：对视频帧标注序列进行消除光照、剔除非人脸的区域和消除头部姿态对人脸表情的影响，得到表情视频帧序列，对表情视频帧序列进行扩增，得到视频预处理帧序列；从视频预处理帧序列中提取表征面部外观和形状特征的定向梯度直方图特征、提取面部褶皱程度的二阶特征和使用深度神经网络提取像素级深度神经网络特征；再进行向量融合，得到用于训练的面部特征融合向量；将所述面部特征融合向量输入支持向量机做表情分类。

22.

发明公开
多模态谎言检测方法、装置、设备有权

公开(公告)号：CN112329746A

公开(公告)日：2021-02-05

申请号：CN202110001041.2

申请日：2021-01-04

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 孙立才 , 刘斌 , 连政

IPC: G06K9/00 , G06K9/62 , G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08 , G10L19/02

Abstract: 本申请实施例涉及数据处理领域，具体涉及一种多模态谎言检测方法、装置、设备，旨在提高自动谎言检测的准确率。所述方法包括：输入待测音频、待测视频以及待测文本这三个模态的原始数据；对输入内容分别进行特征提取，得到三个模态的深度特征；对这三个模态的深度特征中的一阶、二阶以及三阶交互关系进行显式刻画，得到每个词的融合后的多模态特征；对所述每个词的融合后的多模态特征进行上下文建模，得到每个词的最终的特征；对上述每个词的最终的特征进行池化得到全局特征，然后通过全连接层得到谎言分类结果。

23.

发明公开
基于成对鉴别任务的语音情感识别方法与系统有权

公开(公告)号：CN108364662A

公开(公告)日：2018-08-03

申请号：CN201711481953.4

申请日：2017-12-29

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 连政 , 李雅

IPC: G10L25/63 , G10L15/02 , G10L15/06 , G10L15/08 , G10L15/22 , G10L25/18

Abstract: 本发明涉及语音情感识别领域，具体涉及一种基于成对鉴别任务的语音情感识别方法与系统。目的在于解决情感标签的模糊性问题。本发明的语音情感识别系统，在训练过程中，将语音数据随机配对；然后提取语谱图特征并利用第一音向量提取模型生成成对音向量；再利用判别网络模型计算成对音频训练数据属于同一情感类别的概率；计算损失函数时，同时考虑成对音向量之间的余弦相似性损失，以及判别网络模型的输出值和预设标签之间的交叉熵。对于待识别语音，先提取语谱图特征，再用训练好的第一音向量提取模型生成音向量，最后用训练好的支持向量机进行情感分类。本发明通过成对鉴别任务训练语音情感模型，提升了基于语音的情感识别系统的性能。

Patent Agency Ranking