-
公开(公告)号:CN115249487A
公开(公告)日:2022-10-28
申请号:CN202210863709.9
申请日:2022-07-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出一种回放边界负样例的增量式生成语音检测方法和系统。属于生成语音检测领域,其中,方法包括:在可以保存少量旧样本的情况下,通过挑选具有代表性生成语音数据进行保存,在后续的模型更新中将其加入到新的训练数据中,以减少模型对于旧有知识的遗忘,使得模型同时具备对原有伪造语音和新型伪造语音的检测能力,能够对新型未知的生成语音快速及时响应,持续性更新。
-
公开(公告)号:CN113297369B
公开(公告)日:2022-04-01
申请号:CN202110846067.7
申请日:2021-07-26
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/36 , G06F40/295
Abstract: 本发明提供基于知识图谱子图检索的智能问答系统,包括:所述问句处理模块识别用户输入问句中的实体,根据所述实体构建输入问句的句法依存树,得到实体之间的关系谓词;利用知识图谱嵌入得到知识图谱中三元组的低维稠密向量表示;将得到的用户输入问句中的实体映射到知识图谱中,得到每个实体在知识图谱中对应的候选实体列表,选择起点实体,引入关系谓词,在知识图谱中检索与之相匹配的知识图谱子图,再引入实体和关系谓词继续检索,迭代至全部的实体和关系谓词都引入完毕,输出检索到的知识图谱子图;再利用知识图谱子图过滤将检索得到的知识图谱子图进行剪枝;最后,输出相应结果。
-
公开(公告)号:CN113421592B
公开(公告)日:2021-12-14
申请号:CN202110983510.5
申请日:2021-08-25
Applicant: 中国科学院自动化研究所
IPC: G10L25/51
Abstract: 本公开涉及一种篡改音频的检测方法、装置及存储介质,上述方法包括:获取待检测信号,并分别通过低通滤波器和高通滤波器提取所述待检测信号的低频成分和高频成分;分别对所述低频成分和所述高频成分进行离散小波变换,并计算经过所述离散小波变换之后的低频成分对应的低频小波系数和经过所述离散小波变换之后的高频成分对应的高频小波系数;根据所述低频小波系数和所述高频小波系数,计算高低频能量比特征;根据所述高低频能量比特征对所述待检测信号进行篡改音频检测。采用上述技术手段,可以解决现有技术中,现有的检测篡改音频的方法的应用场景受限,在一些场景无法使用的问题。
-
公开(公告)号:CN113488070B
公开(公告)日:2021-11-16
申请号:CN202111048241.X
申请日:2021-09-08
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及一种篡改音频的检测方法、装置、电子设备及存储介质,上述方法包括:获取待检测信号,并对待检测信号进行第一预设阶数的小波变换,得到数量等于第一预设阶数的待检测信号对应的第一低频系数和第一高频系数;对阶数大于等于第二预设阶数的第一高频系数进行小波逆变换,得到待检测信号对应的第一高频分量信号;以帧为单位计算第一高频分量信号的第一梅尔倒谱特征,并将第一高频分量信号的当前帧信号和当前帧信号之前的预设数量的帧信号的第一梅尔倒谱特征融合,得到第一融合特征;通过深度学习模型对第一融合特征进行篡改音频检测。
-
公开(公告)号:CN113380235B
公开(公告)日:2021-11-16
申请号:CN202110931452.1
申请日:2021-08-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于知识迁移的电话信道虚假语音鉴别方法,包括:将利用麦克风信道语音数据训练而得的鉴别模型作为麦克风信道模型,将利用电话信道语音训练数据训练得到的声学模型视为电话信道模型;在所述电话信道模型训练过程中,应用所述麦克风信道模型指导所述电话信道模型进行训练,使得所述电话信道模型模仿所述麦克风信道模型的行为,即迫使所述电话信道模型的后验概率分布逼近所述麦克风信道模型的后验概率分布;应用训练后的电话信道模型对电话信道语音进行预测,得到电话信道语音的真假判别结果。
-
公开(公告)号:CN113642540A
公开(公告)日:2021-11-12
申请号:CN202111195200.3
申请日:2021-10-14
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于胶囊网络的人脸表情识别方法及装置,其中方法包括:利用倒谱理论自动的评估图像清晰度,自动筛选出清晰图像;将筛选出清晰图像去除背景和非人脸区域,做图像裁剪;对图像裁剪后的图像提取局部特征人脸关键点,做图像校准;通过旋转、移动、倾斜、缩放和颜色抖动操作来扩充校准后的图像的数据集;将校准后的图像输入到胶囊网络中提取具有可解释性的人脸表情特征,具体方法包括:部件胶囊学习和部件胶囊融合;将具有可解释性的人脸表情特征输入到分类器中,得到人脸表情最后的分类结果。
-
公开(公告)号:CN113555007A
公开(公告)日:2021-10-26
申请号:CN202111116267.3
申请日:2021-09-23
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及一种语音拼接点检测方法及存储介质,上述方法包括:获取待检测语音,并确定所述待检测语音的高频成分和低频成分;根据所述高频成分和所述低频成分提取所述待检测语音所对应的第一倒谱特征和第二倒谱特征;以帧为单位,拼接所述待检测语音中的每一帧语音中的第一倒谱特征和第二倒谱特征,得到参数序列;将所述参数序列输入神经网络模型,输出所述待检测语音所对应的特征序列,其中,所述神经网络模型已通过训练,学习并保存有参数序列与所述特征序列之间的对应关系;根据所述特征序列对所述待检测语音进行语音拼接点检测。采用上述技术手段,解决现有技术中,通过单一的声学特征对语音拼接点进行检测,语音拼接点检测的准确率低的问题。
-
公开(公告)号:CN113255800B
公开(公告)日:2021-10-15
申请号:CN202110615003.6
申请日:2021-06-02
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供基于音视频的鲁棒情感建模系统,包括:原始音频训练数据通过音频数据扩增模块进行数据扩增,得到带噪音频训练数据去训练音频数据增强模块,剔除带噪音频训练数据中的噪声信息,得到增强语音训练数据,将增强语音训练数据输入音频情感识别模块,进行训练并识别音频训练情感状态;原始视频训练数据通过视频数据扩增模块进行数据扩增,得到带噪视频训练数据去训练视频数据增强模块,剔除带噪视频训练数据中的噪声信息,得到增强视频训练数据,将增强视频训练数据输入视频情感识别模块,进行训练并识别视频训练情感状态;决策层融合模块将音频训练情感状态和视频训练情感状态融合,进行训练并输出情感识别预测结果。
-
公开(公告)号:CN113407660A
公开(公告)日:2021-09-17
申请号:CN202110934216.5
申请日:2021-08-16
Applicant: 中国科学院自动化研究所
IPC: G06F16/31 , G06F16/33 , G06F16/335 , G06F16/35 , G06F40/14 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供非结构化文本事件抽取方法,包括:通过利用多阶句法树和图神经网络对文本信息进行编码,得到更为丰富和表征能力更强的词特征向量,进而提升事件检测的能力;通过构建外部本体知识,融入到候选事件论元编码环节,增加论元词汇特征编码的差异性,从而提升事件论元识别准确率。
-
公开(公告)号:CN112559835B
公开(公告)日:2021-09-14
申请号:CN202110200140.3
申请日:2021-02-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/906 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请涉及多模态情感识别方法,包括:分别提取帧级别的音频特征、帧级别的视频特征和词级别的文本特征;将提取出的特征分别输入到特征编码器进行建模,得到编码后的音频编码、视频编码和文本编码特征;将编码后的特征先分别经过各自的自注意力模块对模态内的交互关系进行建模,将其进行两两排序组合输入至跨模态注意力模块对两两模态间的交互关系进行建模;对上述自注意力模块和跨模态注意力模块的输出进行时序池化得到各模态内的全局交互特征,两两模态间的全局交互特征;利用注意力机制分别将这上述模态内和模态间的全局交互特征进行加权融合得到整个待测样本模态内和模态间的特征表示,将二者进行拼接经过全连接网络得到最终的情感分类结果。
-
-
-
-
-
-
-
-
-