一种基于言语层级序列的注意力缺陷多动障碍的分析系统

    公开(公告)号:CN116421187A

    公开(公告)日:2023-07-14

    申请号:CN202310328673.9

    申请日:2023-03-30

    Abstract: 本发明公开了一种基于言语层级序列的注意力缺陷多动障碍的分析系统,包括:语音序列生成模块,用于构建具有音节和词汇两层级的语音序列;脑电信号采集模块,使用音频输入设备向被测试者呈现语音序列,并使用脑电记录设备同步采集被测试者的脑电信号;脑电信号分析模块,对脑电信号进行处理得到脑电响应频谱,基于脑电响应频谱计算不同频率处脑电响应的试次间相位一致性,通过音节、词汇频率处的脑电响应相位一致性峰值判断被测试者是否存在注意力缺陷多动障碍。本发明系统具备便捷、高效的特性,通过脑电信号为注意力缺陷多动障碍的诊断与干预提供了良好的辅助作用,具有广泛的适用场景与适用人群。

    一种基于语音调制和脑电信号的言语认知评估系统

    公开(公告)号:CN116269447A

    公开(公告)日:2023-06-23

    申请号:CN202310552371.X

    申请日:2023-05-17

    Abstract: 本发明公开了一种基于语音调制和脑电信号的言语认知评估系统,包括:语音序列生成模块,选择结构化语音材料并将其合成为语音序列,对语音序列进行调制得到若干种调制语音序列;结构化语音材料中的词汇按预设的频率呈现,每一种调制语音序列间的词汇节奏相位相同、声学节奏相位不同;脑电信号采集模块,使用音频输入设备向被测试者呈现所有调制语音序列,使用脑电记录设备同步采集被测试者的脑电信号;脑电信号分析模块,对脑电信号进行处理得到脑电响应频谱,分别提取所有调制语音序列对应的脑电响应频谱在词汇频率处的脑电响应相位;言语认知评估结果获取模块,计算不同种调制语音序列对应的脑电响应相位之差,判定言语认知评估结果。

    基于情绪视听刺激和面部表情的意识状态检测系统、设备

    公开(公告)号:CN115439920A

    公开(公告)日:2022-12-06

    申请号:CN202211366999.2

    申请日:2022-11-03

    Abstract: 本发明公开了一种基于情绪视听刺激和面部表情的意识状态检测系统、设备,所述系统包括:情绪素材库模块,存储样本情绪视频;情绪类型与面部表情特征集处理模块,处理用户观看情绪素材库中每种情绪类型下的每个样本情绪视频时产生的面部表情特征与对应的情绪类型,获取面部表情特征数据集;标准情绪素材库模块,存储标准样本情绪视频;所述标准样本情绪视频通过对情绪素材库模块中的样本情绪视频筛选得到;意识状态检测模块,基于标准样本情绪视频对待测者观看标准情绪素材库而产生的面部表情特征进行检测,获得意识状态标签。本发明基于情绪视听刺激诱导用户产生自发的面部表情特征,实现了客观、便利且准确地检测用户的意识状态。

    一种基于语音调制和脑电信号的言语认知评估系统

    公开(公告)号:CN116269447B

    公开(公告)日:2023-08-29

    申请号:CN202310552371.X

    申请日:2023-05-17

    Abstract: 本发明公开了一种基于语音调制和脑电信号的言语认知评估系统,包括:语音序列生成模块,选择结构化语音材料并将其合成为语音序列,对语音序列进行调制得到若干种调制语音序列;结构化语音材料中的词汇按预设的频率呈现,每一种调制语音序列间的词汇节奏相位相同、声学节奏相位不同;脑电信号采集模块,使用音频输入设备向被测试者呈现所有调制语音序列,使用脑电记录设备同步采集被测试者的脑电信号;脑电信号分析模块,对脑电信号进行处理得到脑电响应频谱,分别提取所有调制语音序列对应的脑电响应频谱在词汇频率处的脑电响应相位;言语认知评估结果获取模块,计算不同种调制语音序列对应的脑电响应相位之差,判定言语认知评估结果。

    基于视觉场景的多模态语音识别方法、电子设备、介质

    公开(公告)号:CN118155624B

    公开(公告)日:2025-03-28

    申请号:CN202410431630.8

    申请日:2024-04-11

    Abstract: 本发明公开了一种基于视觉场景的多模态语音识别方法、电子设备、介质,包括:获取语音音频以及语音音频所处环境对应的场景视频;将其输入至预先训练好的视听特征编码模型进行特征提取,分别得到声学特征、视觉特征,经拼接与融合,得到视听融合特征;其中,视听特征编码模型的训练过程包括:获取初始声学特征、初始视觉特征,经拼接、融合后得到视听融合特征;对每段时间窗口内的视听融合特征进行聚类,得到聚类标签;随机选择部分时间窗口的视听融合特征进行掩蔽;利用未掩蔽时间窗口的视听融合特征对掩蔽时间窗口的聚类标签进行预测,完成训练过程;将视听融合特征输入至微调后的语音识别解码模型转换为语音文本,得到语音识别结果。

    基于视觉场景的多模态语音识别方法、电子设备、介质

    公开(公告)号:CN118155624A

    公开(公告)日:2024-06-07

    申请号:CN202410431630.8

    申请日:2024-04-11

    Abstract: 本发明公开了一种基于视觉场景的多模态语音识别方法、电子设备、介质,包括:获取语音音频以及语音音频所处环境对应的场景视频;将其输入至预先训练好的视听特征编码模型进行特征提取,分别得到声学特征、视觉特征,经拼接与融合,得到视听融合特征;其中,视听特征编码模型的训练过程包括:获取初始声学特征、初始视觉特征,经拼接、融合后得到视听融合特征;对每段时间窗口内的视听融合特征进行聚类,得到聚类标签;随机选择部分时间窗口的视听融合特征进行掩蔽;利用未掩蔽时间窗口的视听融合特征对掩蔽时间窗口的聚类标签进行预测,完成训练过程;将视听融合特征输入至微调后的语音识别解码模型转换为语音文本,得到语音识别结果。

    一种基于言语层级序列的注意力缺陷多动障碍的分析系统

    公开(公告)号:CN116421187B

    公开(公告)日:2023-10-13

    申请号:CN202310328673.9

    申请日:2023-03-30

    Abstract: 本发明公开了一种基于言语层级序列的注意力缺陷多动障碍的分析系统,包括:语音序列生成模块,用于构建具有音节和词汇两层级的语音序列;脑电信号采集模块,使用音频输入设备向被测试者呈现语音序列,并使用脑电记录设备同步采集被测试者的脑电信号;脑电信号分析模块,对脑电信号进行处理得到脑电响应频谱,基于脑电响应频谱计算不同频率处脑电响应的试次间相位一致性,通过音节、词汇频率处的脑电响应相位一致性峰值判断被测试者是否存在注意力缺陷多动障碍。本发明系统具备便捷、高效的特性,通过脑电信号为注意力缺陷多动障碍的诊断与干预提供了良好的辅助作用,具有广泛的适用场景与适用人群。

    基于情绪视听刺激和面部表情的意识状态检测系统、设备

    公开(公告)号:CN115439920B

    公开(公告)日:2023-03-24

    申请号:CN202211366999.2

    申请日:2022-11-03

    Abstract: 本发明公开了一种基于情绪视听刺激和面部表情的意识状态检测系统、设备,所述系统包括:情绪素材库模块,存储样本情绪视频;情绪类型与面部表情特征集处理模块,处理用户观看情绪素材库中每种情绪类型下的每个样本情绪视频时产生的面部表情特征与对应的情绪类型,获取面部表情特征数据集;标准情绪素材库模块,存储标准样本情绪视频;所述标准样本情绪视频通过对情绪素材库模块中的样本情绪视频筛选得到;意识状态检测模块,基于标准样本情绪视频对待测者观看标准情绪素材库而产生的面部表情特征进行检测,获得意识状态标签。本发明基于情绪视听刺激诱导用户产生自发的面部表情特征,实现了客观、便利且准确地检测用户的意识状态。

Patent Agency Ranking