-
公开(公告)号:CN113936637A
公开(公告)日:2022-01-14
申请号:CN202111207821.9
申请日:2021-10-18
Applicant: 上海交通大学
IPC: G10L13/02 , G10L13/06 , G10L13/08 , G06F16/36 , G06F40/35 , G06V40/16 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06N5/04
Abstract: 一种基于多模态知识图谱的语音自适应补全系统,包括:数据接收器、数据分析器和数据推理器,其中:数据接收器根据接收的音视频数据,进行预处理并输出至数据分析器;数据分析器对语音和图像的分析提取出波形时序特征和唇部轨迹特征,经多模态联合表征得到音素序列;数据推理器根据历史文本,进行领域会话建模和候选文本预测,结合音素序列进行文本推理,得到具有语义的语句,并根据波形特征合成补全的语音。本发明通过音素推理模型,在语音模态缺失时进行音素识别的同时,根据多模态知识图谱中实体间的语义关系对已有语音所产生的历史文本进行领域会话建模,从而推理并生成具有语义的文本,结合用户语音的波形特征对语音进行合成,形成补全后的音频。
-
公开(公告)号:CN113936637B
公开(公告)日:2025-04-18
申请号:CN202111207821.9
申请日:2021-10-18
Applicant: 上海交通大学
IPC: G10L13/02 , G10L13/06 , G10L13/08 , G06F16/36 , G06F40/35 , G06V40/16 , G06V10/80 , G06V10/82 , G06F18/25 , G06N3/0464 , G06N3/042 , G06N3/0455 , G06N3/0442 , G06N3/045 , G06N3/084 , G06N5/04
Abstract: 一种基于多模态知识图谱的语音自适应补全系统,包括:数据接收器、数据分析器和数据推理器,其中:数据接收器根据接收的音视频数据,进行预处理并输出至数据分析器;数据分析器对语音和图像的分析提取出波形时序特征和唇部轨迹特征,经多模态联合表征得到音素序列;数据推理器根据历史文本,进行领域会话建模和候选文本预测,结合音素序列进行文本推理,得到具有语义的语句,并根据波形特征合成补全的语音。本发明通过音素推理模型,在语音模态缺失时进行音素识别的同时,根据多模态知识图谱中实体间的语义关系对已有语音所产生的历史文本进行领域会话建模,从而推理并生成具有语义的文本,结合用户语音的波形特征对语音进行合成,形成补全后的音频。
-
公开(公告)号:CN109492818A
公开(公告)日:2019-03-19
申请号:CN201811367473.X
申请日:2018-11-16
Applicant: 上海交通大学 , 国网江苏省电力有限公司经济技术研究院 , 上海华东电集实业有限公司 , 国家电网有限公司
Abstract: 本发明涉及一种基于能源发展与Shapley值赋权的用电量预测方法,包括以下步骤:基于影响能源与用电量发展的主要经济因素,预测经济发展情况;采用多元回归模型预测能源发展情况;根据历史用电量数据与能源数据,基于所述经济发展情况和能源发展情况的预测结果,采用多种用电量预测模型进行区域用电量发展预测,获得多个用电量预测值;通过Shapley值理论多个用电量预测值进行加权处理,得到最终用电量预测结果。与现有技术相比,本发明最终所得的用电量预测结果能够较好地考虑中长期的用电量增长变化情况,可以为电网远期规划目标提供依据,从经济和能源多角度准确分析了用电量需求情况,为电网规划提供了有效的参考。
-
-