-
公开(公告)号:CN117392289A
公开(公告)日:2024-01-12
申请号:CN202311166459.4
申请日:2023-09-11
Applicant: 北京计算机技术及应用研究所
IPC: G06T13/40 , G06F40/289 , G06F40/268 , G06F40/295 , G06F16/35 , G06F40/30 , G06N3/0464 , G06N3/08 , G06N3/044 , G06N3/045 , G06T17/00 , G06T5/70 , G06T7/33 , G06T15/04
Abstract: 本发明涉及一种基于AI语音自动生成案发现场视频的方法和系统,属于自然语言处理及语音识别、计算机视觉技术领域。本发明收集目击证人、嫌疑人等有关本案案情的口供语音作为数据集,对语音进行一系列处理,对人体在时间、地点、动作等的相关事件进行特征提取,将提取结果输入到训练好的人体姿态估计神经网络模型,得到该人体基于时间地点的连贯的姿态动作视频;把人体的姿态动作与三维场景主题输入到视频生成器模块中,将时间维度上人体模型的姿态动作与三维场景主题进行动画融合,生成人体在实景中的动态连贯的案发现场人物视频。本发明能替代人工对繁杂信息的收集及处理,有利于办案效率的整体提升。