-
公开(公告)号:CN116453024B
公开(公告)日:2023-09-22
申请号:CN202310445856.9
申请日:2023-04-23
Applicant: 中国传媒大学
IPC: G06V20/40 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明提供一种视频情绪识别系统、方法,首先对预输入的原始长视频进行预处理以形成目标视频的短时视频片段;再对目标视频的短时视频片段进行特征提取以分别获取频谱融合特征数据、视觉模态信息数据和文本特征数据,根据频谱融合特征数据、视觉模态信息数据和文本特征数据获取情绪权重,并获取与情绪权重相对应的视频情绪预测值,用户可以在平台前端上传待分析的视频,而这些模态数据将在后端进行计算,获得的情绪分数和最终预测将打印在前端的界面上,实现端到端一致性视频情绪识别,本发明能够有效提高声觉贡献效果,简化视觉提取结构,提高一致性,提升多模态视频情感分析的产业应用价值。
-
公开(公告)号:CN119052532A
公开(公告)日:2024-11-29
申请号:CN202411093093.7
申请日:2024-08-09
Applicant: 中国传媒大学
IPC: H04N21/2343 , H04N21/25 , H04N21/466 , H04N21/4402
Abstract: 本发明公开了基于元学习的短视频码率自适应系统,涉及流媒体技术领域,包括以下步骤:S1、离线训练,建立模型表示用户特征和网络预测信息;S2、在线学习,根据当前用户环境的特征,对模型参数进行调整和优化。本发明采用上述的基于元学习的短视频码率自适应系统,成功实现了基于元学习的新型SABR框架,该框架能够快速适应不同用户需求,提高系统的实用性与计算速度,使其具有工业应用;成功结合了离线训练与在线学习技术,增强了模型的泛化性和稳定性;在预训练中引入动作掩蔽的思想,增强决策的合理性和可靠性,有效降低了元学习所需的数据量,提升了学习效率和准确性,显著减少了工业环境中的数据需求和训练时间。
-
公开(公告)号:CN116453024A
公开(公告)日:2023-07-18
申请号:CN202310445856.9
申请日:2023-04-23
Applicant: 中国传媒大学
IPC: G06V20/40 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明提供一种视频情绪识别系统、方法,首先对预输入的原始长视频进行预处理以形成目标视频的短时视频片段;再对目标视频的短时视频片段进行特征提取以分别获取频谱融合特征数据、视觉模态信息数据和文本特征数据,根据频谱融合特征数据、视觉模态信息数据和文本特征数据获取情绪权重,并获取与情绪权重相对应的视频情绪预测值,用户可以在平台前端上传待分析的视频,而这些模态数据将在后端进行计算,获得的情绪分数和最终预测将打印在前端的界面上,实现端到端一致性视频情绪识别,本发明能够有效提高声觉贡献效果,简化视觉提取结构,提高一致性,提升多模态视频情感分析的产业应用价值。
-
公开(公告)号:CN118690739B
公开(公告)日:2025-02-28
申请号:CN202410836726.2
申请日:2024-06-26
Applicant: 中国传媒大学
Abstract: 本发明公开了一种智能分镜头脚本生成系统及方法,属于软件工程的技术领域,包括依次连接的前端交互界面层、通信层一、后端业务逻辑层、通信层二和计算层,所述前端交互界面层包括文本编辑和图像预览功能,所述后端业务逻辑层包括大语言模型(LLM)构成的文本生成模块和文本转图像的生成类模型(Stable‑diffusion)构成的图像生成模块,所述文本生成模块和图像生成模块对输入内容进行处理,得到计算密集型任务,所述计算层设置为若干个服务器组成的集群,对计算密集型任务进行计算。本发明构建一个具备连贯叙述能力,支持开源技术的分镜头脚本生成系统,满足用户的分镜头文本创作需求的文本生成功能,并且能进行图像生成。
-
公开(公告)号:CN115471036B
公开(公告)日:2024-08-06
申请号:CN202210785150.2
申请日:2022-07-04
Applicant: 中国传媒大学
IPC: G06Q10/0639 , G06Q50/00 , G06F16/951
Abstract: 本发明公开了一种热点事件的群体情绪分析方法、存储介质及设备,第一次提出短视频集群的概念,创新性地提出了基于集群密度、信任度、平均集群情绪的群体情绪计算方案。本发明创新性地将内容影响力、内容权威性、内容的情绪凝聚力、内容被讨论的强度、传播路径等各种因素纳入群体情绪的情感计算过程中。同时本发明将地理位置、时间引入群体情绪分析系统,从时间、空间角度实现热点事件的舆情监测。
-
公开(公告)号:CN117892260A
公开(公告)日:2024-04-16
申请号:CN202410306890.2
申请日:2024-03-18
Applicant: 中国传媒大学
IPC: G06F18/25 , G06N3/0455
Abstract: 本发明公开了一种多模态短视频的情感可视化分析方法及系统,属于人工智能技术领域,包括:将多模态短视频输入数据格式预处理模块进行预处理;将预处理得到的视频和音频模态的数据输入无声检测模块,检测音频说话人的停顿点,将视频和音频切分为若干片段;将每个片段的音频数据输入到Whisper模型,转录得到文本模态的数据;利用音频检测的停顿点,对齐视频模态、音频模态和文本模态的数据,将同一片段的三种模态数据输入到V2EM‑RoBERTa模型,得到每个片段的情感预测结果;将各个片段的情感预测结果进行融合,得到多模态短视频整体的情感预测结果。本发明采用上述的一种多模态短视频的情感可视化分析方法及系统,提高了现有模型的文本模态的情感分析性能和准确性。
-
公开(公告)号:CN118690739A
公开(公告)日:2024-09-24
申请号:CN202410836726.2
申请日:2024-06-26
Applicant: 中国传媒大学
Abstract: 本发明公开了一种智能分镜头脚本生成系统及方法,属于软件工程的技术领域,包括依次连接的前端交互界面层、通信层一、后端业务逻辑层、通信层二和计算层,所述前端交互界面层包括文本编辑和图像预览功能,所述后端业务逻辑层包括大语言模型(LLM)构成的文本生成模块和文本转图像的生成类模型(Stable‑diffusion)构成的图像生成模块,所述文本生成模块和图像生成模块对输入内容进行处理,得到计算密集型任务,所述计算层设置为若干个服务器组成的集群,对计算密集型任务进行计算。本发明构建一个具备连贯叙述能力,支持开源技术的分镜头脚本生成系统,满足用户的分镜头文本创作需求的文本生成功能,并且能进行图像生成。
-
公开(公告)号:CN115471036A
公开(公告)日:2022-12-13
申请号:CN202210785150.2
申请日:2022-07-04
Applicant: 中国传媒大学
IPC: G06Q10/06 , G06Q50/00 , G06F16/951
Abstract: 本发明公开了一种热点事件的群体情绪分析方法、存储介质及设备,第一次提出短视频集群的概念,创新性地提出了基于集群密度、信任度、平均集群情绪的群体情绪计算方案。本发明创新性地将内容影响力、内容权威性、内容的情绪凝聚力、内容被讨论的强度、传播路径等各种因素纳入群体情绪的情感计算过程中。同时本发明将地理位置、时间引入群体情绪分析系统,从时间、空间角度实现热点事件的舆情监测。
-
-
-
-
-
-
-