-
公开(公告)号:CN101268505A
公开(公告)日:2008-09-17
申请号:CN200680034868.7
申请日:2006-12-27
Applicant: 三菱电机株式会社
Inventor: 赖古纳唐·拉达克里希南 , 迈克尔·西拉库萨 , 阿贾伊·迪瓦卡兰 , 大塚功
CPC classification number: H04N21/4394 , G06K9/00718 , G10L25/00 , H04N21/235 , H04N21/435 , H04N21/8456 , Y10S707/99942 , Y10S707/99943 , Y10S707/99945 , Y10S707/99948
Abstract: 一种利用视频的音频信号和类别的集合对该视频进行分类的方法。将在集合中选定的分类合并为重要类别子集,该重要类别子集对于具体精彩场面任务是至关重要的,集合的剩余分类被合并为其它类别子集。所述重要类别子集和其他类别子集通过训练用音频数据进行训练以形成任务特有的分类器。接着,利用该任务特有的分类器,所述音频信号可被分类为重要音频信号或其他音频信号,以在对应于所述具体的精彩场面任务的视频中识别精彩场面。被分类的音频信号可用于对所述视频进行分段和摘要。
-
公开(公告)号:CN101268505B
公开(公告)日:2011-08-17
申请号:CN200680034868.7
申请日:2006-12-27
Applicant: 三菱电机株式会社
Inventor: 赖古纳唐·拉达克里希南 , 迈克尔·西拉库萨 , 阿贾伊·迪瓦卡兰 , 大塚功
CPC classification number: H04N21/4394 , G06K9/00718 , G10L25/00 , H04N21/235 , H04N21/435 , H04N21/8456 , Y10S707/99942 , Y10S707/99943 , Y10S707/99945 , Y10S707/99948
Abstract: 一种利用视频的音频信号和类别的集合对该视频进行分类的方法。将在集合中选定的分类合并为重要类别子集,该重要类别子集对于具体精彩场面任务是至关重要的,集合的剩余分类被合并为其它类别子集。所述重要类别子集和其他类别子集通过训练用音频数据进行训练以形成任务特有的分类器。接着,利用该任务特有的分类器,所述音频信号可被分类为重要音频信号或其他音频信号,以在对应于所述具体的精彩场面任务的视频中识别精彩场面。被分类的音频信号可用于对所述视频进行分段和摘要。
-