-
公开(公告)号:CN111401368A
公开(公告)日:2020-07-10
申请号:CN202010211414.4
申请日:2020-03-24
Applicant: 武汉大学
Abstract: 本发明公开了一种基于深度学习的新闻视频标题提取方法,包括关键帧提取、关键帧文字检测、关键帧文字特征提取和特征聚类。在关键帧提取过程中,使用帧间差分法,将与前一帧内容变化较大的帧作为关键帧;在关键帧文字检测过程中,使用EAST网络确定关键帧的文字区域;在关键帧文字特征提取过程中,使用卷积神经网络(CNN)提取关键帧的特征,再将特征依次输入循环神经网络(RNN),得到文字区域的特征向量;在特征聚类过程中,使用欧氏距离得到相邻关键帧之间的相似度,根据相似度对关键帧的文字进行聚类,得到新闻视频标题图像。本发明利用深度学习技术,依据关键帧的文字特征和新闻视频字幕特征产生新闻视频标题,具有提取准确、运算快的优点。
-
公开(公告)号:CN111126126A
公开(公告)日:2020-05-08
申请号:CN201910999726.3
申请日:2019-10-21
Applicant: 武汉大学
Abstract: 本发明公开了一种基于图卷积神经网络的视频智能拆条方法,包括关键帧提取、帧间相似度计算和帧聚类三个步骤。首先,基于帧间差分实现关键帧提取,将差距较大的相邻帧作为关键帧;然后,通过Siamase孪生网络得到相似度矩阵,矩阵中的元素即为关键帧之间的欧氏距离;最后,利用相似度矩阵和关键帧之间的时序关系构建拓扑图,通过卷积神经网络对关键帧进行聚类,实现故事分类,从而达到视频智能拆条目的。本发明可以准确地将视频划分为具有特定语义的视频片段,具有显著的应用价值。
-
公开(公告)号:CN111401368B
公开(公告)日:2023-04-18
申请号:CN202010211414.4
申请日:2020-03-24
Applicant: 武汉大学
IPC: G06V20/62 , G06V20/40 , G06V10/74 , G06V10/762 , G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于深度学习的新闻视频标题提取方法,包括关键帧提取、关键帧文字检测、关键帧文字特征提取和特征聚类。在关键帧提取过程中,使用帧间差分法,将与前一帧内容变化较大的帧作为关键帧;在关键帧文字检测过程中,使用EAST网络确定关键帧的文字区域;在关键帧文字特征提取过程中,使用卷积神经网络(CNN)提取关键帧的特征,再将特征依次输入循环神经网络(RNN),得到文字区域的特征向量;在特征聚类过程中,使用欧氏距离得到相邻关键帧之间的相似度,根据相似度对关键帧的文字进行聚类,得到新闻视频标题图像。本发明利用深度学习技术,依据关键帧的文字特征和新闻视频字幕特征产生新闻视频标题,具有提取准确、运算快的优点。
-
公开(公告)号:CN114780767B
公开(公告)日:2024-08-13
申请号:CN202210393416.9
申请日:2022-04-14
Applicant: 武汉大学
IPC: G06F16/532 , G06F16/51 , G06F16/55 , G06F16/583 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于深度卷积神经网络的大规模图像检索方法及系统,通过构建深度卷积神经网络(DHN)进行大规模图像检索,DHN包括基于ResNet50的特征提取、基于通道和空间注意(CSA)的特征细化、分类层和哈希层以及权重层四部分组成;DHN通过CSA实现自底向上的像素显著性关注,通过分类标签监督实现自顶向下的语义约束;DHN采用自适应加权学习算法为每一位哈希码生成权值,然后根据权重所代表的位的重要性,从长哈希码直接生成短哈希码。本发明方法具有更高的哈希码生成精度和速度,从而适合大规模图像检索任务。
-
公开(公告)号:CN114780767A
公开(公告)日:2022-07-22
申请号:CN202210393416.9
申请日:2022-04-14
Applicant: 武汉大学
IPC: G06F16/532 , G06F16/51 , G06F16/55 , G06F16/583 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度卷积神经网络的大规模图像检索方法及系统,通过构建深度卷积神经网络(DHN)进行大规模图像检索,DHN包括基于ResNet50的特征提取、基于通道和空间注意(CSA)的特征细化、分类层和哈希层以及权重层四部分组成;DHN通过CSA实现自底向上的像素显著性关注,通过分类标签监督实现自顶向下的语义约束;DHN采用自适应加权学习算法为每一位哈希码生成权值,然后根据权重所代表的位的重要性,从长哈希码直接生成短哈希码。本发明方法具有更高的哈希码生成精度和速度,从而适合大规模图像检索任务。
-
公开(公告)号:CN111126126B
公开(公告)日:2022-02-01
申请号:CN201910999726.3
申请日:2019-10-21
Applicant: 武汉大学
IPC: G06V20/40 , G06V10/74 , G06V10/762 , G06V10/82 , G06K9/62
Abstract: 本发明公开了一种基于图卷积神经网络的视频智能拆条方法,包括关键帧提取、帧间相似度计算和帧聚类三个步骤。首先,基于帧间差分实现关键帧提取,将差距较大的相邻帧作为关键帧;然后,通过Siamase孪生网络得到相似度矩阵,矩阵中的元素即为关键帧之间的欧氏距离;最后,利用相似度矩阵和关键帧之间的时序关系构建拓扑图,通过卷积神经网络对关键帧进行聚类,实现故事分类,从而达到视频智能拆条目的。本发明可以准确地将视频划分为具有特定语义的视频片段,具有显著的应用价值。
-
-
-
-
-