一种有效防止卷积神经网络过拟合的图像分类方法

    公开(公告)号:CN104102919B

    公开(公告)日:2017-05-24

    申请号:CN201410333924.3

    申请日:2014-07-14

    Applicant: 同济大学

    Inventor: 王瀚漓 俞定君

    Abstract: 本发明涉及一种有效防止卷积神经网络过拟合的图像分类方法,包括:获得图像训练集和图像测试集;卷积神经网络模型的训练;用训练后的卷积神经网络模型对图像测试集进行图像分类。其中,卷积神经网络模型训练的步骤为:对图像训练集中的图像数据进行预处理和样本扩增,形成训练样本;对训练样本进行前向传播提取图像特征;在Softmax分类器中计算各样本的分类概率;根据概率yi计算得到训练误差;利用所述训练误差从卷积神经网络的最后一层依次往前反向传播,同时利用随机梯度下降法SGD修改网络权值矩阵W。与现有技术相比,本发明具有分类精度高、收敛速度快、计算效率高等优点。

    一种近似视频编码系统
    122.
    发明授权

    公开(公告)号:CN103533353B

    公开(公告)日:2016-11-09

    申请号:CN201310455325.4

    申请日:2013-09-29

    Applicant: 同济大学

    Inventor: 王瀚漓 马鸣

    Abstract: 本发明涉及一种近似视频编码系统,包括:分析器,用于检测各视频间的近似关系,获得一组近似视频,并输出与该近似视频相应的索引文件:编码器,与分析器连接,用于接收分析器输出的索引文件,并根据该索引文件对近似视频进行编码压缩,输出与每个视频相对应的独立码流:集成器,与编码器连接,用于将所有独立码流进行整合,生成一个单一码流:解码器,与集成器连接,用于对整合后的单一码流进行解码。与现有技术相比,本发明具有压缩效率高、可有效降低视频数据库空间消耗等优点。

    一种基于视频尺度信息的视频分类方法

    公开(公告)号:CN105488519A

    公开(公告)日:2016-04-13

    申请号:CN201510780201.2

    申请日:2015-11-13

    Applicant: 同济大学

    Inventor: 王瀚漓 张博文

    CPC classification number: G06K9/6269 G06T2207/10016 G06T2207/30196

    Abstract: 本发明涉及一种基于视频尺度信息的视频分类方法,包括步骤:1)将视频数据集划分为训练数据和测试数据,提取每个视频的特征点以及特征点的轨迹,并得到视频的空间尺度以及时间尺度;2)使用基于轨迹使用描述算法,通过计算特征点邻域的梯度直方图向量、光流直方图向量、x分量运动边界直方图向量和y分量运动边界直方图向量,得到特征描述向量;3)使用PCA方法将每个视频中的每个特征描述向量降维至原维度的一半;4)生成视频数据集中每一个视频的费舍尔向量;5)训练得到线性支持向量机分类模型;6)使用线性支持向量机分类模型对测试数据中的视频进行分类。与现有技术相比,本发明具有鲁棒性好,准确度更高等优点。

    一种基于最大相似度匹配的图片检索方法

    公开(公告)号:CN104615676A

    公开(公告)日:2015-05-13

    申请号:CN201510028073.6

    申请日:2015-01-20

    Applicant: 同济大学

    CPC classification number: G06F17/30268 G06F17/3028 G06K9/6221

    Abstract: 本发明涉及一种基于最大相似度匹配的图片检索方法,包括以下步骤:1)获取训练图片集;2)在多尺度空间上对获取的图片进行特征点检测和描述;3)对步骤2)提取的特征集进行聚类并生成包含k个视觉词汇的视觉字典;4)将步骤2)提取的每个特征映射到与当前特征l2距离最小的视觉词汇上,并将当前特征与相应视觉词汇的归一化残差向量存储在倒排索引结构中,形成查询数据库;5)获取待检索图片,执行步骤2)和4),获得待检索图片的倒排索引结构,根据该倒排索引结构检索查询数据库,基于最大相似度匹配,获得待检索图片的检索结果。与现有技术相比,本发明具有鲁棒性好、计算效率高等优点。

    一种高效视频编码全零4×4系数块提前检测方法

    公开(公告)号:CN104185025A

    公开(公告)日:2014-12-03

    申请号:CN201310196481.3

    申请日:2013-05-23

    Applicant: 同济大学

    Inventor: 王瀚漓 杜焓

    Abstract: 本发明涉及一种高效视频编码全零4×4系数块提前检测方法,包括以下步骤:1)设定量化参数Qp和二维DCT变换矩阵C;2)根据Qp、C以及需检测的残差块计算全零块检测的阈值Th1和Th2;3)对于一个4×4残差块计算其对应的检测参数SAD;4)判断SAD是否满足SAD<Th1,若是,则判断该4×4残差块为全零块,返回步骤3)进行下一个残差块的检测,若否,则执行步骤5);5)判断SAD是否满足SAD<Th2,若是,则判断该4×4残差块为全零块,返回步骤3)进行下一个残差块的检测,若否,则对该4×4残差块进行DCT、量化、反量化和反DCT操作,返回步骤3)。与现有技术相比,本发明具有可提高视频编码速度、降低编码计算复杂度且检测效率高等优点。

    一种有效防止卷积神经网络过拟合的图像分类方法

    公开(公告)号:CN104102919A

    公开(公告)日:2014-10-15

    申请号:CN201410333924.3

    申请日:2014-07-14

    Applicant: 同济大学

    Inventor: 王瀚漓 俞定君

    Abstract: 本发明涉及一种有效防止卷积神经网络过拟合的图像分类方法,包括:获得图像训练集和图像测试集;卷积神经网络模型的训练;用训练后的卷积神经网络模型对图像测试集进行图像分类。其中,卷积神经网络模型训练的步骤为:对图像训练集中的图像数据进行预处理和样本扩增,形成训练样本;对训练样本进行前向传播提取图像特征;在Softmax分类器中计算各样本的分类概率;根据概率yi计算得到训练误差;利用所述训练误差从卷积神经网络的最后一层依次往前反向传播,同时利用随机梯度下降法SGD修改网络权值矩阵W。与现有技术相比,本发明具有分类精度高、收敛速度快、计算效率高等优点。

    一种基于GPU的面向海量多媒体数据的MapReduce平台

    公开(公告)号:CN103699656A

    公开(公告)日:2014-04-02

    申请号:CN201310738761.2

    申请日:2013-12-27

    Applicant: 同济大学

    CPC classification number: G06F9/5027

    Abstract: 本发明涉及一种基于GPU的面向海量多媒体数据的MapReduce平台,包括平台驱动器和工作子模块,平台驱动器采用MapReduce计算模型将图像/视频检索处理任务分割为若干Map任务,Map任务的数据存储在HDFS中,每个Map任务启动时,利用平台驱动器传入的文件列表获取任务数据,并将具体的计算任务分配给所述的工作子模块计算,工作子模块中的任务调度器将任务派发给GPU或CPU处理,在计算处理过程中通过HDFS的本地库libhdfs.so获得计算所需的数据,之后将计算处理后的数据直接写入HDFS。与现有技术相比,本发明可以实现海量多媒体数据的高性能处理,不仅能大大提高计算速度,同时还能保证计算精度。

    基于最优停止理论的编码模式快速自动选择方法

    公开(公告)号:CN102957932A

    公开(公告)日:2013-03-06

    申请号:CN201210435266.X

    申请日:2012-11-02

    Applicant: 同济大学

    Inventor: 王瀚漓 衡岳

    Abstract: 本发明涉及一种基于最优停止理论的编码模式快速自动选择方法,该方法包括以下步骤:1)将N个候选模式映射为持续问题中的N个变量,并获取当前待编码宏块在每个模式下对应的概率pk;2)将N个候选模式按其概率降序排列;3)应用最优停止理论根据步骤2)的顺序依次检查各候选模式,计算并获得最佳编码模式和最优停止点;4)根据当前最佳编码模式和最优停止点更新参数,并返回步骤1),直至整个视频序列编码完成。与现有技术相比,本发明具有可缩短编码时间、降低计算量、实用性强等优点。

Patent Agency Ranking