-
公开(公告)号:CN115147462A
公开(公告)日:2022-10-04
申请号:CN202210806512.1
申请日:2022-07-08
Applicant: 浙江大学
Abstract: 本发明提供一种基于三维眼球模型和卡尔曼滤波的注视特征跟踪方法,能够提升视线追踪过程中特征提取的速度。所述方法包括下列步骤:1)检测部分输入图像序列的瞳孔特征和普尔钦斑特征的信息;2)根据特征构建三维眼球模型;3)基于卡尔曼滤波预测当前帧的眼球姿态;4)基于三维眼球模型计算当前预测的瞳孔和普尔钦斑的投影区域;5)适当扩大选区边缘并在其中检测当前帧的特征;6)重复上述步骤3)至5),直至人眼视频帧序列输入结束。
-
公开(公告)号:CN110658818B
公开(公告)日:2020-08-21
申请号:CN201910934799.4
申请日:2019-09-29
Applicant: 浙江大学
Abstract: 本发明公开了一种面向新型供电列车的多目标优化智能运行控制预测方法。由新型供电列车的静态动态大数据得到原始数据,参数化/正则化和归一化获得列车信息序列数据;利用列车信息序列数据中的局部数据得到理想条件下的列车运行状态数据;输入到长短期记忆网络中进行训练得到基础模型,将列车信息序列数据划分为多个部分,依次输入到基础模型中依次并再次进行训练得到了带有知识的基础模型;建立平方损失训练;真实采集的速度输入到带有知识的基础模型中进行预测输出获得下一时刻的牵引力。本发明不依赖大量数据,降低了训练数据量,得到符合现实列车运行数据分布的模型,提高了模型准确率并方便直接用于现实应用。
-
公开(公告)号:CN111178897A
公开(公告)日:2020-05-19
申请号:CN201911309071.9
申请日:2019-12-18
Applicant: 浙江大学
Abstract: 在不平衡数据集上进行快速特征学习的代价敏感的动态聚类方法,首先将不平衡数据的训练集全体送入前馈神经网络中,得到输出层之前的样本表征;设定聚类的类别数目K,将属于数据集大类的样本表征取出,用K-Means方法将这批样本聚为K类;利用得到的这批样本的聚类标签作为训练的类别标签,计算代价敏感系数下的神经网络损失,利用反向传播训练神经网络;迭代计算下一批样本表征,并设置K-Means的初始化标签为上一轮大类样本的K-Means标签,继续训练过程直到收敛。能够较好地解决不平衡数据集训练中出现的模型偏置情况,在大类和小类的分类结果上均表现良好,用于金融数据中不平衡数据的分类学习。
-
公开(公告)号:CN110658818A
公开(公告)日:2020-01-07
申请号:CN201910934799.4
申请日:2019-09-29
Applicant: 浙江大学
Abstract: 本发明公开了一种面向新型供电列车的多目标优化智能运行控制预测方法。由新型供电列车的静态动态大数据得到原始数据,参数化/正则化和归一化获得列车信息序列数据;利用列车信息序列数据中的局部数据得到理想条件下的列车运行状态数据;输入到长短期记忆网络中进行训练得到基础模型,将列车信息序列数据划分为多个部分,依次输入到基础模型中依次并再次进行训练得到了带有知识的基础模型;建立平方损失训练;真实采集的速度输入到带有知识的基础模型中进行预测输出获得下一时刻的牵引力。本发明不依赖大量数据,降低了训练数据量,得到符合现实列车运行数据分布的模型,提高了模型准确率并方便直接用于现实应用。
-
公开(公告)号:CN106937018B
公开(公告)日:2019-03-05
申请号:CN201710022650.X
申请日:2017-01-12
Applicant: 浙江大学
IPC: H04N1/54
Abstract: 一种基于RBF(Radical Basis Function)神经网络用于纺织品数码印花的色彩映射方法。此方法由下面三个部分组成:首先设计节省油墨量的CMYK样本集,利用测色仪采集颜色样本数据;对于印染机色域内颜色,利用RBF神经网络建立RGB与CMYK之间的转换关系;对于印染机色域外颜色,通过四种压缩方法,获得色域内的替换颜色。通过上述3个步骤建立的转换关系,可以将任何一张RGB图片精确地转换为对应CMYK颜色值图片,用于纺织品花型稿的喷墨印染。
-
公开(公告)号:CN106570901A
公开(公告)日:2017-04-19
申请号:CN201610991941.5
申请日:2016-11-11
Applicant: 浙江大学
CPC classification number: G06T5/002 , G06T2207/10012
Abstract: 一种基于CUDA的双目深度信息恢复加速方法,由三个有效步骤组成:1)基于双目深度信息恢复的图像预处理阶段进行并行计算;2)基于双目深度信息恢复的立体匹配阶段进行并行设计以及内存访问设计;3)并行处理基于双目深度信息恢复的滤波阶段,同时减少显存和主内存的切换,从而加速双目信息恢复方法。
-
公开(公告)号:CN105825187A
公开(公告)日:2016-08-03
申请号:CN201610149949.7
申请日:2016-03-16
Applicant: 浙江大学
IPC: G06K9/00
CPC classification number: G06K9/00228 , G06K9/00201
Abstract: 本发明公开了一种跨维度人脸地标点定位的方法,包括如下步骤:1)构造基于自旋图特征的三维人脸锚点自动检测算法;2)基于VCP特征进行boosting学习,构造二维人脸锚点自动检测算法;3)定义包括锚点在内的地标点集合,对部分三维人脸地标点进行标注,构造三维人脸+三维地标点耦合字典。基于在线LCC对该耦合字典进行学习,从而构造并实现基于在线LCC的三维地标点定位算法;4)考虑二维?三维耦合人脸之间的类质同象特性,通过锚点计算三维到二维人脸的投影变换矩阵,将该投影变换矩阵应用于三维人脸地标点,得到对应二维人脸地标点位置。通过跨维度人脸地标点定位算法,能够做到二维?三维人脸地标点的准确一致性定位。
-
公开(公告)号:CN105138953A
公开(公告)日:2015-12-09
申请号:CN201510405296.X
申请日:2015-07-09
Applicant: 浙江大学
IPC: G06K9/00
CPC classification number: G06K9/00335 , G06K9/00718
Abstract: 本发明公开了一种基于连续的多实例学习的视频中动作识别的方法。本发明包括如下步骤:1、从视频网站上收集电影数据作为训练数据样本集,同时对网站上收集字幕和剧本进行预处理,将剧本中的动作描述作为训练数据的视频级别的弱标记;2、通过弱标记将视频切分成多个视频片段,每个视频片段由一个动作组成;对于每个动作,利用视频片段训练基于连续的多实例学习的动作分类器;3、用户将待识别视频输入至训练好的多个动作分类器,计算待识别视频的每一帧属于该动作的概率;4、通过视频切割模型得到每一帧的动作类别,将动作类别返回给用户。本发明减少了人工标记费时费力的问题,同时减少了弱标记和转折帧带来的二义性问题。
-
公开(公告)号:CN104182970A
公开(公告)日:2014-12-03
申请号:CN201410389510.2
申请日:2014-08-08
Applicant: 浙江大学
IPC: G06T7/00
Abstract: 本发明公开了一种基于摄影构图规则的留念照人像站位推荐方法。此方法由三个有效步骤组成:1)利用图片样本中人与景物相对位置关系,学习正规则,分析人应该站在场景中的哪个位置;2)基于经验性构图规则,定义反规则,决定场景中不适合站人的区域;3)结合步骤1)得到的正规则得分和步骤2)得到的反规则得分,得到每个人站位总得分,对场景进行最优位置搜索。最终在景物图上画出人形图标把人像站位推荐给用户。
-
公开(公告)号:CN104077577A
公开(公告)日:2014-10-01
申请号:CN201410314802.X
申请日:2014-07-03
Applicant: 浙江大学
Abstract: 本发明公开了了一种基于卷积神经网络的商标检测方法。本发明首先收集多种类别的商标图片以及不包含商标的图片,并对包含商标的图片进行标注。然后初始化卷积神经网络,使用商标样本与非商标样本训练卷积神经网络。在测试图片过程中,首先使用目标区域选择方法选取测试图片中可能包含商标的候选窗口,并对候选窗口进行颜色空间转换和尺度缩放处理。然后将候选窗口输入到卷积神经网络中进行识别,并将识别为商标的候选窗口在测试图片中标示出来。本发明通过卷积神经网络将目标区域特征提取与识别相结合,避免特征设计带来的不确定性,并且对于旋转、平移、尺度变化有很好的不变性,基于分割的目标区域选择在提高检测速度的同时降低了误检率。
-
-
-
-
-
-
-
-
-