-
公开(公告)号:CN114359908A
公开(公告)日:2022-04-15
申请号:CN202111550512.1
申请日:2021-12-17
Applicant: 浙江大学
IPC: G06V30/148 , G06V30/16
Abstract: 本发明涉及基于像素点级注意力机制的商品图片可读文字甄别方法,包括:通过OCR技术获取商品图片的文字块坐标及文字内容;通过像素点级注意力机制获取文字块的可读置信度;通过自适应阈值和各文字块的可读置信度进行可读文字筛选,改进了现有技术中,利用预训练语言模型对文字块进行筛选时,受到语料库限制造成的矫正结果单一的问题,从而提高了筛选的准确度。
-
公开(公告)号:CN110097084B
公开(公告)日:2021-08-31
申请号:CN201910264911.8
申请日:2019-04-03
Applicant: 浙江大学
Abstract: 通过投射特征训练多任务学生网络的知识融合方法,由以下步骤组成:首先初始化TargetNet(目标学生网络)的结构与教师网络相同,通过通道编码,将TargetNet中融合的特征图投射为对应任务的特征图;逐个训练TargetNet中与教师网络对应的block,得到融合的特征图;确定TargetNet中不同任务开始分支的各自位置;将教师网络中的对应block加入学生网络,作为不同任务的分支,并移除TargetNet中末端的block,得到TargetNet最终结构;最后调优学生网络。本方法能够使用无标签数据集,融合多个不同任务的教师网络,得到性能优越的轻量级学生网络。
-
公开(公告)号:CN111160124A
公开(公告)日:2020-05-15
申请号:CN201911265084.0
申请日:2019-12-11
Applicant: 浙江大学
Abstract: 一种基于知识重组的深度模型定制方法,包括:1)收集已有训练好的深度人脸属性识别模型,构建人脸属性识别模型库,将各类模型进行分组归类;2)根据当前对人脸属性识别的任务需求,将目标任务分解为一系列识别不同人脸属性的“组件任务”,并从深度模型库中选择相关的模型;3)对选中的人脸属性识别模型,进行知识过滤,将多个深度模型中,与“组件任务”相关的知识合并到“组件网络”中;4)对“组件网络”进行组合,得到最终的“目标网络”。本发明利用现有深度模型的知识,逐过程指导新模型的学习,有效减少对数据标注、数据量的依赖,降低训练新深度模型耗费的周期和资源。
-
公开(公告)号:CN110310342A
公开(公告)日:2019-10-08
申请号:CN201910598505.5
申请日:2019-07-04
Applicant: 浙江大学滨海产业技术研究院
IPC: G06T7/90
Abstract: 本发明提供了一种适用于灰度颜色空间图像相关色域映射方法,包括以下步骤:S1:小色域边界上下阈值获取;S2:将灰度图像的二维平面结合灰度值构建为三维颜色曲面;S3:灰度颜色曲面待映射范围边界设置;S4:基于颜色准确度与纹理保持权衡构建待求解优化模型;S5:利用迭代求解的方法获得模型的次优解。本发明所述的一种适用于灰度颜色空间图像相关色域映射方法,通过设置参数来动态调整颜色映射的精准度与灰度图像层次纹理信息的保持程度,实现灰度图像保持颜色纹理的同时实现颜色的精准映射。
-
公开(公告)号:CN109614968A
公开(公告)日:2019-04-12
申请号:CN201811176340.4
申请日:2018-10-10
Applicant: 浙江大学
Abstract: 一种基于多尺度混合图像风格化的车牌检测场景图片生成方法,包括:1)收集不同场景下的包含车牌的图片,这里的不同场景包含白天、傍晚、雨天、雪天、阴天和晴天共6个场景;2)划分源域图像和目标域图像,选取难以采集的场景作为目标域,比较容易的场景作为源域;3)对于每一个源-目标域场景对,将源域划分训练集和测试集,将训练集和具有代表性的目标域图片一起输入给多尺度混合图像风格化模型MSST并进行训练;4)测试阶段,将源域中测试集的图片输入MSST模型生成内容接近源域且场景风格接近目标域的图片。
-
公开(公告)号:CN106936964A
公开(公告)日:2017-07-07
申请号:CN201611152386.3
申请日:2016-12-14
Applicant: 浙江大学
IPC: H04M1/24 , G06K9/62 , G06K9/40 , G01N21/958 , G01N21/88
Abstract: 一种基于霍夫变换模板匹配的手机屏幕角点检测的方法,包括:1)利用图像的形态学变换对手机屏幕区域进行预处理,消除噪声、摩尔纹等干扰信号;2)对步骤1)中所得图片缩小到一定的尺度,通过边缘检测算法找出图片中存在的边界,利用霍夫变换对边界进行投票,得到图片中存在的直线段,从直线段集合中选择最合适的四条线段,使得四条线段所在的直线能够围成一个四边形的屏幕区域;3)对步骤2)中所得的四边形区域,利用该四边形的四个夹角自适应地产生角点模板,用该模板在四边形的四个顶点附近区域内进一步精确定位,并得到最终的屏幕区域检测结果。
-
公开(公告)号:CN103559196B
公开(公告)日:2017-02-22
申请号:CN201310438216.1
申请日:2013-09-23
Applicant: 浙江大学
Abstract: 基于多核典型相关分析的视频检索方法,从互联网上抓取视频及对应的文本描述后,针对每个视频进行如下操作:首先根据镜头是否突变对视频进行切分,抽取其关键帧,并提取关键帧中的视觉特征和镜头的运动特征构成视频特征向量,针对每个视频的文本描述提取词频特征;然后利用多核典型相关分析方法得到视频特征和词频特征的映射矩阵及其低维表示,使它们在低维空间的相关性最大;最后,当用户输入关键词做视频检索时,根据词频特征的映射矩阵得到关键词词频特征的低维表示,按照其与视频特征低维表示的余弦相似度由大到小依次返回视频检索结果。本方法的优点在于:增强视频内容和检索关键词的相关程度,提高用户的检索精度。
-
公开(公告)号:CN104636727A
公开(公告)日:2015-05-20
申请号:CN201510063018.0
申请日:2015-02-08
Applicant: 浙江大学
IPC: G06K9/00
CPC classification number: G06K9/00228 , G06K9/00248
Abstract: 本发明提供了一种适应多表情多姿态的人脸识别方法。本发明首先对输入的人脸照片做人脸检测,在人脸区域和数据集或者视频中的人脸区域做特征点的检测,得到每个图片特征点的集合。然后对于要进行匹配的人脸图片,将他们对应的特征点集合进行拟合,得到拟合参数;最后利用得到的拟合参数,生成新的匹配图片,对其进行填充调整,进行特征提取以及相似度的匹配。本发明无需估计人脸具体的姿态角度下,局部特征的提取和比对更加精确了,识别率也提高。
-
公开(公告)号:CN104463865A
公开(公告)日:2015-03-25
申请号:CN201410734058.9
申请日:2014-12-05
Applicant: 浙江大学
IPC: G06T7/00
CPC classification number: G06T7/11 , G06T2207/10004 , G06T2207/30196
Abstract: 本发明公开了一种人像分割方法。本发明首先从电商网站收集多张包含站立人像的照片,并对人像所在区域进行标注,生成训练数据集。然后初始化卷积神经网络,使用训练数据集训练卷积神经网络。在测试图片的过程中,首先使用卷积神经网络在测试图片中标注出可能是人像的区域,然后将该区域作为可能的前景区域,初始化Grabcut算法,最后使用Grabcut算法分割出人像区域。本发明通过卷积神经网络预测出可能存在目标的区域,把可能的目标区域作为掩模,使用掩模初始化Grabcut,解决了Grabcut需要交互的问题,提高了分割的准确性。
-
公开(公告)号:CN102737122B
公开(公告)日:2014-12-10
申请号:CN201210192428.1
申请日:2012-06-08
Applicant: 浙江大学
Abstract: 本发明提供了一种提取网页中验证码图片的方法。由于验证码图片在网页中并没有一个固定的网址链接,并且图片随机生成,对其进行刷新或者保存操作会改变图片内容,因此提取验证码图片是很多需要验证码图片的软件应用的一个关键难题。在该方法中,利用光标位置、验证码输入框位置、图片位置、图片大小、图片视觉与内容特征、图片关键字、图片长宽比例等信息将网页中的验证码图片提取出来。
-
-
-
-
-
-
-
-
-