一种多尺度融合的食品图像分类模型训练及图像分类方法

    公开(公告)号:CN111222546A

    公开(公告)日:2020-06-02

    申请号:CN201911373760.6

    申请日:2019-12-27

    Abstract: 本发明提供一种训练食品图像分类模型的方法,所述方法包括:对食品图像进行多尺度切割,形成包含原图像的多尺度食品切割图像;分别构建多个尺度的卷积神经网络模型,每个卷积神经网络模型对应一个尺度的食品切割图像;利用带有类别标签的食品图像作为目标图像,将其多尺度切割后代入多个尺度的卷积神经网络模型,利用预测的类别概率与真实的类别标签的比对结果作为反馈来进行多个尺度的卷积神经网络模型的优化。本发明创新性地提出了在原图像基础上进行多尺度切割形成多尺度切片的方式题。本发明在多个公共数据集都达到目前最好的识别性能:本发明的方法在公共数据集ETH Food-101上可以达到90.56%的识别准确率,在公共数据集VireoFood-172上可以达到90.61%的识别准确率。

    一种基于树结构的图像分类方法及其系统

    公开(公告)号:CN103324954B

    公开(公告)日:2017-02-08

    申请号:CN201310214553.2

    申请日:2013-05-31

    Abstract: 本发明公开了一种基于树结构的图像分类方法及其系统,其中该方法包括:步骤一,提供具有标签信息的样本集合,以及根据标签信息的语义相关性构建的语义树结构;步骤二,根据该样本集合与该语义树结构,通过模型训练得到一组有监督的码本和分类器模型;步骤三,对于测试图像,利用训练得到的有监督的码本组生成多个中间层特征表示,根据该中间层特征表示并利用分类器模型预测该测试图像的类别标签。本发明克服了现有码本(特征)学习不能有效应对海量类别的分类问题。

    一种信息处理方法和装置
    26.
    发明公开

    公开(公告)号:CN105354252A

    公开(公告)日:2016-02-24

    申请号:CN201510680764.4

    申请日:2015-10-19

    CPC classification number: G06F17/30247 G06F17/3087

    Abstract: 提供一种信息处理方法和装置,用于移动设备,所述信息处理方法包括:通过所述移动设备获得第一图像数据;从所述移动设备向服务器上传所述第一图像数据以及所述移动设备所在位置的第一地理坐标;以及从所述服务器接收所识别的所述第一图像数据的分类类别,其中,所述第一图像数据的分类类别是基于所述移动设备所在位置的第一地理坐标对从所述移动设备上传的第一图像数据进行识别所得到的分类类别。本发明提供的信息处理方法基于地理位置信息进行户外场景和物体图像识别,根据用户上传的图像数据内容和地理信息对于图像数据进行识别,并通过网络向移动客户端返回识别结果,使用户及时获取关于当前户外场景和物体的实用信息,提高用户的使用体验。

    一种视频质量客观评价方法

    公开(公告)号:CN102883179A

    公开(公告)日:2013-01-16

    申请号:CN201110194206.9

    申请日:2011-07-12

    Abstract: 本发明提供一种视频质量客观评价方法,包括:10)在相同时间点切分源视频和待测视频,得到视频片段;20)分别提取来自源视频和待测视频的视频片段中视频帧的视频块,利用时空纹理特征计算对应视频块的相似度,其中所述时空纹理特征体现了像素之间的像素差异;30)根据对应视频块的相似度计算来自待测视频的视频帧的质量分数;40)根据来自待测视频的视频帧的质量分数计算来自待测视频的视频片段的质量值,进而计算待测视频的质量分数。上述方法所获得的质量分数更加符合人的主观感知。

    多运动目标动作行为识别的训练方法和识别方法

    公开(公告)号:CN101866429B

    公开(公告)日:2012-09-05

    申请号:CN201010195819.X

    申请日:2010-06-01

    Abstract: 本发明提供一种多运动目标动作行为识别的训练方法,包括:从视频数据中提取每个运动目标的运动轨迹信息;为运动目标的运动轨迹信息分层,在各个所述层次上为多运动目标动作行为的运动模式建模;综合所述视频中的全局和局部的运动信息对所述运动模式的模型进行特征描述;所述特征至少包括使用高斯过程描述运动轨迹的三维超参数向量;根据特征训练分类器。本发明还提出了多运动目标动作行为识别方法,该方法利用训练方法得到的分类器实现视频中多运动目标动作行为的识别。本发明从概率角度使用高斯过程来表述目标的运动轨迹,从三个粒度层次上对多人行为模式进行建模提取特征,使得对多人行为的表述更符合实际。

    一种体育视频事件分析方法

    公开(公告)号:CN101354786B

    公开(公告)日:2011-07-06

    申请号:CN200710119387.2

    申请日:2007-07-23

    Abstract: 一种体育视频事件分析方法,包含通过提取场地中的标识线及场景分类方法识别事件发生的场地区域,对比赛事件的线路模式进行分类;通过对多对象轨迹的交互分析,针对比赛事件生成球和队员的交互轨迹,据此对比赛事件的交互模式进行层次化的由粗至细分析;最终,形成摘要性质的战术模式总结,呈现给用户。本发明对视频事件中队员(队伍)在完成一次战术动作时所采用战略方法进行从专业角度自动分析,以简洁、清晰的方式呈现出来,给教练和队员的学习和训练以帮助。

    人体动作识别的训练方法和识别方法

    公开(公告)号:CN101894276A

    公开(公告)日:2010-11-24

    申请号:CN201010195802.4

    申请日:2010-06-01

    CPC classification number: G06K9/00335 G06K9/4671 G06K2009/3291

    Abstract: 本发明提供一种人体动作识别的训练方法,包括:从视频文件中提取时空兴趣点;将所有时空兴趣点根据其所包含的特征描述子量化到相应的视频单词上,并为视频单词生成统计直方图;根据视频单词所在时空邻域内的时空上下文信息得到该视频单词所在时空邻域内的其它视频单词,由该视频单词与某一满足时空约束的其它视频单词形成时空视频词组;对视频单词所在时空邻域内的时空上下文做聚类,得到语境单词,由视频单词与语境单词形成时空视频单词团体;从时空视频词组中选择代表性时空视频词组,从时空视频单词团体中选择代表性时空视频单词团体;利用视频单词、代表性时空视频词组、代表性时空视频单词团体中的一种特征或将多种特征融合后的结果训练分类器。

Patent Agency Ranking