-
公开(公告)号:CN114118218B
公开(公告)日:2025-05-02
申请号:CN202111283429.2
申请日:2021-11-01
Applicant: 北京三快在线科技有限公司 , 中国科学院计算技术研究所
IPC: G06V10/774 , G06N3/0464 , G06N3/08
Abstract: 本说明书公开了一种模型训练的方法,由于终端可以从待训练模型所需的基础损失函数中,以用于收敛该待训练模型中模型参数的相关项作为导函数,并通过求解出该导函数的方式,得到用于训练待训练模型的实际损失函数,这样可以有效地去除基础损失函数中冗余项对待训练模型过程中的不利影响,从而有效地提高了模型训练的效率。
-
公开(公告)号:CN119027515A
公开(公告)日:2024-11-26
申请号:CN202411033679.4
申请日:2024-07-30
Applicant: 中国医学科学院肿瘤医院 , 中国科学院计算技术研究所
IPC: G06T7/90 , G06T3/4038
Abstract: 本发明提供一种病理切片图像的虚拟重染色方法,包括以下步骤:获取病理切片的组织病理图像;基于扩散模型构建组织病理图像的虚拟重染色网络;对虚拟重染色网络进行训练,将训练完成的虚拟重染色网络作为病理图像虚拟重染色模型;将组织病理图像分割为若干分块图像;通过病理图像虚拟重染色模型对分块图像进行虚拟重染色,得到重染色分块图像;对重染色分块图像进行拼接,得到重染色组织病理图像,本发明能够直接将扫描的HE染色图像生成IHC图像,避免了IHC切片制作过程所花的时间、金钱和人力、物力,使临床病理诊断更加便利,促进医药卫生事业的发展。
-
公开(公告)号:CN111222546A
公开(公告)日:2020-06-02
申请号:CN201911373760.6
申请日:2019-12-27
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种训练食品图像分类模型的方法,所述方法包括:对食品图像进行多尺度切割,形成包含原图像的多尺度食品切割图像;分别构建多个尺度的卷积神经网络模型,每个卷积神经网络模型对应一个尺度的食品切割图像;利用带有类别标签的食品图像作为目标图像,将其多尺度切割后代入多个尺度的卷积神经网络模型,利用预测的类别概率与真实的类别标签的比对结果作为反馈来进行多个尺度的卷积神经网络模型的优化。本发明创新性地提出了在原图像基础上进行多尺度切割形成多尺度切片的方式题。本发明在多个公共数据集都达到目前最好的识别性能:本发明的方法在公共数据集ETH Food-101上可以达到90.56%的识别准确率,在公共数据集VireoFood-172上可以达到90.61%的识别准确率。
-
公开(公告)号:CN103324954B
公开(公告)日:2017-02-08
申请号:CN201310214553.2
申请日:2013-05-31
Applicant: 中国科学院计算技术研究所
IPC: G06K9/66
Abstract: 本发明公开了一种基于树结构的图像分类方法及其系统,其中该方法包括:步骤一,提供具有标签信息的样本集合,以及根据标签信息的语义相关性构建的语义树结构;步骤二,根据该样本集合与该语义树结构,通过模型训练得到一组有监督的码本和分类器模型;步骤三,对于测试图像,利用训练得到的有监督的码本组生成多个中间层特征表示,根据该中间层特征表示并利用分类器模型预测该测试图像的类别标签。本发明克服了现有码本(特征)学习不能有效应对海量类别的分类问题。
-
公开(公告)号:CN106169065A
公开(公告)日:2016-11-30
申请号:CN201610509624.5
申请日:2016-06-30
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
IPC: G06K9/00
Abstract: 本发明公开了一种信息处理方法和电子设备,用于简化对图像的识别过程,所述方法包括:接收用于获取目标图像中信息的请求消息;处理所述目标图像,以确定用于描述所述目标图像的至少一个描述信息;匹配所述请求消息与所述至少一个描述信息;依据匹配结果,输出响应所述请求消息的描述信息。
-
公开(公告)号:CN105354252A
公开(公告)日:2016-02-24
申请号:CN201510680764.4
申请日:2015-10-19
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30247 , G06F17/3087
Abstract: 提供一种信息处理方法和装置,用于移动设备,所述信息处理方法包括:通过所述移动设备获得第一图像数据;从所述移动设备向服务器上传所述第一图像数据以及所述移动设备所在位置的第一地理坐标;以及从所述服务器接收所识别的所述第一图像数据的分类类别,其中,所述第一图像数据的分类类别是基于所述移动设备所在位置的第一地理坐标对从所述移动设备上传的第一图像数据进行识别所得到的分类类别。本发明提供的信息处理方法基于地理位置信息进行户外场景和物体图像识别,根据用户上传的图像数据内容和地理信息对于图像数据进行识别,并通过网络向移动客户端返回识别结果,使用户及时获取关于当前户外场景和物体的实用信息,提高用户的使用体验。
-
公开(公告)号:CN102883179A
公开(公告)日:2013-01-16
申请号:CN201110194206.9
申请日:2011-07-12
Applicant: 中国科学院计算技术研究所
IPC: H04N17/00
Abstract: 本发明提供一种视频质量客观评价方法,包括:10)在相同时间点切分源视频和待测视频,得到视频片段;20)分别提取来自源视频和待测视频的视频片段中视频帧的视频块,利用时空纹理特征计算对应视频块的相似度,其中所述时空纹理特征体现了像素之间的像素差异;30)根据对应视频块的相似度计算来自待测视频的视频帧的质量分数;40)根据来自待测视频的视频帧的质量分数计算来自待测视频的视频片段的质量值,进而计算待测视频的质量分数。上述方法所获得的质量分数更加符合人的主观感知。
-
公开(公告)号:CN101866429B
公开(公告)日:2012-09-05
申请号:CN201010195819.X
申请日:2010-06-01
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种多运动目标动作行为识别的训练方法,包括:从视频数据中提取每个运动目标的运动轨迹信息;为运动目标的运动轨迹信息分层,在各个所述层次上为多运动目标动作行为的运动模式建模;综合所述视频中的全局和局部的运动信息对所述运动模式的模型进行特征描述;所述特征至少包括使用高斯过程描述运动轨迹的三维超参数向量;根据特征训练分类器。本发明还提出了多运动目标动作行为识别方法,该方法利用训练方法得到的分类器实现视频中多运动目标动作行为的识别。本发明从概率角度使用高斯过程来表述目标的运动轨迹,从三个粒度层次上对多人行为模式进行建模提取特征,使得对多人行为的表述更符合实际。
-
公开(公告)号:CN101354786B
公开(公告)日:2011-07-06
申请号:CN200710119387.2
申请日:2007-07-23
Applicant: 中国科学院计算技术研究所
IPC: G06T7/20
Abstract: 一种体育视频事件分析方法,包含通过提取场地中的标识线及场景分类方法识别事件发生的场地区域,对比赛事件的线路模式进行分类;通过对多对象轨迹的交互分析,针对比赛事件生成球和队员的交互轨迹,据此对比赛事件的交互模式进行层次化的由粗至细分析;最终,形成摘要性质的战术模式总结,呈现给用户。本发明对视频事件中队员(队伍)在完成一次战术动作时所采用战略方法进行从专业角度自动分析,以简洁、清晰的方式呈现出来,给教练和队员的学习和训练以帮助。
-
公开(公告)号:CN101894276A
公开(公告)日:2010-11-24
申请号:CN201010195802.4
申请日:2010-06-01
Applicant: 中国科学院计算技术研究所
IPC: G06K9/66
CPC classification number: G06K9/00335 , G06K9/4671 , G06K2009/3291
Abstract: 本发明提供一种人体动作识别的训练方法,包括:从视频文件中提取时空兴趣点;将所有时空兴趣点根据其所包含的特征描述子量化到相应的视频单词上,并为视频单词生成统计直方图;根据视频单词所在时空邻域内的时空上下文信息得到该视频单词所在时空邻域内的其它视频单词,由该视频单词与某一满足时空约束的其它视频单词形成时空视频词组;对视频单词所在时空邻域内的时空上下文做聚类,得到语境单词,由视频单词与语境单词形成时空视频单词团体;从时空视频词组中选择代表性时空视频词组,从时空视频单词团体中选择代表性时空视频单词团体;利用视频单词、代表性时空视频词组、代表性时空视频单词团体中的一种特征或将多种特征融合后的结果训练分类器。
-
-
-
-
-
-
-
-
-