-
公开(公告)号:CN101540041B
公开(公告)日:2012-06-27
申请号:CN200810102495.3
申请日:2008-03-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种扫描文档浏览适配方法,包括下列步骤:步骤A,对输入的扫描文档的原始页面图像,进行预处理,去掉噪音和不必要的背景信息;步骤B,判断并将所述原始页面图像划分为多个大横向部分,对每个大横向部分根据电子设备的屏幕宽度大小进行适配的分析处理;步骤C,根据分析处理结果,确定新的适配页面图像的版式安排,生成最后结果。其对扫描的图像格式的电子文档,自动转换为可供小尺寸屏幕阅读的版面模式,方便用户的使用。
-
公开(公告)号:CN101364307B
公开(公告)日:2011-06-29
申请号:CN200710120123.9
申请日:2007-08-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种高维动态数据处理方法。首先计算高维动态数据对应的低维变量;然后计算低维变量张成的低维空间到高维数据所在的高维空间的映射;最后在低维空间采集样本,利用所述映射将样本映射到所述高维空间,形成新的高维动态数据。本方法应用于动态纹理图像序列方面,获得更逼真视觉效果且可以处理大多数自然场景中的动态纹理;应用于3D人体运动捕获数据处理方面,能够合成用户指定约束的人体运动数据。
-
公开(公告)号:CN101493943B
公开(公告)日:2011-03-23
申请号:CN200810056904.0
申请日:2008-01-25
Applicant: 中国科学院计算技术研究所
IPC: G06T7/20
Abstract: 本发明公开了一种粒子滤波跟踪方法和跟踪装置,该方法包括:步骤S1:在原始图像帧上采样获得初始粒子集,所述粒子是指系统状态的可能的取值,所述系统状态包括运动对象的位置和尺度;步骤S2:对原始图像帧的像素经过前景背景分类得到概率图;步骤S3:按照系统动态模型传播粒子并采样,得到第二粒子集;步骤S4:按照在概率图上构建的系统观察模型得到所述第二粒子的权重,并归一化粒子的权重得到第三粒子集;步骤S5:对所述第三粒子集进行重要性重采样,得到重采样粒子集;步骤S6:通过重采样粒子集计算系统状态并输出。本发明提高了粒子滤波的计算效率,并提高了鲁棒性,不容易丢失目标。
-
公开(公告)号:CN101364307A
公开(公告)日:2009-02-11
申请号:CN200710120123.9
申请日:2007-08-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种高维动态数据处理方法。首先计算高维动态数据对应的低维变量;然后计算低维变量张成的低维空间到高维数据所在的高维空间的映射;最后在低维空间采集样本,利用所述映射将样本映射到所述高维空间,形成新的高维动态数据。本方法应用于动态纹理图像序列方面,获得更逼真视觉效果且可以处理大多数自然场景中的动态纹理;应用于3D人体运动捕获数据处理方面,能够合成用户指定约束的人体运动数据。
-
公开(公告)号:CN118366219A
公开(公告)日:2024-07-19
申请号:CN202410535200.0
申请日:2024-04-30
Applicant: 中国科学院计算技术研究所
IPC: G06V40/20 , G06V10/40 , G06V10/62 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/0895
Abstract: 本发明提出一种动作预测方法、装置、介质及计算机设备,该方法包括:构建训练数据集,所述训练数据集包含环境样本序列、惯性运动样本序列、特定任务目标序列;将所述训练数据集输入至动作预测模型,通过所述动作预测模型得到预测动作序列。该方法提高了人体动作预测的准确度与预测效率。
-
公开(公告)号:CN117743653A
公开(公告)日:2024-03-22
申请号:CN202311766725.7
申请日:2023-12-21
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9035 , G06F16/36 , G06F16/28
Abstract: 本发明实施例提供了一种个性化食品推荐模型,包括数据获取模块,用于获取包括预设的多个食品实体与其属性实体间的关系的第一知识图谱和包括多个用户实体和多个食品实体间的历史交互关系的第二知识图谱;食品知识图谱处理模块,用于根据与食品实体有关系的属性实体对食品实体进行编码处理,得到食品实体的食品信息编码;食品个性化推荐模块,用于根据多个食品信息编码分别对第二知识图谱中的多个用户实体和多个食品实体进行处理,以确定多个食品实体分别与每个用户实体的匹配分数,根据所述匹配分数为每个用户生成个性化的推荐食品列表;本发明实施例结合食品信息编码和历史交互关系进行多种食品推荐,解决单一推荐时难以平衡偏好和营养等问题。
-
公开(公告)号:CN116434108A
公开(公告)日:2023-07-14
申请号:CN202310232698.9
申请日:2023-03-06
Applicant: 中国科学院计算技术研究所
IPC: G06V20/40 , G06V10/774 , G06V10/74 , G06V10/764 , G06V20/56
Abstract: 本发明提出一种基于循环一致性的第一视角视频行为预测方法和系统,通过在高维特征空间构建过去信息蒸馏损失函数、未来信息蒸馏损失函数、后向‑前向循环一致性损失函数以及前向‑后向循环一致性损失函数,充分学习过去内容和当前观察内容、当前观察内容和未来内容之间的时序上下文关系。在测试时,我们只根据观察内容去预测未来的行为,通过隐式地扩展可观察的时序范围,在一定程度上能够克服难以获取长距离时序信息的客观条件限制,进而利用更多的信息辅助进行行为预测。
-
公开(公告)号:CN111222546B
公开(公告)日:2023-04-07
申请号:CN201911373760.6
申请日:2019-12-27
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/047 , G06N3/08
Abstract: 本发明提供一种训练食品图像分类模型的方法,所述方法包括:对食品图像进行多尺度切割,形成包含原图像的多尺度食品切割图像;分别构建多个尺度的卷积神经网络模型,每个卷积神经网络模型对应一个尺度的食品切割图像;利用带有类别标签的食品图像作为目标图像,将其多尺度切割后代入多个尺度的卷积神经网络模型,利用预测的类别概率与真实的类别标签的比对结果作为反馈来进行多个尺度的卷积神经网络模型的优化。本发明创新性地提出了在原图像基础上进行多尺度切割形成多尺度切片的方式题。本发明在多个公共数据集都达到目前最好的识别性能:本发明的方法在公共数据集ETH Food‑101上可以达到90.56%的识别准确率,在公共数据集VireoFood‑172上可以达到90.61%的识别准确率。
-
公开(公告)号:CN114419391A
公开(公告)日:2022-04-29
申请号:CN202111621115.9
申请日:2021-12-27
Applicant: 北京三快在线科技有限公司 , 中国科学院计算技术研究所
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种目标图像识别方法及装置、电子设备及可读存储介质。其中,该方法包括:将目标图像输入至预先训练完成的目标图像识别模型;通过目标图像识别模型的特征学习模块,获取目标图像对应的多个不同维度的多个局部特征,以及确定多个局部特征对应的多个第一向量表示;通过目标图像识别模型的特征增强模块,确定多个局部特征对应的第二向量表示;通过目标图像识别模型的特征分类模块,对多个第一向量表示以及第二向量表示进行分类,以得到目标图像的预测结果。本发明解决了由于相关技术中食品图像预测结果准确性低的技术问题。
-
公开(公告)号:CN111046920A
公开(公告)日:2020-04-21
申请号:CN201911152246.X
申请日:2019-11-22
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种训练食品图像分类模型的方法及图像分类方法,所述方法包括:分别构建多尺度的食品原材料神经网络以及多尺度的食品类别神经网络,对目标图像进行多尺度划分;对于目标图像的每种类型特征,分别进行多尺度融合,对于融合后的三种类型特征进行融合;将融合后的特征输入到基于融合特征的分类器进行分类。本发明创新性地提出了高级食品语义分布和深度视觉特征的互补性融合,并且进一步将原材料属性信息与高级食品语义分布和深度视觉特征进行融合,解决了食品图像的非刚性结构和几何变形问题,更加有利于食品图像的识别。并且,本发明通过多尺度融合方式,弥补了食品图像不具备空间排列特性的缺陷,最大限度地提高了分类性能。
-
-
-
-
-
-
-
-
-