-
公开(公告)号:CN118486430A
公开(公告)日:2024-08-13
申请号:CN202410715987.9
申请日:2024-06-04
Applicant: 中国科学院计算技术研究所
IPC: G16H20/60 , G06F18/25 , G06F16/332 , G06N3/0455 , G06N3/08
Abstract: 本发明提出一种多任务智能膳食管理方法、装置、存储介质、计算机设备,该方法包含:构建专门面向食品领域的食品多模态基础模型;将该食品多模态基础模型中融合多模态数据融合模块,以食品图像与膳食问题共同作为多模态输入,输出膳食上下文Token;将该食品多模态基础模型中融合多个细粒度食品分析模块,依据该膳食上下文Token,对不同类别的食品进行细粒度的特征提取,输出细粒度食品特征分析结果;依据该细粒度食品特征分析结果以及该膳食上下文Token,利用问答模型生成膳食回答。该方法通过精确定位用户的膳食问题,匹配精准的膳食回答,提高了膳食场景下膳食管理的准确性,同时提高了用户饮食体验。
-
公开(公告)号:CN115797924A
公开(公告)日:2023-03-14
申请号:CN202211579758.6
申请日:2022-12-06
Applicant: 中国科学院计算技术研究所
IPC: G06V20/68 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06F16/583
Abstract: 一种用于食品图像分类的模型的训练方法,所述模型包括特征提取器和分类器,所述方法包括:S1、获取包含多个样本和对应标签的初始的训练集并将其划分为多个批次,在每个批次基于当前批次中的样本构建多个包含锚样本、正样本和负样本的三元组,其中,每个样本为一张食品图像,样本对应的标签指示食品图像的类别;S2、对初始的训练集的每个批次选定部分三元组进行优化,优化时将选定的三元组的负样本用其正样本替代并将选定的三元组的正样本用其锚样本替代以得到优化的三元组,基于优化的三元组与未选定的三元组构成优化的训练集;S3、利用优化的训练集训练用于提取样本特征的特征提取器以及用于根据样本特征对样本进行分类的分类器进行分批次训练。
-
公开(公告)号:CN106127257B
公开(公告)日:2022-05-31
申请号:CN201610509623.0
申请日:2016-06-30
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
IPC: G06V10/764 , G06K9/62
Abstract: 本发明公开了一种数据分类方法,用于提供一种较好的增量学习的方式。所述方法包括:获取待学习的第一数据;通过分类器根据所述第一数据确定N个分界面;所述分界面用于对数据进行分类;N为正整数;基于所述N个分界面确定至少两个数据类别,且将所述第一数据分配到所述至少两个数据类别中的第一数据类别;所述第一数据类别为根据所述第一数据新增的数据类别或原有的数据类别。本发明还公开了相应的电子设备。
-
公开(公告)号:CN106469437B
公开(公告)日:2020-08-25
申请号:CN201510508531.6
申请日:2015-08-18
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
Abstract: 提供了一种图像处理方法和图像处理装置。所述图像处理方法包括:将待处理的图像平均划分为多个图像块;获得所述图像块的语义描述信息;基于所述图像块在所述图像中的空间位置和所述图像块的语义描述信息确定所述图像的语义描述信息。在本公开实施例的技术方案中,能够有机地联系整个图像中的相关图像块来确定图像的语义描述信息,更符合对图像的理解习惯。
-
公开(公告)号:CN111159539A
公开(公告)日:2020-05-15
申请号:CN201911251785.9
申请日:2019-12-09
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G16H20/60
Abstract: 本发明提出一种基于多模态信息关联分析的食物推荐方法,包括:根据用户的饮食需求和饮食范围生成第一模态信息;根据食物的自然属性和附加属性生成第二模态信息;根据该用户的实时身体状况和饮食环境状况生成第三模态信息;对该第一模态信息、该第二模态信息和该第三模态信息进行关联性分析,生成针对该用户的食物推荐结果。
-
公开(公告)号:CN106127257A
公开(公告)日:2016-11-16
申请号:CN201610509623.0
申请日:2016-06-30
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
IPC: G06K9/62
CPC classification number: G06K9/6286 , G06K9/6269
Abstract: 本发明公开了一种数据分类方法,用于提供一种较好的增量学习的方式。所述方法包括:获取待学习的第一数据;通过分类器根据所述第一数据确定N个分界面;所述分界面用于对数据进行分类;N为正整数;基于所述N个分界面确定至少两个数据类别,且将所述第一数据分配到所述至少两个数据类别中的第一数据类别;所述第一数据类别为根据所述第一数据新增的数据类别或原有的数据类别。本发明还公开了相应的电子设备。
-
公开(公告)号:CN101894276B
公开(公告)日:2012-09-05
申请号:CN201010195802.4
申请日:2010-06-01
Applicant: 中国科学院计算技术研究所
IPC: G06K9/66
CPC classification number: G06K9/00335 , G06K9/4671 , G06K2009/3291
Abstract: 本发明提供一种人体动作识别的训练方法,包括:从视频文件中提取时空兴趣点;将所有时空兴趣点根据其所包含的特征描述子量化到相应的视频单词上,并为视频单词生成统计直方图;根据视频单词所在时空邻域内的时空上下文信息得到该视频单词所在时空邻域内的其它视频单词,由该视频单词与某一满足时空约束的其它视频单词形成时空视频词组;对视频单词所在时空邻域内的时空上下文做聚类,得到语境单词,由视频单词与语境单词形成时空视频单词团体;从时空视频词组中选择代表性时空视频词组,从时空视频单词团体中选择代表性时空视频单词团体;利用视频单词、代表性时空视频词组、代表性时空视频单词团体中的一种特征或将多种特征融合后的结果训练分类器。
-
公开(公告)号:CN101739428B
公开(公告)日:2012-04-18
申请号:CN200810226247.X
申请日:2008-11-10
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种对多媒体创建索引的方法,包括:将从与多媒体相关的语音或文本中所找到的人名在图像搜索引擎上搜索,根据搜索结果为所述人名建立对应的人脸库;为所述人脸库中的各个人脸以及所述视频的视频帧或所述图片中的待检测人脸分别提取特征;将所述的待检测人脸与所述人脸库中的各个人脸分别进行特征匹配,由匹配结果得知待检测人脸是否与人脸库所代表的人名匹配;将匹配的人名作为所述多媒体的索引。本发明的对多媒体创建索引的方法无需人为干预,无需事先标注数据,具有良好的扩展性;可以解决人脸匹配操作中常见的小样本量问题,能够方便快捷并且有效地对很小量的新闻报告中的人脸进行命名,并创建相关的索引。
-
公开(公告)号:CN101493943A
公开(公告)日:2009-07-29
申请号:CN200810056904.0
申请日:2008-01-25
Applicant: 中国科学院计算技术研究所
IPC: G06T7/20
Abstract: 本发明公开了一种粒子滤波跟踪方法和跟踪装置,该方法包括:步骤S1:在原始图像帧上采样获得初始粒子集;步骤S2:对原始图像帧的像素经过前景背景分类得到概率图;步骤S3:按照系统动态模型传播粒子并采样,得到第二粒子集;步骤S4:按照在概率图上构建的系统观察模型得到所述第二粒子的权重,并归一化粒子的权重得到第三粒子集;步骤S5:对所述第三粒子集进行重要性重采样,得到重采样粒子集;步骤S6:通过重采样粒子集计算系统状态并输出。本发明提高了粒子滤波的计算效率,并提高了鲁棒性,不容易丢失目标。
-
公开(公告)号:CN115862005A
公开(公告)日:2023-03-28
申请号:CN202211698870.1
申请日:2022-12-28
Applicant: 中国科学院计算技术研究所
IPC: G06V20/68 , G06V10/44 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明提供了一种食品检测系统、模型训练方法和食品检测方法,该系统包括基于神经网络构建的特征提取器和检测头,其中,特征提取器,用于根据多个处理层对输入的图像进行特征提取以得到图像特征,其中至少部分处理层为动态可变形卷积层,动态可变形卷积层包括多个可变形共享块,每个可变形共享块包括用于确定与输入的图像适配的变形参数的变形单元和多个用于根据该变形单元的变形参数调整卷积形态的动态卷积分支;检测头,用于根据图像特征对输入的图像进行检测,确定输入的图像中食品的位置区域和各位置区域对应的食品类别;本发明可提高食品检测模型的检测性能。
-
-
-
-
-
-
-
-
-