-
公开(公告)号:CN118332894A
公开(公告)日:2024-07-12
申请号:CN202410277306.5
申请日:2024-03-12
Applicant: 北京大学
IPC: G06F30/27 , G06F17/11 , G06F111/20 , G06F119/14
Abstract: 本申请提出一种模型选择方法、装置、设备及存储介质,该方法包括:获取模型库中各网络模型针对目标数据集的初始预测结果;分别建立各网络模型的动力学方程,动力学方程用于反映网络模型的预测结果关于时间的变化率;基于各网络模型的初始预测结果,分别对各动力学方程求解,得到各网络模型的预测结果跟随时间变化的闭式解;基于各网络模型对应的闭式解,分别确定各网络模型在目标时刻对应的目标预测结果;基于各网络模型各自对应的目标预测结果,确定各网络模型的性能排序,以确定目标网络模型。本申请实施例通过引入基于动力学微分方程的模型优选方法,充分考虑了微调过程中的非线性动态,提高了模型选择的准确性和效率。
-
公开(公告)号:CN110704666B
公开(公告)日:2022-06-03
申请号:CN201910818526.3
申请日:2019-08-30
Applicant: 北京大学
IPC: G06F16/583 , G06V10/774 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及计算机视觉领域,特别涉及一种提升跨视角车辆精确检索的方法及系统。包括将某一视角图片输入训练好的对抗网络生成器的该视角的图片输入端,生成另一视角图片;将原视角图片和生成的另一视角图片输入到训练好的度量网络中,获得原视角图片的特征和另一视角的图片的特征,将原视角图片的特征和另一视角的图片的特征拼接为级联特征,计算级联特征和数据库中参考车辆图片的特征距离,排列展示距离最近的若干查询目标。本发明提出了一个特征距离对抗网络(FDA‑Net),在度量空间设计了一种新的特征距离对抗方案。
-
公开(公告)号:CN113949880A
公开(公告)日:2022-01-18
申请号:CN202111026165.2
申请日:2021-09-02
Applicant: 北京大学
Abstract: 本发明公开了一种极低码率人机协同图像编码训练方法及编解码方法。本方法为:1)利用训练集训练得到一个生成模型;2)对该训练集中的每一图像Ij进行特征提取和流形映射,得到Ij的流形特征;3)使用超先验模型对流形特征构建码率约束和编解码,得到二进制码流和重建后的流形特征;4)根据码率约束对Ij进行紧致损失函数计算;5)对重建后的流形特征进行人眼视觉映射并输入到生成模型中,根据所得人眼视觉重建结果进行损失函数计算;6)将重建后的流形特征输入到机器视觉模型中,根据所得机器视觉预测结果进行损失函数计算;7)将各损失进行加和更新权值;8)重复2)‑7)直到神经网络的损失收敛,得到极低码率人机协同图像编码器。
-
公开(公告)号:CN110378215B
公开(公告)日:2021-11-02
申请号:CN201910508074.9
申请日:2019-06-12
Applicant: 北京大学
Abstract: 本发明涉及人工智能应用技术领域,特别涉及一种基于第一人称视角购物视频的购物分析方法。具体包括:将完整的购物视频划分为多个视频片段;从所述视频片段中提取N帧图像帧;分析提取的图像帧获得所述视频频段对应的购物动作类型;并根据获得的各视频片段对应的购物动作类型,识别预设购物动作类型的视频片段对应的商品;建立识别出的商品与其对应的购物动作类型之间的对应关系。本发明用第一人称视角的消费者购物视频,进行全面的消费分析,相对于基于图片的分析方法,本专利节省了消费者拍摄和上传的负担,并且可以全面地分析整个购物过程,得到完整的消费记录。
-
公开(公告)号:CN104918046B
公开(公告)日:2019-11-05
申请号:CN201410093089.0
申请日:2014-03-13
Applicant: 中兴通讯股份有限公司 , 北京大学
IPC: H04N19/124 , H04N19/13 , H04N19/60 , H04N19/91 , H04N19/94 , G06T9/00 , G06K9/46 , G06K9/62 , G06F16/51
Abstract: 本发明实施例提供了一种局部描述子压缩方法,所述方法包括:选取目标图像的一个或多个局部描述子;根据预先设定的码本,对选取的局部描述子进行多级矢量量化,将局部描述子量化为码本内与所述选取的局部描述子距离最近的码字。本发明实施例还提供了一种局部描述子压缩装置。
-
公开(公告)号:CN106326395B
公开(公告)日:2019-05-28
申请号:CN201610687614.0
申请日:2016-08-18
Applicant: 北京大学
IPC: G06F16/583 , G06K9/46 , G06K9/62
Abstract: 本发明提供了一种局部视觉特征选择方法及装置,所述方法包括:检测获取目标图像中的多个局部视觉特征,并获得每个局部视觉特征的自有属性;获得部分或全部所述局部视觉特征的深度属性;根据所述每个局部视觉特征的自有属性,以及部分或全部局部视觉特征的深度属性,采用预先建立的特征选择模型获得所述每个局部视觉特征位于查询目标中的可能性数值;按照所述可能性数值从高到低的顺序选择预设数量的局部视觉特征作为局部视觉特征子集。本发明使得在局部视觉特征子集内特征数目较少的配置下,仍然能够使得选择出的局部视觉特征尽可能多地包含位于查询目标中的局部视觉特征,在保持视觉特征描述子紧凑表达的前提下保证较为可靠的检索结果。
-
公开(公告)号:CN106033613B
公开(公告)日:2019-04-30
申请号:CN201510114321.9
申请日:2015-03-16
Applicant: 北京大学
IPC: G06T7/246
Abstract: 本发明公开了一种目标跟踪方法及装置,其中方法包括:确定从具有预设大小及预设形状的图像区域中若干个数值特征的提取方式;从已知目标区域的一帧图像中获取与每一数值特征对应的第一直方图和第二直方图;对于任一数值特征,将第一直方图与第二直方图中任一单元的值按照预设运算方式进行运算,并根据运算结果计算出代表该数值特征所体现出的目标区域与非目标区域差异程度的区分度的数值;根据区分度的数值选取至少一个数值特征;在此后任一帧图像中,通过提取任一图像区域的至少一个数值特征并与对应的直方图进行比较,来获取该图像区域与目标区域的匹配程度。本发明可以解决跟踪算法性能依赖图像块的数值特征的预先设置方式的技术问题。
-
公开(公告)号:CN105320703B
公开(公告)日:2018-07-24
申请号:CN201410381577.1
申请日:2014-08-05
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供一种相似车辆检索中的查询扩展方法及装置,其中所述方法包括:根据包括车辆的待查询图像,确定所述待查询图像的车型信息;从所述待查询图像的车型信息对应的车型模板库中选取符合预设条件的多个样例图像;将所述样例图像组成查询扩展图像集合,以使所述查询扩展图像集合中的样例图像代替所述待查询图像在目标数据库中进行查询;其中,所述车型模板库包括:多个不同光照条件下的车辆样例图像、不同拍摄角度的车辆样例图像和不同场景的车辆样例图像,由上述方法可提高车辆图像检索的召回率和准确率。
-
公开(公告)号:CN104615614B
公开(公告)日:2018-04-13
申请号:CN201410183602.5
申请日:2014-04-30
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供一种获取可伸缩全局特征描述子的方法,其中,所述方法包括:获取图像的局部特征描述子;根据全局特征描述子生成规则,对局部特征描述子进行转换,得到用于组成全局特征描述子的第一累积梯度向量和第二累积梯度向量;将所述第一累积梯度向量和第二累积梯度向量选择性组合,生成可伸缩全局特征描述子。采用本发明的方法获取的可伸缩全局特征描述子能够降低现有技术中全局特征描述子的占用空间,提高描述子在图像检索过程的检索效率。
-
公开(公告)号:CN104616012B
公开(公告)日:2018-03-02
申请号:CN201410182901.7
申请日:2014-04-30
Applicant: 北京大学
IPC: G06K9/46
Abstract: 本发明提供一种获取紧凑全局特征描述子的方法,其中,所述方法包括:获取待处理图像的可伸缩全局特征描述子;根据所述可伸缩全局特征描述子中每一维度上的数值,对所述可伸缩全局特征描述子进行二值化处理,得到包括比特的二值化后的可伸缩全局特征描述子;根据预设的比特选择表,从包括比特的二值化后的可伸缩全局特征描述子中选择若干个比特,将选择的若干个比特组成紧凑全局特征描述子。上述方法能够将可伸缩全局特征描述子压缩成长度很小检索性能很优的紧凑全局特征描述子,相比现有技术中的全局特征描述子压缩技术,时间复杂度更低,内存占用量更少。
-
-
-
-
-
-
-
-
-