一种面向视频的视觉特征编码方法及装置

    公开(公告)号:CN104767997A

    公开(公告)日:2015-07-08

    申请号:CN201510134616.2

    申请日:2015-03-25

    Applicant: 北京大学

    Abstract: 本发明公开了一种面向视频的视觉特征编码方法及装置,所述方法包括:获取视频流中当前帧的全局特征;根据所述视频流中当前帧相邻帧的全局特征,确定当前帧的全局特征是否有参考全局特征;如果有,则根据当前帧的参考全局特征的子向量,获取所述当前帧的全局特征对应的参考子向量;根据所述视频流中无参考全局特征的帧的全局特征的子向量,和有参考全局特征的帧的全局特征的子向量及对应的参考子向量,对所述视频流中各帧的全局特征进行编码,获取所述视频流的待发送的全局特征比特流。上述方法能够在客户端传输数据时快速压缩传输的特征数据,降低传输数据量,且提高传输效率。

    获取低维局部特征描述子的方法

    公开(公告)号:CN104616013A

    公开(公告)日:2015-05-13

    申请号:CN201410183573.2

    申请日:2014-04-30

    Applicant: 北京大学

    Abstract: 本发明提供一种获取低维局部特征描述子的方法,其中,所述方法包括:获取待处理图像的局部特征描述子;将获取的局部特征描述子形成描述子集合;根据降维矩阵将所述描述子集合中的每一个局部特征描述子进行降维,获得与每一个局部特征描述子对应的低维局部特征描述子;其中,所述降维矩阵为训练预设的图像数据集得到的矩阵。上述方法可以降低现有技术中局部特征描述子的维度,并去除现有技术中局部特征描述子的冗余信息。

    全局特征描述子的聚合方法

    公开(公告)号:CN104615613A

    公开(公告)日:2015-05-13

    申请号:CN201410183575.1

    申请日:2014-04-30

    Applicant: 北京大学

    CPC classification number: G06F17/30256 G06K9/6212 G06K9/6215

    Abstract: 本发明提供一种全局特征描述子的聚合方法,包括:获取待处理图像的局部特征描述子,根据所述局部特征描述子的重要性,将所有的局部特征描述子进行排序,获得排序后的局部特征描述子;根据截断阈值,从所述排序后的局部特征描述子中选择用于聚合全局特征描述子的若干个局部特征描述子;采用高斯混合模型对所述若干个局部特征描述子进行聚合,获得待处理图像的全局特征描述子;其中,所述截断阈值为训练预设的图像数据集中每类图像的检索结果得到的。上述方法可降低现有技术中全局特征描述子聚合过程中的时间复杂度,提高全局特征描述子的鉴别力和鲁棒性。

    图片搜索方法、图片搜索系统、客户端和服务器

    公开(公告)号:CN102063472A

    公开(公告)日:2011-05-18

    申请号:CN201010597576.2

    申请日:2010-12-20

    Applicant: 北京大学

    Abstract: 本发明提供一种图片搜索方法、图片搜索系统、客户端和服务器,其中,图片搜索方法包括:客户端获取待搜索的目标图片和针对该目标图片的第一关联信息,且将第一关联信息发送至服务端,同时客户端获取目标图片的视觉单词;服务端基于客户端的第一关联信息查找其内部的视觉单词词典库中视觉单词词典,以及将该视觉单词词典发送至客户端;所述客户端基于服务端发送的视觉单词词典得到目标视觉单词,并将其发送至所述服务端;所述服务端接收所述目标视觉单词,并查找对应该目标视觉单词的一个以上的结果图片和相关的扩展信息,以及将其发送至客户端。上述图片搜索方法缩短了客户检索等待时间,提高了检索性能与效率,该方法可适用于各个领域。

    三维动态场景渲染方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN119048662B

    公开(公告)日:2025-02-18

    申请号:CN202411499103.7

    申请日:2024-10-25

    Abstract: 本申请公开了一种三维动态场景渲染方法、装置、设备、存储介质及程序产品,涉及三维重建技术领域,所述方法包括:接收目标初始场景的多点视频流,所述多点视频流通过若干个相机对所述目标初始场景进行多视角连续拍摄得到;根据所述多点视频流进行三维场景重建,得到初始场景表示;基于所述初始场景表示进行场景运动变化学习,得到场景运动变化参数;将所述场景运动变化参数以数据流的形式发送至客户端,由所述客户端根据所述场景运动变化参数渲染生成场景视图。实现了自由视点视频可流式传输的三维动态场景重建,解决了现有技术自由视点视频无法实现可流式传输的三维动态场景重建,渲染速度慢的问题,提高了自由视点视频的渲染速度。

    图像处理方法、装置、终端设备、存储介质以及程序产品

    公开(公告)号:CN117576382A

    公开(公告)日:2024-02-20

    申请号:CN202311376053.9

    申请日:2023-10-23

    Abstract: 本申请公开了一种图像处理方法、装置、终端设备、存储介质以及程序产品,属于图像处理技术领域,该方法包括:在基于弱监督语义分割的图像中确定集合外像素;将所述集合外像素划分为集合内类组和集合外类组;调制所述集合内类组和所述集合外类组的类中心与所述集合外像素之间的距离,以对所述集合外像素进行类别校正。采用本申请技术方案能够对集合外像素进行处理以将错误的集合外像素转移到集合内中,进而避免弱监督语义分割中伪标签存在的噪声对于分割网络训练的影响,提升语义分割模型针对图像像素分类预测的正确概率。

    视频问题回复模型的构建方法、终端设备及计算机介质

    公开(公告)号:CN117437444A

    公开(公告)日:2024-01-23

    申请号:CN202311259137.4

    申请日:2023-09-26

    Inventor: 陈杰 李昊 李剑霞

    Abstract: 本申请公开了一种视频问题回复模型的构建方法、终端设备及计算机介质,涉及人工智能技术领域,包括:提取视频内容包含的各视频特征,和文本内容包含的各文本特征;对各视频特征进行处理以得到各稀疏视频特征,并对各问题文本特征进行处理以得到各稀疏问题文本特征;基于稀疏视频特征、各稀疏问题文本特征及答案文本特征计算得到各收益函数值和各对齐预测值,并基于各收益函数值和各对齐预测值得到第一损失函数;基于各稀疏视频特征和各稀疏问题文本特征得到预测答案向量,并根据预设的标准答案向量和预测答案向量得到第二损失函数;根据第一损失函数和第二损失函数构建得到目标视频问题回复模型。

    小样本语义分割方法、装置、设备及存储介质

    公开(公告)号:CN116935041A

    公开(公告)日:2023-10-24

    申请号:CN202310261009.7

    申请日:2023-03-10

    Abstract: 本发明涉及图像处理的技术领域,尤其涉及一种小样本语义分割方法、装置、设备及存储介质,该小样本语义分割方法包括:获取待分割图片,并获取基于编码‑解码结构构建的目标分割模型;通过所述目标分割模型的编码器对所述待分割图片进行特征提取得到目标特征;通过所述目标分割模型对所述待分割图片进行前景分割和背景分割得到背景分割图,并融合所述目标特征和所述背景分割图得到分割特征;通过所述目标分割模型的解码器对所述分割特征进行解码得到特征图像,并将所述特征图像输入所述目标分割模型中的分类器得到标注类别的分割结果。本发明实现了提高小样本语义分割的准确性。

Patent Agency Ranking