图像阴影消除方法和装置
    11.
    发明公开

    公开(公告)号:CN108305217A

    公开(公告)日:2018-07-20

    申请号:CN201711454482.8

    申请日:2017-12-28

    Abstract: 本发明公开了一种图像阴影消除方法和装置。其中,该方法包括:确定初始图像中不同种类的颜色线;对初始图像进行阴影识别,得到阴影识别结果;根据阴影识别结果,对不同种类的颜色线的阴影区域进行光照恢复,得到阴影消除图像。本发明解决了现有技术中的光照恢复任务中只能对局部区域信息进行信息挖掘补足且不能保留各类材质特性的技术问题。

    用于行人重识别的图像特征提取方法

    公开(公告)号:CN107316031A

    公开(公告)日:2017-11-03

    申请号:CN201710536020.4

    申请日:2017-07-04

    Abstract: 本发明公布了一种用于行人重识别的图像特征提取方法,通过对齐局部描述子提取和分级全局特征提取,进行行人重识别;对齐局部描述子提取采用仿射变换对原图像进行处理,对相同区域的图像块特征进行求和池化操作而得到对齐局部描述子;对齐局部描述子保留图像内部块与块之间的空间信息;分级全局特征提取通过对定位的行人区域块进行分级,求取相应特征均值而得到全局特征。采用本发明技术方案,能够解决行人重识别中由于行人姿态变化等带来的特征不对齐问题,消除无关背景对重识别带来的影响,由此提高行人重识别的精度和鲁棒性。

    用于实现三维页面的方法及系统

    公开(公告)号:CN103412874B

    公开(公告)日:2017-08-29

    申请号:CN201310290469.9

    申请日:2013-07-11

    Abstract: 本申请公开了一种用于实现三维网页的方法及系统,利用在HTML语言中定义的视帧标签、在CSS语言中定义的三维定位信息属性组以及在JavaScript语言中定义的显示格式对象创建三维页面文件,并且对三维页面文件进行解析并相应建立视帧对应的文档对象模型树,最后对文档对象模型树进行三维渲染,依据显示格式显示渲染所得三维页面。这样,采用上述处理方式就能实现双视点或多视点三维网页,在双视点或多视点3D显示器上呈现具有深度感的立体三维网页世界,革新了网络体验。

    一种自适应运动估计方法和模块

    公开(公告)号:CN104995917A

    公开(公告)日:2015-10-21

    申请号:CN201580000246.1

    申请日:2015-05-07

    Abstract: 一种自适应运动估计方法和模块,该模块包括宏块划分单元、宏块选择单元、运动强度判断单元和运动估计单元。宏块划分单元待编码的视频帧划分宏块。宏块选择单元用于依次选择视频帧中的图像块作为当前图像块。运动强度判断单元用于判断当前图像块的运动强度,并根据当前图像块的运动强度自适应选择用于对当前图像块进行运动估计的运动估计方法。运动估计单元根据运动强度判断单元所选择的运动估计方法对当前图像块进行运动估计。在对图像块进行运动估计之前,先判断图像块的运动强度,根据当前图像块的运动强度自适应选择用于对当前图像块进行运动估计的运动估计方法,以提高视频编解码中运动估计的效率。

    一种全局视差估计方法和系统

    公开(公告)号:CN104408710A

    公开(公告)日:2015-03-11

    申请号:CN201410604055.3

    申请日:2014-10-30

    CPC classification number: G06T7/593 G06T2207/10021 G06T2207/20032

    Abstract: 一种全局视差估计方法和系统,在进行匹配空间计算时,根据预设规则在图像上选取采样点,再根据约束条件进行第一匹配空间和第二匹配空间的计算。其中,采用的约束条件包括线性约束条件和基于采样点的空间线束条件,所述线性约束条件为当前像素点与搜索点之间在颜色上的欧氏距离的约束,所述空间约束条件为搜索点与采样点之间在颜色上的欧氏距离的约束,由于同时采用了上述两个约束条件,使得计算出的匹配空间更加接近图像中物体的边缘,因此,能够提高匹配空间计算的准确性,从而保证最终视差计算的准确度。

    一种基于图像超分辨率的视频编解码方法及装置

    公开(公告)号:CN104244006A

    公开(公告)日:2014-12-24

    申请号:CN201410230514.6

    申请日:2014-05-28

    Abstract: 本申请提供的基于图像超分辨率的视频编解码方法及装置,本申请方法在对待编码和待编码的视频图像进行预测前,先对待编码/待解码视频图像进行超分辨率插值处理,可以对待编码/待解码图像进行放大及进行细节信息恢复,从而,在对待编码/待解码图像进行预测得到预测块时,相比现有技术利用线性插值对视频图像进行预测的方法,更能有效还原原图像,避免出现现有技术中预测块边缘模糊的问题,从而提升视频图像预测的准确性,进而提升视频图像的编码效率。

    一种基于分类字典库的超分辨率图像重构方法及装置

    公开(公告)号:CN104063855A

    公开(公告)日:2014-09-24

    申请号:CN201410230714.1

    申请日:2014-05-28

    Abstract: 本申请提供一种基于分类字典库的超分辨率图像重构装置,该装置可以从训练图像中选取第一局部块以及降采样后对应的第二局部块,提取相应特征,组合得到一组字典组,再对多组字典组按照LBS和SES的计算值作为分类标记进行分类并进行预训练,得到包含多个带分类标记的字典组的分类字典库。在重构图像时,同样提取待重构图像上局部块的局部特征,并将局部块的LBS和SES分类与分类字典库中各字典的LBS和SES分类相匹对,即可以快速获取到匹对的字典,最后利用匹对的字典对该待重构图像进行图像重构。从而,可以在恢复图像的高频信息的同时,提升图像的超分辨率重构的效率。

    基于受限文本空间的多步自注意力跨媒体检索方法及系统

    公开(公告)号:CN109783657B

    公开(公告)日:2022-12-30

    申请号:CN201910011678.2

    申请日:2019-01-07

    Inventor: 王文敏 余政

    Abstract: 本发明公布了一种基于受限文本空间的多步自注意力跨媒体检索方法及检索系统,通过构建相对固定的词汇表的受限文本空间,再将非受限文本空间转换成受限文本空间;通过特征提取网络提取受限文本空间的图像特征和文本特征;特征包括全局特征、区域特征集合及关联特征;将提取得到的特征送入特征映射网络,并通过多步自注意力机制提取图像和文本之间物体层次的共享信息;再通过相似性度量网络汇总各时刻有用信息来衡量图像和文本之间的相似度,并计算三元组损失函数;由此实现基于受限文本空间的多步自注意力跨媒体检索。本发明通过引入多步自注意力机制和关联特征,大幅度提升了跨媒体检索召回率。

    一种基于边界查找的用于视频中动作时间轴定位的方法

    公开(公告)号:CN108875610B

    公开(公告)日:2022-04-05

    申请号:CN201810569922.2

    申请日:2018-06-05

    Abstract: 一种基于边界查找的用于视频中动作时间轴定位的方法,采用时间轴边界似然的组件来改进第三阶段的定位问题。该组件通过三个步骤来执行更精确的视频动作定位:给定一段由第一和第二阶段产生的类别可知的动作提议,第一步将其左右边界扩充得到一个更大的搜索间隔片段,同时将这个时间间隔均匀等分成多个单元,每个单元包含同样数目的帧数;第二步对每一个单元计算内外概率或者边界概率,分别表示该单元位于真实标注之内或之外以及是该动作发生的开始边界或结束边界的概率;第三步基于每个单元计算出的概率,利用最大似然估计来估计出最优的动作时间轴边界,从而达到定位的效果。

Patent Agency Ranking