使用遮挡感知单对象跟踪在视频流中跟踪多个对象

    公开(公告)号:CN115699102A

    公开(公告)日:2023-02-03

    申请号:CN202180038305.X

    申请日:2021-04-21

    Abstract: 本文的公开使得能够跟踪实时视频流中的多个对象。针对从视频流接收的每个个体帧,该帧的帧类型被确定。基于个体帧是对象检测帧类型,对象提议集在个体帧中被检测,对象提议集和对象轨迹集之间的关联被分配,并且该对象轨迹集的状态基于所分配的关联被更新。基于个体帧是对象跟踪帧类型,基于对象轨迹集中的每个对象轨迹对该帧执行单对象跟踪,并且该对象轨迹集基于所执行的单对象跟踪被更新。针对接收到的每个帧,实时对象位置数据流基于对象轨迹集被提供。

    图像融合和HDR成像
    2.
    发明授权

    公开(公告)号:CN108335279B

    公开(公告)日:2022-05-17

    申请号:CN201710048552.3

    申请日:2017-01-20

    Inventor: 廖菁 袁路

    Abstract: 本公开的实现提供了一种高动态范围成像中的图像融合的方案。在该方案中,确定多个原始图像中的每一个与同一参考图像的对应像素之间的差异(也被称为像素差异)。基于像素差异中的一部分或全部的分布来确定用于相应原始图像的像素阈值。该像素阈值然后被用于与像素差异进行比较,以便从原始图像标识出将在图像融合中被排除的噪声像素。多个原始图像中未被排除的像素可以被融合以获得融合图像。通过本公开的方案,针对要处理的每个原始图像均可确定恰当的专用像素阈值用于排除该原始图像中的噪声像素,从而使得基于其余像素融合得到的图像具有更高的质量。

    图像融合和HDR成像
    3.
    发明公开

    公开(公告)号:CN108335279A

    公开(公告)日:2018-07-27

    申请号:CN201710048552.3

    申请日:2017-01-20

    Inventor: 廖菁 袁路

    Abstract: 本公开的实现提供了一种高动态范围成像中的图像融合的方案。在该方案中,确定多个原始图像中的每一个与同一参考图像的对应像素之间的差异(也被称为像素差异)。基于像素差异中的一部分或全部的分布来确定用于相应原始图像的像素阈值。该像素阈值然后被用于与像素差异进行比较,以便从原始图像标识出将在图像融合中被排除的噪声像素。多个原始图像中未被排除的像素可以被融合以获得融合图像。通过本公开的方案,针对要处理的每个原始图像均可确定恰当的专用像素阈值用于排除该原始图像中的噪声像素,从而使得基于其余像素融合得到的图像具有更高的质量。

    立体图像的视觉风格化
    4.
    发明授权

    公开(公告)号:CN110049303B

    公开(公告)日:2021-08-13

    申请号:CN201810036211.9

    申请日:2018-01-15

    Abstract: 根据本公开的实现,提出了一种立体图像的视觉风格化的方案。在该方案中,提取第一和第二源图像的第一和第二特征图。第一和第二源图像分别对应于立体图像的第一和第二视角。基于第一和第二源图像确定从第一源图像到第二源图像的第一单向视差。将第一特征图与第一变形特征图进行合并得到第一合并特征图。通过基于第一单向视差处理第一和第二特征图,来生成具有视觉风格的第一和第二目标图像。通过该方案,在执行视觉风格变换的同时,还考虑组成立体图像的两幅源图像之间的视差,从而维持由目标图像组成的立体图像中的立体效果。

    计算机视觉基础模型的预训练
    5.
    发明公开

    公开(公告)号:CN118235173A

    公开(公告)日:2024-06-21

    申请号:CN202280072787.5

    申请日:2022-09-15

    Abstract: 提供了用于对计算机视觉基础模型进行预训练的示例。一种代表性方法包括根据弱标记数据来整理图像‑文本对的预训练数据库。对来自图像‑文本对的文本描述的语言进行编码。使用具有移位窗口和卷积嵌入的分层视觉变换器对图像‑文本对的图像进行编码。经由统一图像‑文本对比学习、基于编码后的图像和编码后的语言来对计算机视觉基础模型进行预训练。

    实时自适应阴影和高光增强

    公开(公告)号:CN109478316B

    公开(公告)日:2022-08-26

    申请号:CN201680088054.5

    申请日:2016-07-26

    Abstract: “自适应曝光校正器”对个体图像或任意长度的图像序列执行自动实时曝光校正。“曝光校正”在本文中被限定为对图像的阴影、高光、高频特征和颜色饱和度的任何组合的自动调整或校正。自适应曝光校正器通过各种噪声知晓图像处理函数的曝光校正,基于图像ISO和相机ISO能力以及相机噪声特性输出感官上改善的图像。初始校准过程使这些噪声知晓图像处理函数适用于特定相机型号和类型的噪声特性以及特定相机ISO设置。更具体而言,此校准过程预计算噪声知晓缩放函数(NASF)和颜色标量函数(CSF)。NASF和CSF然后被应用以调适各种图像处理函数,随后应用这些图像处理函数以在图像被捕捉时对这些图像执行实时噪声知晓曝光校正。

    训练用于图像修复的经掩模的自动编码器

    公开(公告)号:CN117693754A

    公开(公告)日:2024-03-12

    申请号:CN202280049250.7

    申请日:2022-05-19

    Abstract: 本文的公开描述了训练编码器网络以修复具有经掩模的部分的图像。主编码过程被用于将经掩模的输入图像的可见部分编码为经编码的令牌数据。该经编码的令牌数据随后被解码为像素回归输出和特征预测输出两者,其中这输出两者都包括与经掩模的输入图像的经掩模的部分相关联的经修复的图像数据。使用该像素回归输出和该经掩模的输入图像的未掩模版本的像素数据来确定像素回归损失。使用该特征预测输出和该经掩模的输入图像的该未掩模版本的基准真值编码输出来确定特征预测损失。然后使用该像素回归损失和该特征预测损失来训练该主编码过程,由此该主编码过程被训练以将输入图像的结构特征编码为经编码的令牌数据。

    跨域图像转换
    8.
    发明授权

    公开(公告)号:CN111127304B

    公开(公告)日:2024-02-20

    申请号:CN201811294026.6

    申请日:2018-10-31

    Inventor: 廖菁 袁路 曹凯迪

    Abstract: 根据本公开的实现,提出了一种跨域图像转换方案。在该方案中,基于第一图像域中的第一图像和第二图像域中的第二图像来确定用于从第一图像域到第二图像域的几何变形的第一学习网络,第一图像域和所述第二图像域的图像具有不同的风格并且其中的对象相对彼此具有几何变形。对第二图像执行从第二到第一图像域的几何变形以生成中间图像,或对第一图像执行从第一到第二图像域的几何变形以生成中间图像。基于第一图像和从第二图像生成的中间图像或基于第二图像和从第一图像生成的中间图像,确定用于从第一图像域到第二图像域的风格变换的第二学习网络。通过该方案,用于跨域图像转换的学习网络的处理准确度能够提高并且复杂度降低。

    基于学习网络的图像风格化

    公开(公告)号:CN108205813B

    公开(公告)日:2022-06-03

    申请号:CN201611170887.4

    申请日:2016-12-16

    Abstract: 根据本公开内容的实现,提出了一种基于学习网络的图像风格化的方案。在该方案中,利用多个图像以及具有特定纹理风格的参考图像来训练学习网络。该学习网络的多个不同子网络被分别训练。具体地,一个子网络被训练为实现从源图像提取一个或多个特征图并且将被施加有纹理风格的特征图变换成目标图像。每个特征图指示源图像的一部分特征信息。另一子网络被训练为将指定的纹理风格施加于提取的特征图,从而使得基于处理后的特征图生成的目标图像能够体现指定的纹理风格。

    图像的视觉风格变换
    10.
    发明公开

    公开(公告)号:CN108734749A

    公开(公告)日:2018-11-02

    申请号:CN201710262471.3

    申请日:2017-04-20

    CPC classification number: G06T11/001

    Abstract: 根据本公开的实现,提出了一种用于图像的视觉风格转换的方案。在该方案中,第一源图像的第一组特征图和第二源图像的第二组特征图被提取。第一组特征图中的特征图表征第一源图像的第一视觉风格的相应维度的至少一部分,并且第二组特征图中的特征表征第二源图像的第二视觉风格的相应维度的至少一部分。基于第一组特征图和第二组特征图,确定从第一源图像到第二源图像的第一映射。基于第一映射和第二源图像来变换第一源图像以生成至少部分地具有第二视觉风格的第一目标图像。通过该方案,实现了在特征空间中有效地将一个源图像的视觉风格施加到另一个源图像。

Patent Agency Ranking