-
公开(公告)号:CN108205813A
公开(公告)日:2018-06-26
申请号:CN201611170887.4
申请日:2016-12-16
Applicant: 微软技术许可有限责任公司
CPC classification number: G06T11/001
Abstract: 根据本公开内容的实现,提出了一种基于学习网络的图像风格化的方案。在该方案中,利用多个图像以及具有特定纹理风格的参考图像来训练学习网络。该学习网络的多个不同子网络被分别训练。具体地,一个子网络被训练为实现从源图像提取一个或多个特征图并且将被施加有纹理风格的特征图变换成目标图像。每个特征图指示源图像的一部分特征信息。另一子网络被训练为将指定的纹理风格施加于提取的特征图,从而使得基于处理后的特征图生成的目标图像能够体现指定的纹理风格。
-
公开(公告)号:CN117425916A
公开(公告)日:2024-01-19
申请号:CN202280039430.7
申请日:2022-05-11
Applicant: 微软技术许可有限责任公司
Abstract: 一种用于跨多个图像帧跟踪目标对象的系统。该系统包括逻辑机器和存储机器。存储机器保存由逻辑机器可执行的指令,以在目标帧之前出现的一个或多个先前帧上计算针对目标对象的轨迹。响应于评估在目标帧中没有检测到目标对象,指令可执行以基于轨迹来预测针对目标对象的估计区域,基于针对估计区域的阈值距离内的一组其他对象的一组候选遮挡位置来预测遮挡中心,该组候选遮挡位置的每个位置与估计区域重叠,以及基于遮挡中心自动地估计针对目标帧中的目标对象的边界框。
-
公开(公告)号:CN117099136A
公开(公告)日:2023-11-21
申请号:CN202280025449.6
申请日:2022-03-17
Applicant: 微软技术许可有限责任公司
IPC: G06V10/82
Abstract: 用于对象检测的系统和方法生成与图像数据相对应的特征金字塔,并且将特征金字塔重新缩放到与特征金字塔的中值级别相对应的尺度,其中重新缩放后的特征金字塔是四维(4D)张量。4D张量被重塑为三维(3D)张量,三维(3D)张量具有包括与3D张量的不同维度相对应的尺度特征、空间特征和任务特征的单独视角。3D张量与多个注意力层一起被使用以更新与图像数据相关联的多个特征图。使用更新后的多个特征图来对图像数据执行对象检测。
-
公开(公告)号:CN110648375B
公开(公告)日:2023-07-07
申请号:CN201810706012.4
申请日:2018-06-26
Applicant: 微软技术许可有限责任公司
IPC: G06T11/00
Abstract: 根据本公开的实现,提出了一种图像彩色化方案。在该方案中确定灰度源图像和彩色参考图像呈现的内容之间的相似度,并使用学习网络,基于相似度确定灰度源图像对应的彩色目标图像。具体地,基于相似度确定灰度源图像中与彩色参考图像在内容上相似的第一组图块和在内容上不相似的第二组图块,基于彩色参考图像中与第一组图块对应的图块中的颜色,确定第一组图块的第一颜色,独立于彩色参考图像来确定第二组图块的第二颜色,以及基于第一颜色和第二颜色变换灰度源图像,以生成彩色目标图像。通过该方案,可以提供图像彩色化中的用户可控性和定制化效果。此外还无需严格要求彩色参考图像与灰度源图像之间的对应性,这使彩色化对参考图像的选择更鲁棒。
-
公开(公告)号:CN109640138B
公开(公告)日:2021-08-24
申请号:CN201811364863.1
申请日:2013-07-23
Applicant: 微软技术许可有限责任公司
IPC: H04N21/414 , H04N21/422 , H04N21/433 , H04N21/44 , H04N21/442 , G06T5/00 , G06T5/50 , H04N5/232
Abstract: 用于视频稳定的技术和架构可以将颤动视频转换为看上去稳定的视频。路径平滑处理可以生成经优化的相机路径以进行视频稳定。利用较大的平滑核,路径平滑处理可以移除高频抖动和低频跳动二者,并且同时可以保留非连续的相机运动(诸如,快速摇摄或场景转变)以避免过度裁剪或几何失真。基于滑动窗口的实现方式包括可以用于实时的视频稳定的路径平滑处理。
-
公开(公告)号:CN111127304A
公开(公告)日:2020-05-08
申请号:CN201811294026.6
申请日:2018-10-31
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种跨域图像转换方案。在该方案中,基于第一图像域中的第一图像和第二图像域中的第二图像来确定用于从第一图像域到第二图像域的几何变形的第一学习网络,第一图像域和所述第二图像域的图像具有不同的风格并且其中的对象相对彼此具有几何变形。对第二图像执行从第二到第一图像域的几何变形以生成中间图像,或对第一图像执行从第一到第二图像域的几何变形以生成中间图像。基于第一图像和从第二图像生成的中间图像或基于第二图像和从第一图像生成的中间图像,确定用于从第一图像域到第二图像域的风格变换的第二学习网络。通过该方案,用于跨域图像转换的学习网络的处理准确度能够提高并且复杂度降低。
-
公开(公告)号:CN110648375A
公开(公告)日:2020-01-03
申请号:CN201810706012.4
申请日:2018-06-26
Applicant: 微软技术许可有限责任公司
IPC: G06T11/00
Abstract: 根据本公开的实现,提出了一种图像彩色化方案。在该方案中确定灰度源图像和彩色参考图像呈现的内容之间的相似度,并使用学习网络,基于相似度确定灰度源图像对应的彩色目标图像。具体地,基于相似度确定灰度源图像中与彩色参考图像在内容上相似的第一组图块和在内容上不相似的第二组图块,基于彩色参考图像中与第一组图块对应的图块中的颜色,确定第一组图块的第一颜色,独立于彩色参考图像来确定第二组图块的第二颜色,以及基于第一颜色和第二颜色变换灰度源图像,以生成彩色目标图像。通过该方案,可以提供图像彩色化中的用户可控性和定制化效果。此外还无需严格要求彩色参考图像与灰度源图像之间的对应性,这使彩色化对参考图像的选择更鲁棒。
-
公开(公告)号:CN110049303A
公开(公告)日:2019-07-23
申请号:CN201810036211.9
申请日:2018-01-15
Applicant: 微软技术许可有限责任公司
IPC: H04N13/106
Abstract: 根据本公开的实现,提出了一种立体图像的视觉风格化的方案。在该方案中,提取第一和第二源图像的第一和第二特征图。第一和第二源图像分别对应于立体图像的第一和第二视角。基于第一和第二源图像确定从第一源图像到第二源图像的第一单向视差。将第一特征图与第一变形特征图进行合并得到第一合并特征图。通过基于第一单向视差处理第一和第二特征图,来生成具有视觉风格的第一和第二目标图像。通过该方案,在执行视觉风格变换的同时,还考虑组成立体图像的两幅源图像之间的视差,从而维持由目标图像组成的立体图像中的立体效果。
-
公开(公告)号:CN109640138A
公开(公告)日:2019-04-16
申请号:CN201811364863.1
申请日:2013-07-23
Applicant: 微软技术许可有限责任公司
IPC: H04N21/414 , H04N21/422 , H04N21/433 , H04N21/44 , H04N21/442 , G06T5/00 , G06T5/50 , H04N5/232
CPC classification number: G06T5/001 , G06T5/002 , G06T5/20 , G06T5/50 , G06T7/246 , G06T2207/10016 , G06T2207/20004 , G06T2207/20024 , G06T2207/20028 , G06T2207/20182 , G06T2207/30241 , G06T2207/30244 , H04N5/23267
Abstract: 用于视频稳定的技术和架构可以将颤动视频转换为看上去稳定的视频。路径平滑处理可以生成经优化的相机路径以进行视频稳定。利用较大的平滑核,路径平滑处理可以移除高频抖动和低频跳动二者,并且同时可以保留非连续的相机运动(诸如,快速摇摄或场景转变)以避免过度裁剪或几何失真。基于滑动窗口的实现方式包括可以用于实时的视频稳定的路径平滑处理。
-
公开(公告)号:CN109478316A
公开(公告)日:2019-03-15
申请号:CN201680088054.5
申请日:2016-07-26
Applicant: 微软技术许可有限责任公司
IPC: G06T5/40
Abstract: “自适应曝光校正器”对个体图像或任意长度的图像序列执行自动实时曝光校正。“曝光校正”在本文中被限定为对图像的阴影、高光、高频特征和颜色饱和度的任何组合的自动调整或校正。自适应曝光校正器通过各种噪声知晓图像处理函数的曝光校正,基于图像ISO和相机ISO能力以及相机噪声特性输出感官上改善的图像。初始校准过程使这些噪声知晓图像处理函数适用于特定相机型号和类型的噪声特性以及特定相机ISO设置。更具体而言,此校准过程预计算噪声知晓缩放函数(NASF)和颜色标量函数(CSF)。NASF和CSF然后被应用以调适各种图像处理函数,随后应用这些图像处理函数以在图像被捕捉时对这些图像执行实时噪声知晓曝光校正。
-
-
-
-
-
-
-
-
-