-
公开(公告)号:CN113674146A
公开(公告)日:2021-11-19
申请号:CN202010414770.6
申请日:2020-05-15
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种用于图像处理的方案。在该方案中,第一信息和第二信息基于输入图像和参考图像的纹理特征被确定。第一信息至少指示参考图像中按照纹理特征与输入图像中的第一像素块最相关的第二像素块,并且第二信息至少指示第一像素块与第二像素块的相关度。具有目标分辨率的迁移特征图基于该第一信息和参考图像被确定。该迁移特征图包括与第一像素块相对应的特征块并且该特征块包括第二像素块的纹理特征。输入图像基于该迁移特征图和该第二信息被变换成具有目标分辨率的输出图像。该输出图像体现参考图像的纹理特征。以此方式,该方案能够高效且准确地迁移参考图像的纹理,并且获得更清晰、真实的图像变换结果。
-
公开(公告)号:CN112819852A
公开(公告)日:2021-05-18
申请号:CN201911118979.1
申请日:2019-11-15
Applicant: 微软技术许可有限责任公司
Abstract: 本公开提供了用于对基于姿态的运动进行评估的方法和装置。可以获得关于基于姿态的运动的视频。可以从所述视频中提取关联于一个运动者的帧序列。可以通过对所述帧序列执行姿态估计,在所述帧序列的每个帧中标记一组关键点。可以通过至少基于所述一组关键点来对所述帧序列执行姿态分析,识别包括异常姿态的至少一个帧。可以基于所述至少一个帧来提供评估结果。
-
-
公开(公告)号:CN109284749A
公开(公告)日:2019-01-29
申请号:CN201710592777.5
申请日:2017-07-19
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种精细化图像识别的方案。在该方案中,利用第一学习网络的第一子网络提取图像的全局特征;利用第一学习网络的第二子网络、基于全局特征确定图像的第一关注区域,第一关注区域包括图像中对象的可辨识部分;利用第二学习网络的第一子网络提取第一关注区域的第一局部特征;以及至少部分基于第一局部特征确定图像中的对象的类别。通过该方案,实现了对于更精细尺度的图像区域的准确定位,从而可以获得基于精细尺度上的局部特征用于对象识别。
-
公开(公告)号:CN107077487A
公开(公告)日:2017-08-18
申请号:CN201580056088.1
申请日:2015-10-07
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06K9/6256 , G06F16/51 , G06F16/583 , G06F16/5838 , G06K9/627
Abstract: 方便自动加标签的技术和构造可以提供图像存储和搜索中的改进。构造可以使得能够使用加标签的源图像和目标图像来训练深度网络。构造还可以使用个人照片本体来训练深度网络的顶层。构造还可以从本体中选择一个或多个概念以用于对个人数字图像加标签。
-
公开(公告)号:CN112765377B
公开(公告)日:2025-05-23
申请号:CN201911059082.6
申请日:2019-11-01
Applicant: 微软技术许可有限责任公司
IPC: G06F16/48 , G06F16/432
Abstract: 本公开的各个实现涉及媒体流中的时段定位。在一些实现中,从媒体流中提取表示所述媒体流内的多个时段的二维时序特征映射,其中所述二维时序特征映射包括表示所述多个时段中的时段的开始的第一维度和表示所述多个时段中的时段的结束的第二维度;以及基于所述二维时序特征映射,确定所述多个时段与所述媒体流中的行为的相关性。
-
公开(公告)号:CN119301956A
公开(公告)日:2025-01-10
申请号:CN202280096596.2
申请日:2022-06-17
Applicant: 微软技术许可有限责任公司
IPC: H04N19/85 , H04N19/48 , G06N3/0464 , G06N3/08 , G06T3/4053 , G06T5/60
Abstract: 一种计算设备,包括处理器,处理器被配置为接收包括多个输入图像的输入视频数据。输入图像中的每个输入图像可以包括多个输入像素。针对每个输入图像,处理器还可以被配置为对输入图像执行上采样并将经上采样的输入图像划分成相应的多个分块。对于每个分块,处理器还可以被配置为生成多个时间空间频率令牌。针对分块生成的多个时间空间频率令牌可以由时间步长、空间位置和频率来索引。至少部分地在经训练的机器学习模型处,处理器还可以被配置为至少部分地基于时间空间频率令牌来生成多个超分辨输出图像。处理器还可以被配置为输出超分辨输出图像。
-
公开(公告)号:CN112765377A
公开(公告)日:2021-05-07
申请号:CN201911059082.6
申请日:2019-11-01
Applicant: 微软技术许可有限责任公司
IPC: G06F16/48 , G06F16/432
Abstract: 本公开的各个实现涉及媒体流中的时段定位。在一些实现中,从媒体流中提取表示所述媒体流内的多个时段的二维时序特征映射,其中所述二维时序特征映射包括表示所述多个时段中的时段的开始的第一维度和表示所述多个时段中的时段的结束的第二维度;以及基于所述二维时序特征映射,确定所述多个时段与所述媒体流中的行为的相关性。
-
公开(公告)号:CN111930376A
公开(公告)日:2020-11-13
申请号:CN201910395510.6
申请日:2019-05-13
Applicant: 微软技术许可有限责任公司
IPC: G06F8/38 , G06F3/0481
Abstract: 在本公开的实施例中,提出了一种风格化图标的自动生成方法。在获得用户输入的查询文本之后,首先使用经训练的生成器来生成能够表征对象结构的结构化图标,然后再对结构化图标进行风格化,例如填色或者添加其他风格,从而为用户生成高质量的风格化图标。在本公开的实施例中,通过两个阶段来分别生成结构化图标和风格化图标,其中结构化图标能够清晰地表征对象的结构,风格化图标可以具有更丰富的色彩和风格。因此,根据本公开的实施例所生成的风格化图标质量较高并且更加真实,从而提升图标生成时的用户体验。
-
公开(公告)号:CN111930376B
公开(公告)日:2025-03-04
申请号:CN201910395510.6
申请日:2019-05-13
Applicant: 微软技术许可有限责任公司
IPC: G06F8/38 , G06F3/04817
Abstract: 在本公开的实施例中,提出了一种风格化图标的自动生成方法。在获得用户输入的查询文本之后,首先使用经训练的生成器来生成能够表征对象结构的结构化图标,然后再对结构化图标进行风格化,例如填色或者添加其他风格,从而为用户生成高质量的风格化图标。在本公开的实施例中,通过两个阶段来分别生成结构化图标和风格化图标,其中结构化图标能够清晰地表征对象的结构,风格化图标可以具有更丰富的色彩和风格。因此,根据本公开的实施例所生成的风格化图标质量较高并且更加真实,从而提升图标生成时的用户体验。
-
-
-
-
-
-
-
-
-