-
公开(公告)号:CN118229849A
公开(公告)日:2024-06-21
申请号:CN202211600403.0
申请日:2022-12-12
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提供了三维形象的生成方案。根据该方案,获取经训练的扩散模型,扩散模型基于样本对象的样本三维形象来训练。利用扩散模型,从预定输入生成目标特征表示,目标特征表示包括与三平面分别对应的一组目标特征图,以表征目标对象在三维空间中的特征信息。基于目标特征表示来生成目标对象的三维形象。以此方式,能够高效生成高质量的三维形象,且带来存储和计算开销的降低。
-
公开(公告)号:CN110097606A
公开(公告)日:2019-08-06
申请号:CN201810082732.8
申请日:2018-01-29
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种用于面部合成的方案。在该方案中,关于第一用户的面部的第一图像和关于第二用户的面部的第二图像被获取。从第一图像中提取表征第一用户的身份的第一特征。从第二图像中提取表征第二图像的多个属性的第二特征,其中多个属性不包括第二用户的身份。然后,基于第一特征和第二特征来生成关于第一用户的面部的第三图像,第三图像体现第一用户的身份和第二图像的多个属性。根据本公开的面部合成方案能够对任何身份的面部图像进行基于身份保留的图像合成,而不管具有该身份的人物的面部图像是否存在于训练数据集中。此外,在训练用于进行上述面部合成的模型时,该方案不需要对除人物身份之外的任何其他属性进行标注。
-
公开(公告)号:CN108475424B
公开(公告)日:2023-08-29
申请号:CN201680077865.5
申请日:2016-07-12
Applicant: 微软技术许可有限责任公司
Abstract: 本公开提供了用于三维(3D)面部跟踪的方法、装置和系统。用于3D面部跟踪的方法可以包括:获得二维(2D)面部图像;对所述2D面部图像执行本地特征回归,以确定对应于所述2D面部图像的3D面部表示参数;以及基于所确定的3D面部表示参数来生成3D面部网格和对应的2D面部特征点。本公开可以提高跟踪准确性并降低存储器成本,从而可以被有效地应用在更广泛的应用场景中。
-
公开(公告)号:CN107122400A
公开(公告)日:2017-09-01
申请号:CN201710170157.2
申请日:2011-09-23
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06F17/30867 , G06F17/30651 , G06F17/30696
Abstract: 提供了便于使用视觉提示细化查询结果的方法,和在其上包含有便于使用视觉提示细化查询结果的计算机可执行指令的计算机存储介质。响应于用户查询的指示,确定查询结果。根据共有类似特征的查询结果的类别,从查询结果生成一组或多组查询结果。把视觉提示与所述查询结果组的每一个组相关联。把与查询结果组相关联的视觉提示呈现给用户。与被选择的视觉提示相关联的查询结果可被呈现给用户。根据被选择的视觉提示,可以生成细化的用户查询。
-
公开(公告)号:CN107122400B
公开(公告)日:2021-09-14
申请号:CN201710170157.2
申请日:2011-09-23
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332 , G06F16/338
Abstract: 提供了便于使用视觉提示细化查询结果的方法,和在其上包含有便于使用视觉提示细化查询结果的计算机可执行指令的计算机存储介质。响应于用户查询的指示,确定查询结果。根据共有类似特征的查询结果的类别,从查询结果生成一组或多组查询结果。把视觉提示与所述查询结果组的每一个组相关联。把与查询结果组相关联的视觉提示呈现给用户。与被选择的视觉提示相关联的查询结果可被呈现给用户。根据被选择的视觉提示,可以生成细化的用户查询。
-
公开(公告)号:CN113128271A
公开(公告)日:2021-07-16
申请号:CN201911404028.0
申请日:2019-12-30
Applicant: 微软技术许可有限责任公司
IPC: G06K9/00
Abstract: 在本公开的实施例中,提出了一种脸部图像的伪造检测方法。在输入脸部图像之后,检测脸部图像中是否存在由于不同图像的融合而导致的融合边界,然后,根据检测结果来生成对应的灰度图像,所生成的灰度图像能够揭示输入的脸部图像是否由不同图像的融合而形成。如果所生成的灰度图像中存在与融合边界相对应的可视边界,则说明该脸部图像是伪造的图像;相反,如果灰度图像中不存在可视边界,则说明该脸部图像是真实的图像。因此,本公开的实施例通过检测输入的脸部图像中的融合边界,能够更准确地检测出伪造的脸部图像。此外,根据本公开的实施例的检测模型可以通过自监督的方式使用真实图像进行训练,从而能够使得脸部图像的伪造检测方法更通用。
-
公开(公告)号:CN112233212A
公开(公告)日:2021-01-15
申请号:CN201910578770.7
申请日:2019-06-28
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种用于人像编辑与合成的方案。在该方案中,关于用户的头部的第一图像被获取。表示该用户的头部的三维头部模型基于第一图像被生成。该三维头部模型响应于接收到改变该用户的头部特征的命令而被变换,以体现用户经改变的头部特征。关于该用户的头部的第二图像基于经变换的三维头部模型被生成,并且体现用户经改变的头部特征。以此方式,该方案能够在无需人工介入的情况下仅基于单幅人像来实现对头部姿势和/或脸部表情等特征的编辑,并且自动地合成对应的图像。
-
公开(公告)号:CN110096929A
公开(公告)日:2019-08-06
申请号:CN201810091820.4
申请日:2018-01-30
Applicant: 微软技术许可有限责任公司
Abstract: 本公开的多个实现涉及基于神经网络的目标检测。在一些实现中,从图像的特征图确定图像中的候选区域、第一评分以及与候选区域相关联的多个位置,第一评分指示候选区域对应于目标的特定部位的概率。从特征图确定多个第二评分,其分别指示多个位置对应于目标的多个部分的概率。基于第一评分和多个第二评分,确定候选区域的最终评分,以用于在图像中标识目标的特定部位。
-
公开(公告)号:CN117693754A
公开(公告)日:2024-03-12
申请号:CN202280049250.7
申请日:2022-05-19
Applicant: 微软技术许可有限责任公司
Abstract: 本文的公开描述了训练编码器网络以修复具有经掩模的部分的图像。主编码过程被用于将经掩模的输入图像的可见部分编码为经编码的令牌数据。该经编码的令牌数据随后被解码为像素回归输出和特征预测输出两者,其中这输出两者都包括与经掩模的输入图像的经掩模的部分相关联的经修复的图像数据。使用该像素回归输出和该经掩模的输入图像的未掩模版本的像素数据来确定像素回归损失。使用该特征预测输出和该经掩模的输入图像的该未掩模版本的基准真值编码输出来确定特征预测损失。然后使用该像素回归损失和该特征预测损失来训练该主编码过程,由此该主编码过程被训练以将输入图像的结构特征编码为经编码的令牌数据。
-
公开(公告)号:CN110097606B
公开(公告)日:2023-07-07
申请号:CN201810082732.8
申请日:2018-01-29
Applicant: 微软技术许可有限责任公司
IPC: G06T11/00 , G06V40/16 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 根据本公开的实现,提出了一种用于面部合成的方案。在该方案中,关于第一用户的面部的第一图像和关于第二用户的面部的第二图像被获取。从第一图像中提取表征第一用户的身份的第一特征。从第二图像中提取表征第二图像的多个属性的第二特征,其中多个属性不包括第二用户的身份。然后,基于第一特征和第二特征来生成关于第一用户的面部的第三图像,第三图像体现第一用户的身份和第二图像的多个属性。根据本公开的面部合成方案能够对任何身份的面部图像进行基于身份保留的图像合成,而不管具有该身份的人物的面部图像是否存在于训练数据集中。此外,在训练用于进行上述面部合成的模型时,该方案不需要对除人物身份之外的任何其他属性进行标注。
-
-
-
-
-
-
-
-
-