-
公开(公告)号:CN102289564A
公开(公告)日:2011-12-21
申请号:CN201110161330.5
申请日:2011-06-02
Applicant: 微软公司
IPC: G06F19/00
CPC classification number: A63F13/63 , A63F13/213 , A63F13/215 , A63F2300/1018 , A63F2300/1087 , A63F2300/6072 , A63F2300/6081
Abstract: 公开了用于合成从聚焦于单个场景的多个音频和可视源接收到的信息的系统和方法。该系统可以基于在捕捉设备的图像数据中标识的共同的线索集合来确定捕捉设备的位置。由于场景常常可以具有移进移出场景的用户和对象,可以使来自多个捕捉设备的数据在时间上同步,以确保来自音频和可视源的数据在相同时间提供同一场景的数据。可以一起协调和吸收来自多个源的音频和/或可视数据,以改进系统的从场景解释音频和/或可视方面的能力。
-
公开(公告)号:CN102289564B
公开(公告)日:2015-05-20
申请号:CN201110161330.5
申请日:2011-06-02
Applicant: 微软公司
IPC: G06F19/00
CPC classification number: A63F13/63 , A63F13/213 , A63F13/215 , A63F2300/1018 , A63F2300/1087 , A63F2300/6072 , A63F2300/6081
Abstract: 本发明公开了用于合成从聚焦于单个场景的多个音频和可视源接收到的信息的系统和方法。该系统可以基于在捕捉设备的图像数据中标识的共同的线索集合来确定捕捉设备的位置。由于场景常常可以具有移进移出场景的用户和对象,可以使来自多个捕捉设备的数据在时间上同步,以确保来自音频和可视源的数据在相同时间提供同一场景的数据。可以一起协调和吸收来自多个源的音频和/或可视数据,以改进系统的从场景解释音频和/或可视方面的能力。
-
公开(公告)号:CN102332090B
公开(公告)日:2014-11-12
申请号:CN201110179044.1
申请日:2011-06-20
Applicant: 微软公司
CPC classification number: G06F3/017 , G09G2340/045 , G09G2354/00
Abstract: 公开用于有选择地聚焦于在成像场景内的感兴趣的某些区域以便获得在那些区域内的更多图像细节的系统和方法。一般地,本系统从所接收的图像数据标识感兴趣的区域,这些区域可以例如是在场景内的所探测的移动区域。然后,该系统通过提供感兴趣的区域中的更多细节来聚焦于那些区域。这可以通过许多方法来完成,这些方法包括放大图像、增加图像的像素密度和增加入射到图像中的物体上的光的量。
-
公开(公告)号:CN102332090A
公开(公告)日:2012-01-25
申请号:CN201110179044.1
申请日:2011-06-20
Applicant: 微软公司
CPC classification number: G06F3/017 , G09G2340/045 , G09G2354/00
Abstract: 本发明公开用于有选择地聚焦于在成像场景内的感兴趣的某些区域以便获得在那些区域内的更多图像细节的系统和方法。一般地,本系统从所接收的图像数据标识感兴趣的区域,这些区域可以例如是在场景内的所探测的移动区域。然后,该系统通过提供感兴趣的区域中的更多细节来聚焦于那些区域。这可以通过许多方法来完成,这些方法包括放大图像、增加图像的像素密度和增加入射到图像中的物体上的光的量。
-
公开(公告)号:CN102314595A
公开(公告)日:2012-01-11
申请号:CN201110172727.4
申请日:2011-06-16
Applicant: 微软公司
Inventor: J·A·塔迪夫
CPC classification number: G10L15/25
Abstract: 涉及用于改善话音识别的RGB/深度相机。本发明涉及用于通过处理视觉话音线索来促进话音识别的系统和方法。这些话音线索可以包括嘴唇、舌头和/或牙齿在话音期间的位置。在一个实施例中,在由图像捕获设备捕获数据帧以后,该系统标识出讲话者和该讲话者的位置。然后,该系统聚焦于讲话者以获得该讲话者的嘴的清晰图像。该系统包括视觉话音线索引擎,该视觉话音线索引擎用于基于该讲话者的嘴唇、舌头和/或牙齿的所捕获位置来识别和区分声音。视觉话音线索数据可以与音频数据同步以保证视觉话音线索引擎处理与正确的音频数据相对应的图像数据。
-
公开(公告)号:CN102413267B
公开(公告)日:2015-02-25
申请号:CN201110289022.0
申请日:2011-09-14
Applicant: 微软公司
Inventor: J·A·塔迪夫
CPC classification number: G06T11/00 , A63F2300/1093 , A63F2300/8011 , A63F2300/8088
Abstract: 本文描述了改进的扫描传感器阵列。图像传感器阵列被布置成覆盖图像捕捉系统的视场。每个传感器具有一视场段,该视场段与由另一图像传感器覆盖的视场段相邻。视场段(FOV)共享重叠区域。每个图像传感器包括光敏元件集,该光敏元件集使用扫描技术捕捉图像数据,该扫描技术按规定共享重叠区域的图像传感器在相同的时间段期间在重叠区域中被曝光的顺序进行。至少两个图像传感器针对重叠区域在相反的遍历方向上捕捉图像数据。这种定序提供了由不同的图像传感器在重叠区域中捕捉的数据之间的更紧密的空间和时间关系。更紧密的空间和时间关系减少了缝合边界的伪像效应,并改善应用来改进图像质量的图像处理技术的性能。
-
公开(公告)号:CN102413267A
公开(公告)日:2012-04-11
申请号:CN201110289022.0
申请日:2011-09-14
Applicant: 微软公司
Inventor: J·A·塔迪夫
CPC classification number: G06T11/00 , A63F2300/1093 , A63F2300/8011 , A63F2300/8088
Abstract: 本发明提供了改进的扫描传感器阵列。图像传感器阵列被布置成覆盖图像捕捉系统的视场。每个传感器具有一视场段,该视场段与由另一图像传感器覆盖的视场段相邻。视场段(FOV)共享重叠区域。每个图像传感器包括光敏元件集,该光敏元件集使用扫描技术捕捉图像数据,该扫描技术按规定共享重叠区域的图像传感器在相同的时间段期间在重叠区域中被曝光的顺序进行。至少两个图像传感器针对重叠区域在相反的遍历方向上捕捉图像数据。这种定序提供了由不同的图像传感器在重叠区域中捕捉的数据之间的更紧密的空间和时间关系。更紧密的空间和时间关系减少了缝合边界的伪像效应,并改善应用来改进图像质量的图像处理技术的性能。
-
-
-
-
-
-