-
公开(公告)号:CN102571315A
公开(公告)日:2012-07-11
申请号:CN201110443126.2
申请日:2011-12-26
Applicant: 微软公司
IPC: H04L7/00
CPC classification number: G01S19/03 , A63F13/06 , A63F13/12 , A63F2300/10 , G01D21/00 , G01S5/0018 , G06F3/011 , G06F3/017 , G06F3/0304 , G06F3/038 , H04J3/0667 , H04W84/18
Abstract: 本发明涉及在设备的范围内同步传感器数据。在此提供用于在设备之间同步传感器信号的技术。这些设备中的一个或多个可以收集传感器数据。该设备可以从这些传感器数据中创建传感器信号,其中该设备可以按照发布者/订阅者模型使所述传感器信号对其他设备可用。所述其他设备可以订阅它们选择的传感器信号。设备可以是传感器信号的提供者或消费者。设备可以在操作系统与软件应用之间具有代码层,其中该代码层处理所述数据以用于所述应用。该处理可以尤其是包括诸如下列动作:将传感器信号中的数据同步到本地时间时钟;为传感器信号中的数据预测未来值;以及以应用所请求的频率提供传感器信号的数据采样。
-
公开(公告)号:CN102131136B
公开(公告)日:2014-03-12
申请号:CN201110030926.1
申请日:2011-01-19
Applicant: 微软公司
CPC classification number: H04S3/008 , G10L21/0208 , G10L21/0272 , G10L2021/02085 , G10L2021/02166
Abstract: 提供了一种用于抑制麦克风阵列所接收的语音中的环境声的设备。该设备的一实施例包括:麦克风阵列、处理器、模数转换器和包括存储在其上由处理器执行的指令的存储器。存储在存储器上的指令被配置为接收多个数字声音信号,每个数字声音信号基于源自麦克风阵列的模拟声音信号,接收多声道扬声器信号,生成多声道扬声器信号的单声道近似信号,应用线性音频回音消除器以抑制每个数字声音信号的第一环境声部分,通过时间恒定和自适应波束生成技术的组合从每个数字声音信号的组合中生成已组合定向自适应声音信号,并应用一个或多个非线性噪声抑制技术来抑制已组合定向自适应声音信号的第二环境声部分。
-
公开(公告)号:CN102681657A
公开(公告)日:2012-09-19
申请号:CN201110442987.9
申请日:2011-12-26
Applicant: 微软公司
CPC classification number: G06F3/165 , G05B15/02 , G06F3/011 , G06F3/017 , G10H1/0008 , G10H2220/201 , G10H2220/455
Abstract: 本发明涉及交互式内容创建。音频/视觉系统(例如,诸如娱乐控制台或其他计算设备)播放低音音轨,诸如预先录制的歌曲的一部分或来自一个或多个乐器的音符。系统使用深度相机或其他传感器来自动地检测用户(或用户的一部分)进入多个碰撞体中的第一碰撞体。多个碰撞体中的每个碰撞体与不同的音频支干相关联。在一个示例中,音频支干是来自演奏歌曲的乐器的子集的声音、歌曲的声音音轨的一部分、或来自一个或多个乐器的音符。响应于自动地检测用户(或用户的一部分)进入第一碰撞体,与第一碰撞体相关联的适合的音频支干被添加到低音音轨或从低音音轨移除。
-
公开(公告)号:CN102419631A
公开(公告)日:2012-04-18
申请号:CN201110328586.0
申请日:2011-10-17
Applicant: 微软公司
CPC classification number: G02B27/017 , G02B2027/0127 , G02B2027/014 , G06F3/005 , G06F3/012 , G06K9/00664 , G06T19/006
Abstract: 本发明涉及虚拟内容到现实内容中的融合。描述了一种包括头戴式显示设备和连接到该头戴式显示设备的处理单元的系统,该系统用于将虚拟内容融合到现实内容中。在一个实施例中,该处理单元与中枢计算设备通信。该系统:创建空间的体积模型;将该模型分割成物体;标识出所述物体中的包括第一物体的一个或多个物体;以及在(头戴式显示器的)显示器上将虚拟图像显示在第一物体之上,该显示器允许通过该显示器实际直接地查看该空间的至少一部分。
-
公开(公告)号:CN102413414A
公开(公告)日:2012-04-11
申请号:CN201110321276.6
申请日:2011-10-12
Applicant: 微软公司
IPC: H04S3/00
CPC classification number: H04S7/304 , A63F13/213 , A63F13/54 , A63F2300/1012 , A63F2300/6081 , H04R27/00 , H04R2227/003 , H04S7/301 , H04S2400/11 , H04S2420/01
Abstract: 本发明涉及用于扩展现实的高精度3维音频的系统和方法。提供了用于提供3D音频的技术,该3D音频可以用于扩展的现实。3D音频信号可以基于从听者所在的实际房间中所采集的传感器数据以及听者在该房间中的实际位置来生成。该3D音频信号可以包括基于所采集的传感器数据和听者的位置所确定的多个分量。例如,可以确定虚拟声音源与听者之间的多个(虚拟)声音路径。该传感器数据可以用于估计房间中的材料,使得可以确定这些材料在声音在沿着这些路径传播时可能对声音造成的影响。在一些实施例中,传感器数据可以用于收集听者的物理特性,使得可以从HRTF库中确定合适的HRTF。
-
公开(公告)号:CN102413414B
公开(公告)日:2015-03-25
申请号:CN201110321276.6
申请日:2011-10-12
Applicant: 微软公司
IPC: H04S3/00
CPC classification number: H04S7/304 , A63F13/213 , A63F13/54 , A63F2300/1012 , A63F2300/6081 , H04R27/00 , H04R2227/003 , H04S7/301 , H04S2400/11 , H04S2420/01
Abstract: 本发明涉及用于扩展现实的高精度3维音频的系统和方法。提供了用于提供3D音频的技术,该3D音频可以用于扩展的现实。3D音频信号可以基于从听者所在的实际房间中所采集的传感器数据以及听者在该房间中的实际姿态来生成。该3D音频信号可以包括基于所采集的传感器数据和听者的位置所确定的多个分量。例如,可以确定虚拟声音源与听者之间的多个(虚拟)声音路径。该传感器数据可以用于估计房间中的材料,使得可以确定这些材料在声音在沿着这些路径传播时可能对声音造成的影响。在一些实施例中,传感器数据可以用于收集听者的物理特性,使得可以从HRTF库中确定合适的HRTF。
-
公开(公告)号:CN102419631B
公开(公告)日:2015-02-25
申请号:CN201110328586.0
申请日:2011-10-17
Applicant: 微软公司
CPC classification number: G02B27/017 , G02B2027/0127 , G02B2027/014 , G06F3/005 , G06F3/012 , G06K9/00664 , G06T19/006
Abstract: 本发明涉及虚拟内容到现实内容中的融合。描述了一种包括头戴式显示设备和连接到该头戴式显示设备的处理单元的系统,该系统用于将虚拟内容融合到现实内容中。在一个实施例中,该处理单元与中枢计算设备通信。该系统:创建空间的体积模型;将该模型分割成物体;标识出所述物体中的包括第一物体的一个或多个物体;以及在(头戴式显示器的)显示器上将虚拟图像显示在第一物体之上,该显示器允许通过该显示器实际直接地查看该空间的至少一部分。
-
公开(公告)号:CN102136269B
公开(公告)日:2013-05-22
申请号:CN201110031166.6
申请日:2011-01-21
Applicant: 微软公司
CPC classification number: G10L15/24 , A63F2300/1081 , A63F2300/1087 , A63F2300/6072 , G06K9/0057 , G10L17/00 , G10L2015/228 , G10L2021/02166
Abstract: 本发明描述了一种经由标识信息的语音识别分析的方法和系统。所公开的各实施例涉及使用身份信息来帮助避免在语音识别系统中发生假肯定语音识别事件。一个实施例提供了一种方法,该方法包括接收语音识别数据,该语音识别数据包括所识别的语音段、经由来自麦克风阵列的信号所确定的与所识别的语音段的起源位置有关的声学位置数据、以及包括识别置信值的置信数据,并且还接收包括与图像中的每个人的位置有关的视觉位置信息的图像数据。将声学位置数据与视觉位置数据进行比较来确定所识别的语音段是否源自图像传感器的视场中的人,并且基于该确定来调整置信数据。
-
公开(公告)号:CN102571315B
公开(公告)日:2015-07-15
申请号:CN201110443126.2
申请日:2011-12-26
Applicant: 微软公司
IPC: H04L7/00
CPC classification number: G01S19/03 , A63F13/06 , A63F13/12 , A63F2300/10 , G01D21/00 , G01S5/0018 , G06F3/011 , G06F3/017 , G06F3/0304 , G06F3/038 , H04J3/0667 , H04W84/18
Abstract: 本发明涉及在设备的范围内同步传感器数据。在此提供用于在设备之间同步传感器信号的技术。这些设备中的一个或多个可以收集传感器数据。该设备可以从这些传感器数据中创建传感器信号,其中该设备可以按照发布者/订阅者模型使所述传感器信号对其他设备可用。所述其他设备可以订阅它们选择的传感器信号。设备可以是传感器信号的提供者或消费者。设备可以在操作系统与软件应用之间具有代码层,其中该代码层处理所述数据以用于所述应用。该处理可以尤其是包括诸如下列动作:将传感器信号中的数据同步到本地时间时钟;为传感器信号中的数据预测未来值;以及以应用所请求的频率提供传感器信号的数据采样。
-
公开(公告)号:CN102136269A
公开(公告)日:2011-07-27
申请号:CN201110031166.6
申请日:2011-01-21
Applicant: 微软公司
CPC classification number: G10L15/24 , A63F2300/1081 , A63F2300/1087 , A63F2300/6072 , G06K9/0057 , G10L17/00 , G10L2015/228 , G10L2021/02166
Abstract: 本发明描述了一种经由标识信息的语音识别分析的方法和系统。所公开的各实施例涉及使用身份信息来帮助避免在语音识别系统中发生假肯定语音识别事件。一个实施例提供了一种方法,该方法包括接收语音识别数据,该语音识别数据包括所识别的语音段、经由来自麦克风阵列的信号所确定的与所识别的语音段的起源位置有关的声学位置数据、以及包括识别置信值的置信数据,并且还接收包括与图像中的每个人的位置有关的视觉位置信息的图像数据。将声学位置数据与视觉位置数据进行比较来确定所识别的语音段是否源自图像传感器的视场中的人,并且基于该确定来调整置信数据。
-
-
-
-
-
-
-
-
-