-
公开(公告)号:CN105324811B
公开(公告)日:2021-06-11
申请号:CN201480026549.6
申请日:2014-05-09
Applicant: 微软技术许可有限责任公司
Abstract: 公开了涉及将来自环境的音频输入转换成文本的各实施例。例如,在一个公开的实施例中,语音转换程序接收来自头戴式显示设备的话筒阵列的音频输入。从环境中捕捉图像数据,并且从图像数据中检测一个或多个可能的脸。眼睛跟踪数据被用于确定用户聚焦于的目标脸。波束成形技术被应用于音频输入的至少一部分以标识与目标脸相关联的目标音频输入。这些目标音频输入被转换成通过头戴式显示设备的透明显示器来显示的文本。
-
公开(公告)号:CN105324811A
公开(公告)日:2016-02-10
申请号:CN201480026549.6
申请日:2014-05-09
Applicant: 微软技术许可有限责任公司
Abstract: 公开了涉及将来自环境的音频输入转换成文本的各实施例。例如,在一个公开的实施例中,语音转换程序接收来自头戴式显示设备的话筒阵列的音频输入。从环境中捕捉图像数据,并且从图像数据中检测一个或多个可能的脸。眼睛跟踪数据被用于确定用户聚焦于的目标脸。波束成形技术被应用于音频输入的至少一部分以标识与目标脸相关联的目标音频输入。这些目标音频输入被转换成通过头戴式显示设备的透明显示器来显示的文本。
-