-
公开(公告)号:CN109074501A
公开(公告)日:2018-12-21
申请号:CN201780027932.7
申请日:2017-04-27
Applicant: 微软技术许可有限责任公司
IPC: G06K9/62
Abstract: 一种分类系统,其对诸如面部、地标、事件等的输入图像流的内容的不同方面分类。分类系统包括通用分类器和至少一个专用分类器模板。通用分类器被训练为对内容的大量不同方面分类,并且专用分类器可以在分类系统的操作期间基于专用分类器模板而被训练以对内容的多个不同方面的特定子集分类。分类系统基于类偏斜来确定何时使用通用分类器以及何时使用专用分类器,类偏斜是指图像流中的内容的方面的子集的时间局部性。
-
公开(公告)号:CN108369631A
公开(公告)日:2018-08-03
申请号:CN201680050900.4
申请日:2016-08-31
Applicant: 微软技术许可有限责任公司
Inventor: N·A·B·普里延萨 , M·菲利珀斯 , 刘劼 , 张鹏宇
Abstract: 各方面涉及用于感测图像内的对象深度的方法、系统和计算机程序产品。通常,本发明的各方面实现的对象深度检测技术能够降低功率消耗。这样的功耗降低支持移动设备和可穿戴设备以及具有较少功率资源的其他设备检测并记录对象(例如人的特征)。例如,相机可以在会议中有效地检测会话伙伴或与会者(可以提供关于用户面前的人的相关实时提示)。作为另一个示例,人的手部的检测解决方案可以(通过跟随臂的方向)确定用户正指向的对象并提供其他的交互形态。本发明的各方面可以使用低功率深度传感器来识别并捕捉与感兴趣对象相对应的像素。
-
公开(公告)号:CN110192393A
公开(公告)日:2019-08-30
申请号:CN201780066717.8
申请日:2017-10-31
Applicant: 微软技术许可有限责任公司
IPC: H04N21/234 , G06F9/48 , G06F9/50 , H04N7/18
Abstract: 本文所描述的各种技术涉及执行视频分析。本文所阐述的方法支持具有近似和延迟容忍处理的大规模实时视频分析。视频流可以由多个相机捕获并且被连续地流式传输到视频分析计算系统;视频流可以在视频分析计算系统处被接收。多个视频分析查询可以对视频流来执行。在视频流被连续地流式传输到视频分析计算系统时,多个视频分析查询可以由视频分析计算系统对视频流并发执行。多个视频分析查询可以利用被分配在多个视频分析查询之间的视频分析计算系统的资源来执行。多个视频分析查询的执行可以返回针对多个视频分析查询的相应结果。针对多个视频分析查询的结果可以被输出。
-
公开(公告)号:CN108475283A
公开(公告)日:2018-08-31
申请号:CN201780004845.X
申请日:2017-02-03
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06F17/30784 , G06F17/3079 , G06K9/00718 , H04N21/23418 , H04N21/2665 , H04N21/84
Abstract: 文摘生成系统获取视频流并且包括准入控制模块,该准入控制模块为每个视频流选择要分析的视频流的帧的子集。帧到文本分类器为每个选择的帧生成文摘,并且生成的文摘以这样的方式被存储在文摘存储库中:使得每个文摘与从其生成文摘的视频流相关联。针对帧的文摘是描述帧的文本,诸如帧中标识的对象。期望观看具有特定特性的视频流的观看者将文本搜索查询输入到搜索系统。搜索系统基于文摘生成搜索结果,该搜索结果是满足搜索标准的视频流的指示。搜索结果被呈现给用户,允许用户选择和查看视频流中的一个。
-
公开(公告)号:CN109074501B
公开(公告)日:2022-03-11
申请号:CN201780027932.7
申请日:2017-04-27
Applicant: 微软技术许可有限责任公司
IPC: G06V10/70 , G06V20/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/08
Abstract: 一种分类系统,其对诸如面部、地标、事件等的输入图像流的内容的不同方面分类。分类系统包括通用分类器和至少一个专用分类器模板。通用分类器被训练为对内容的大量不同方面分类,并且专用分类器可以在分类系统的操作期间基于专用分类器模板而被训练以对内容的多个不同方面的特定子集分类。分类系统基于类偏斜来确定何时使用通用分类器以及何时使用专用分类器,类偏斜是指图像流中的内容的方面的子集的时间局部性。
-
公开(公告)号:CN107077598B
公开(公告)日:2020-10-27
申请号:CN201580048995.1
申请日:2015-09-09
Applicant: 微软技术许可有限责任公司
Abstract: 在尊重旁观者隐私的同时使用视频相机记录视频的方法包括:获取与视频分离的传感数据,针对在视频相机的视场中的人的证据解析传感数据,以及如果基于传感数据在视场中没有检测到人,则使用视频相机记录视频。
-
公开(公告)号:CN113841418B
公开(公告)日:2024-08-06
申请号:CN202080035817.6
申请日:2020-03-27
Applicant: 微软技术许可有限责任公司
IPC: H04N21/472 , H04N21/845 , H04N21/8549 , G06V20/40 , G11B27/10
Abstract: 本文中描述了一种用于从多个视频片段创建动态视频精彩场面的机制。元数据收集代理收集元数据,元数据包括关于视频的属性、视频内的一个或多个事件发生的片段、关于视频的创建者的属性等。元数据被收集并被用于创建包括元数据属性‑值对的集合的精彩场面视频定义。精彩场面视频定义可以通过呈现用户界面而以交互方式创建,用户界面允许选择属性‑值对的组合以从自定义片段的定义和/或手动选择包括/排除片段。可以在用户之间被存储和/或共享精彩场面视频定义。视频精彩场面定义被用于使一个或多个视频播放器实例化,以在不将视频片段组装成单独视频的情况下按所标识的顺序播放视频片段。
-
公开(公告)号:CN113841418A
公开(公告)日:2021-12-24
申请号:CN202080035817.6
申请日:2020-03-27
Applicant: 微软技术许可有限责任公司
IPC: H04N21/472 , H04N21/845 , H04N21/8549 , G06K9/00 , G11B27/10
Abstract: 本文中描述了一种用于从多个视频片段创建动态视频精彩场面的机制。元数据收集代理收集元数据,元数据包括关于视频的属性、视频内的一个或多个事件发生的片段、关于视频的创建者的属性等。元数据被收集并被用于创建包括元数据属性‑值对的集合的精彩场面视频定义。精彩场面视频定义可以通过呈现用户界面而以交互方式创建,用户界面允许选择属性‑值对的组合以从自定义片段的定义和/或手动选择包括/排除片段。可以在用户之间被存储和/或共享精彩场面视频定义。视频精彩场面定义被用于使一个或多个视频播放器实例化,以在不将视频片段组装成单独视频的情况下按所标识的顺序播放视频片段。
-
公开(公告)号:CN110192393B
公开(公告)日:2021-09-03
申请号:CN201780066717.8
申请日:2017-10-31
Applicant: 微软技术许可有限责任公司
IPC: H04N21/234 , G06F9/48 , G06F9/50 , H04N7/18
Abstract: 本文所描述的各种技术涉及执行视频分析。本文所阐述的方法支持具有近似和延迟容忍处理的大规模实时视频分析。视频流可以由多个相机捕获并且被连续地流式传输到视频分析计算系统;视频流可以在视频分析计算系统处被接收。多个视频分析查询可以对视频流来执行。在视频流被连续地流式传输到视频分析计算系统时,多个视频分析查询可以由视频分析计算系统对视频流并发执行。多个视频分析查询可以利用被分配在多个视频分析查询之间的视频分析计算系统的资源来执行。多个视频分析查询的执行可以返回针对多个视频分析查询的相应结果。针对多个视频分析查询的结果可以被输出。
-
公开(公告)号:CN107924395A
公开(公告)日:2018-04-17
申请号:CN201680049017.3
申请日:2016-07-27
Applicant: 微软技术许可有限责任公司
IPC: G06F17/28
CPC classification number: G06F17/289 , G06F17/2836 , G10L13/00 , G10L15/24 , G10L15/30 , G10L15/32
Abstract: 这里描述的个人翻译器实现方式提供与计算设备配对以翻译当场对话的话音翻译设备。话音翻译设备可以是可穿戴的。在一个实现方式中,个人翻译器包括话音翻译设备,话音翻译设备具有:至少一个麦克风,其捕获表示在按照两种语言的对话中的、设备的第一用户/穿戴者和至少一个其他附近人的附近话音的输入信号;无线通信单元,其向附近计算设备发送表示话音的捕获的输入信号,并且对于对话中的每种语言从计算设备接收语言翻译;以及至少一个扬声器,其向第一用户/穿戴者和至少一个其他附近人输出语言翻译。可以在向扬声器输出语言翻译的同时在显示器上显示按照文本形式的语言翻译。
-
-
-
-
-
-
-
-
-